Fallstudien: 脛丑苍濒颈肠丑e Dokumente finden Ein Leser ist an einem bestimmten Nachrichtenartikel interessiert und Sie m枚chten 盲hnliche Artikel finden, die Sie empfehlen k枚nnen. Was ist der richtige Begriff von 脛丑苍濒颈肠丑keit? Und was ist, wenn es Millionen von anderen Dokumenten gibt? M眉ssen Sie jedes Mal, wenn Sie ein neues Dokument abrufen wollen, alle anderen Dokumente durchsuchen? Wie k枚nnen Sie 盲hnliche Dokumente zusammenfassen? Wie entdecken Sie neue, aufkommende Themen, die in den Dokumenten behandelt werden?

Morgen endet die Aktion: Entdecken Sie neue F盲higkeiten mit 30% Rabatt auf Kurse von Branchenexperten. Jetzt sparen.


Maschinelles Lernen: Clustering & Wiederauffinden
Dieser Kurs ist Teil von Spezialisierung 蹿眉谤 Maschinelles Lernen


Dozenten: Emily Fox
100.419 bereits angemeldet
Bei enthalten
(2,364听叠别飞别谤迟耻苍驳别苍)
Kompetenzen, die Sie erwerben
- Kategorie: Wahrscheinlichkeitsverteilung
- Kategorie: Big Data
- Kategorie: Unstrukturierte Daten
- Kategorie: Text Mining
- Kategorie: Statistische Inferenz
- Kategorie: Maschinelles Lernen
- Kategorie: Data-Mining
- Kategorie: Statistisches maschinelles Lernen
- Kategorie: Algorithmen
- Kategorie: Skalierbarkeit
- Kategorie: Angewandtes maschinelles Lernen
- Kategorie: Algorithmen 蹿眉谤 maschinelles Lernen
- Kategorie: Stichproben (Statistik)
- Kategorie: Statistische Modellierung
- Kategorie: Un眉berwachtes Lernen
- Kategorie: Bayessche Statistik
Wichtige Details

Zu Ihrem LinkedIn-Profil hinzuf眉gen
15 Aufgaben
Erfahren Sie, wie Mitarbeiter f眉hrender Unternehmen gefragte Kompetenzen erwerben.

Erweitern Sie Ihre Fachkenntnisse
- Lernen Sie neue Konzepte von Branchenexperten
- Gewinnen Sie ein Grundverst盲ndnis bestimmter Themen oder Tools
- Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
- Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 6 Module
Clustering und Retrieval geh枚ren zu den wirkungsvollsten Tools 蹿眉谤 maschinelles Lernen, die es gibt. Die Suche wird in fast allen Anwendungen und Ger盲ten verwendet, mit denen wir interagieren, z. B. bei der Bereitstellung einer Reihe von Produkten, die mit einem Produkt verwandt sind, das ein Kunde gerade in Erw盲gung zieht, oder einer Liste von Personen, mit denen Sie sich auf einer Social Media-Plattform verbinden m枚chten. Clustering kann zur Unterst眉tzung des Retrievals verwendet werden, ist aber auch ein n眉tzliches Werkzeug zur automatischen Erkennung von Strukturen in Daten, z.B. zur Aufdeckung von Gruppen 盲hnlicher Patienten.<p>Diese Einf眉hrung in den Kurs gibt Ihnen einen 脺berblick 眉ber die Themen, die wir behandeln werden, sowie 眉ber das Hintergrundwissen und die Ressourcen, die wir bei Ihnen voraussetzen.
Das ist alles enthalten
4 Videos5 Lekt眉ren
Zu Beginn des Kurses betrachten wir eine Suchaufgabe, bei der es darum geht, ein Dokument zu finden, das einem Dokument 盲hnlich ist, das jemand gerade liest. Wir betrachten dieses Problem als eine Suche nach dem n盲chsten Nachbarn, ein Konzept, das wir bereits in den Kursen Grundlagen und Regression kennengelernt haben. In diesem Kurs werden Sie jedoch zwei entscheidende Komponenten der Algorithmen genauer unter die Lupe nehmen: die Datendarstellung und die Metrik zur Messung der 脛丑苍濒颈肠丑keit zwischen Datenpunktpaaren. Sie werden den Rechenaufwand des naiven Algorithmus 蹿眉谤 die Suche nach dem n盲chsten Nachbarn untersuchen und stattdessen skalierbare Alternativen implementieren, die 碍顿-叠盲耻尘别 蹿眉谤 die Verarbeitung gro脽er Datens盲tze und ortsabh盲ngiges Hashing (LSH) 蹿眉谤 die Bereitstellung ann盲hernder n盲chster Nachbarn selbst in hochdimensionalen R盲umen verwenden. Sie werden all diese Ideen anhand eines Wikipedia-Datensatzes untersuchen und die Auswirkungen der verschiedenen Optionen auf die Ergebnisse der n盲chsten Nachbarn vergleichen und gegen眉berstellen.
Das ist alles enthalten
22 Videos4 Lekt眉ren5 Aufgaben
Beim Clustering besteht unser Ziel darin, die Datenpunkte in unserem Datensatz in disjunkte Gruppen einzuteilen. Motiviert durch unsere Fallstudie zur Dokumentenanalyse werden Sie Clustering verwenden, um thematische Gruppen von Artikeln nach "Themen" zu entdecken. Diese Themen werden in dieser un眉berwachten Lernaufgabe nicht vorgegeben. Die Idee ist vielmehr, solche Cluster-Labels auszugeben, die postfaktisch mit bekannten Themen wie "Wissenschaft", "Weltnachrichten" usw. assoziiert werden k枚nnen. Auch ohne solche Post-Facto-Labels werden Sie untersuchen, wie die Clustering-Ausgabe Einblicke in die Beziehungen zwischen den Datenpunkten im Datensatz geben kann. Der erste Clustering-Algorithmus, den Sie implementieren werden, ist k-means, der am weitesten verbreitete Clustering-Algorithmus, den es gibt. Um k-means zu skalieren, lernen Sie das allgemeine MapReduce-Framework 蹿眉谤 die Parallelisierung und Verteilung von Berechnungen kennen und erfahren dann, wie die Iterate von k-means dieses Framework nutzen k枚nnen. Sie werden zeigen, dass k-means eine interpretierbare Gruppierung von Wikipedia-Artikeln liefern kann, wenn es richtig eingestellt ist.
Das ist alles enthalten
13 Videos2 Lekt眉ren3 Aufgaben
Bei k-means werden die Beobachtungen jeweils einem einzigen Cluster fest zugeordnet, und diese Zuordnungen basieren nur auf den Clusterzentren, anstatt auch die Forminformationen zu ber眉cksichtigen. In unserem zweiten Modul zum Thema Clustering werden Sie probabilistisches, modellbasiertes Clustering durchf眉hren, das (1) einen anschaulicheren Begriff von "Cluster" bietet und (2) die Unsicherheit bei der Zuordnung von Datenpunkten zu Clustern durch "weiche Zuordnungen" ber眉cksichtigt. Sie werden einen weithin n眉tzlichen Algorithmus namens Erwartungsmaximierung (EM) erforschen und implementieren, um diese weichen Zuordnungen sowie die Modellparameter abzuleiten. Um ein Gef眉hl da蹿眉谤 zu bekommen, werden Sie zun盲chst eine visuell ansprechende Aufgabe zum Clustering von Bildern betrachten. Anschlie脽end werden Sie Wikipedia-Artikel clustern, wobei Sie die hohe Dimensionalit盲t der tf-idf-Dokumentendarstellung ber眉cksichtigen werden.
Das ist alles enthalten
15 Videos4 Lekt眉ren3 Aufgaben
Das Clustering-Modell geht von der Annahme aus, dass die Daten in disjunkte Gruppen unterteilt sind, z.B. Dokumente nach Thema. Oft werden unsere Datenobjekte jedoch besser durch die Zugeh枚rigkeit zu einer Sammlung von Mengen, z.B. mehreren Themen, beschrieben. In unserem vierten Modul werden Sie die latente Dirichlet-Zuordnung (LDA) als Beispiel 蹿眉谤 ein solches gemischtes Zugeh枚rigkeitsmodell kennenlernen, das besonders bei der Dokumentenanalyse n眉tzlich ist. Sie werden die Ergebnisse der LDA interpretieren und verschiedene M枚glichkeiten kennenlernen, wie diese Ergebnisse genutzt werden k枚nnen, z.B. als eine Reihe von gelernten Dokumentenmerkmalen. Die Ideen zur Modellierung gemischter Zugeh枚rigkeit, die Sie durch LDA 蹿眉谤 die Dokumentenanalyse kennenlernen, lassen sich auf viele andere interessante Modelle und Anwendungen 眉bertragen, wie z.B. Modelle sozialer Netzwerke, in denen Personen mehrere Zugeh枚rigkeiten haben.<p>In diesem Modul werden Aspekte der Bayes'schen Modellierung und ein Bayes'scher Inferenzalgorithmus namens Gibbs Sampling vorgestellt. Am Ende des Moduls werden Sie in der Lage sein, einen Gibbs-Sampler 蹿眉谤 LDA zu implementieren.
Das ist alles enthalten
12 Videos2 Lekt眉ren3 Aufgaben
Am Ende des Kurses fassen wir zusammen, was wir behandelt haben. Dabei handelt es sich sowohl um Techniken, die speziell 蹿眉谤 Clustering und Retrieval geeignet sind, als auch um grundlegende Konzepte des maschinellen Lernens, die im weiteren Sinne n眉tzlich sind.<p>Wir geben einen kurzen Einblick in einen alternativen Clustering-Ansatz, das hierarchische Clustering, mit dem Sie anhand des Wikipedia-Datensatzes experimentieren werden. Im Anschluss an diese Erkundung er枚rtern wir, wie Clustering-盲hnliche Ideen in anderen Bereichen wie der Segmentierung von Zeitreihen angewendet werden k枚nnen. Anschlie脽end gehen wir kurz auf einige wichtige Clustering- und Retrieval-Ideen ein, die wir in diesem Kurs nicht behandelt haben.<p> Zum Abschluss geben wir Ihnen einen 脺berblick dar眉ber, was Sie im weiteren Verlauf der Spezialisierung erwartet.
Das ist alles enthalten
12 Videos2 Lekt眉ren1 Aufgabe
Erwerben Sie ein Karrierezertifikat.
F眉gen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.
Dozenten


Mehr von Datenanalyse entdecken
- Status: Kostenloser Testzeitraum
University of Colorado Boulder
- Status: Kostenloser Testzeitraum
University of Illinois Urbana-Champaign
Warum entscheiden sich Menschen 蹿眉谤 糖心vlog官网观看 蹿眉谤 ihre Karriere?




Bewertungen von Lernenden
2.364 Bewertungen
- 5 stars
74,36听%
- 4 stars
19,16听%
- 3 stars
4,69听%
- 2 stars
0,76听%
- 1 star
1,01听%
Zeigt 3 von 2364 an
Gepr眉ft am 30. Okt. 2016
I really learn a lot in this course, although the materials are very difficult at first read, but Emily's explanation were clear and I would be able to get the idea after a few review.
Gepr眉ft am 16. Dez. 2019
Excellent course. I liked the material and the assignments are great to consolidate the learning. I really liked the recap videos to solidify even more what I learned.
Gepr眉ft am 12. Feb. 2020
Excellent Course. This course provides in depth understanding of what's going in the background when an algorithm runs and how we can tune it for our purpose.

Neue Karrierem枚glichkeiten mit 糖心vlog官网观看 Plus
Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universit盲ten 鈥 100聽% online
Schlie脽en Sie sich mehr als 3.400聽Unternehmen in aller Welt an, die sich 蹿眉谤 糖心vlog官网观看 for Business entschieden haben.
Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.
H盲ufig gestellte Fragen
Um Zugang zu den Kursmaterialien und Aufgaben zu erhalten und um ein Zertifikat zu erwerben, m眉ssen Sie die Zertifikatserfahrung erwerben, wenn Sie sich 蹿眉谤 einen Kurs anmelden. Sie k枚nnen stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterst眉tzung beantragen. Der Kurs kann stattdessen die Option "Vollst盲ndiger Kurs, kein Zertifikat" anbieten. Mit dieser Option k枚nnen Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben k枚nnen.
Wenn Sie sich 蹿眉谤 den Kurs einschreiben, erhalten Sie Zugang zu allen Kursen der Spezialisierung, und Sie erhalten ein Zertifikat, wenn Sie die Arbeit abgeschlossen haben. Ihr elektronisches Zertifikat wird Ihrer Seite "Leistungen" hinzugef眉gt - von dort aus k枚nnen Sie Ihr Zertifikat ausdrucken oder Ihrem LinkedIn-Profil hinzuf眉gen.
Wenn Sie ein Abonnement abgeschlossen haben, erhalten Sie eine kostenlose 7-t盲gige Testphase, in der Sie kostenlos k眉ndigen k枚nnen. Danach gew盲hren wir keine R眉ckerstattung, aber Sie k枚nnen Ihr Abonnement jederzeit k眉ndigen. Siehe unsere vollst盲ndigen R眉ckerstattungsbedingungen.
Weitere Fragen
Finanzielle Unterst眉tzung verf眉gbar,