Kostenlose Online-Bildung an der University of Illinois in Urbana-Champaign

Data Mining-Projekt

Beschreibung

Hinweis: Sie sollten alle anderen Kurse in dieser Spezialisierung absolvieren, bevor Sie mit diesem Kurs beginnen.

In diesem sechswöchigen Projektkurs der Data Mining-Spezialisierung können Sie die erlernten Algorithmen und Techniken für das Data Mining aus den vorherigen Kursen der Spezialisierung anwenden, einschließlich Mustererkennung, Clustering, Textabruf, Text Mining und Visualisierung, um sie zu lösen interessante reale Data Mining-Herausforderungen. Insbesondere arbeiten Sie an einem Restaurant-Überprüfungsdatensatz von Yelp und verwenden alle Kenntnisse und Fähigkeiten, die Sie in den vorherigen Kursen gelernt haben, um diesen Datensatz abzubauen und interessante und nützliche Kenntnisse zu entdecken. Das Design des Projekts betont: 1) Simulation des Workflows eines Data Miners in einer realen Jobumgebung; 2) Integration verschiedener Bergbautechniken, die in mehreren Einzelkursen behandelt werden; 3) Experimentieren Sie mit verschiedenen Methoden, um ein Problem zu lösen und Ihr Verständnis für Techniken zu vertiefen. und 4) Ihnen ermöglichen, Ihre eigenen Ideen kreativ vorzuschlagen und zu erkunden.

Ziel des Projekts ist es, einen großen Yelp-Überprüfungsdatensatz zu analysieren und abzubauen, um nützliches Wissen zu entdecken, das den Menschen hilft, Entscheidungen beim Essen zu treffen. Das Projekt wird die folgenden Ausgaben enthalten:

1. Meinungsvisualisierung: Untersuchen und visualisieren Sie den Bewertungsinhalt, um zu verstehen, was die Leute in diesen Bewertungen gesagt haben.
2. Erstellung einer Küchenkarte: Minen Sie den Datensatz, um die Landschaft verschiedener Arten von Küchen und ihre Ähnlichkeiten zu verstehen.
3. Entdeckung beliebter Gerichte für eine Küche: Durchsuchen Sie den Datensatz, um die gängigen / beliebten Gerichte einer bestimmten Küche zu ermitteln.
4. Empfehlung von Restaurants, um Menschen bei der Entscheidung zu helfen, wo sie essen möchten: Durchsuchen Sie den Datensatz, um Restaurants für ein bestimmtes Gericht einzustufen und den Hygienezustand eines Restaurants vorherzusagen.

Aus der Sicht der Benutzer kann eine Küchenkarte ihnen helfen, zu verstehen, welche Küchen es gibt, und das Gesamtbild aller Arten von Küchen und ihrer Beziehungen zu sehen. Sobald sie sich für eine Küche entschieden haben, möchten sie wissen, was die beliebtesten Gerichte dieser Küche sind und welche Gerichte sie zu sich nehmen möchten. Schließlich müssen sie ein Restaurant auswählen. Daher wäre es nützlich, Restaurants zu empfehlen, die auf einem bestimmten Gericht basieren. Darüber hinaus wäre es hilfreich, den Hygienezustand eines Restaurants vorherzusagen.

Wenn Sie an diesen Aufgaben arbeiten, sammeln Sie Erfahrung mit einem typischen Workflow im Data Mining, der Datenvorverarbeitung, Datenexploration, Datenanalyse, Verbesserung der Analysemethoden und Präsentation der Ergebnisse umfasst. Sie haben die Möglichkeit, mehrere Algorithmen aus verschiedenen Kursen zu kombinieren, um eine relativ komplizierte Mining-Aufgabe zu erledigen, und mit verschiedenen Methoden zur Lösung eines Problems zu experimentieren, um zu verstehen, wie es am besten gelöst werden kann. Wir werden spezifische Ansätze vorschlagen, aber Sie werden dringend aufgefordert, Ihre eigenen Ideen zu erforschen, da die offene Erforschung von Natur aus ein Ziel des Projekts ist.

Sie müssen einen kurzen Bericht für jede der Aufgaben für die Peer-Bewertung einreichen. Ein konsolidierter Abschlussbericht ist ebenfalls erforderlich, der von Fachleuten bewertet wird.

Preis: Kostenlos anmelden!

Sprache: Englisch

Untertitel: Englisch, Koreanisch

Data Mining-Projekt - Universität von Illinois in Urbana-Champaign