Kostenlose Online-Bildung

Data Science: Wrangeln

Beschreibung

In diesem Kurs, der Teil unseres Professional Certificate Program in Data Science ist, werden verschiedene Standardschritte des Data Wrangling-Prozesses behandelt, z. B. das Importieren von Daten in R, das Aufräumen von Daten, die Verarbeitung von Zeichenfolgen, das Parsen von HTML, das Arbeiten mit Datums- und Uhrzeitangaben sowie das Text Mining. Selten sind all diese Streitschritte in einer einzigen Analyse notwendig, aber ein Datenwissenschaftler wird sie wahrscheinlich irgendwann alle sehen. Sehr selten sind Daten in einem datenwissenschaftlichen Projekt leicht zugänglich. Es ist wahrscheinlicher, dass sich die Daten in einer Datei oder Datenbank befinden oder aus Dokumenten wie Webseiten, Tweets oder PDFs extrahiert werden. In diesen Fällen besteht der erste Schritt darin, die Daten in R zu importieren und die Daten mithilfe des Pakets tidyverse aufzuräumen. Die Schritte, mit denen Daten von ihrer Rohform in die ordentliche Form konvertiert werden, werden als Daten-Wrangling bezeichnet. Dieser Prozess ist ein kritischer Schritt für jeden Datenwissenschaftler. Wenn Sie wissen, wie Sie Daten verarbeiten und bereinigen, können Sie wichtige Erkenntnisse gewinnen, die sonst verborgen wären.

Preis: Kostenlose Prüfung!

Data Science: Wrangling durch edX, eine von Harvard und MIT gegründete Bildungsplattform.

Data Science: Wrangeln -