Universität von Kalifornien San Diego Kostenlose Online-Bildung

Einführung in Big Data

Beschreibung

Möchten Sie Ihr Wissen über die Big-Data-Landschaft erweitern? Dieser Kurs richtet sich an diejenigen, die neu in der Datenwissenschaft sind und daran interessiert sind, zu verstehen, warum das Big-Data-Zeitalter gekommen ist. Es ist für diejenigen gedacht, die sich mit der Terminologie und den Kernkonzepten hinter Big-Data-Problemen, -Anwendungen und -Systemen vertraut machen möchten. Es ist für diejenigen gedacht, die darüber nachdenken möchten, wie Big Data in ihrem Geschäft oder ihrer Karriere nützlich sein könnte. Es bietet eine Einführung in eines der am weitesten verbreiteten Frameworks, Hadoop, das die Big-Data-Analyse einfacher und zugänglicher gemacht hat – und das Potenzial für Daten erhöht, unsere Welt zu verändern!

Am Ende dieses Kurses können Sie:

* Beschreiben Sie die Big-Data-Landschaft, einschließlich Beispielen für reale Big-Data-Probleme, einschließlich der drei Hauptquellen von Big Data: Menschen, Organisationen und Sensoren.

* Erklären Sie die Vs von Big Data (Volumen, Geschwindigkeit, Vielfalt, Richtigkeit, Wertigkeit und Wert) und warum sie sich auf die Datenerfassung, -überwachung, -speicherung, -analyse und -berichterstattung auswirken.

* Holen Sie Wert aus Big Data, indem Sie einen 5-Schritte-Prozess verwenden, um Ihre Analyse zu strukturieren.

* Identifizieren Sie, was Big-Data-Probleme sind und was nicht, und in der Lage sein, Big-Data-Probleme als datenwissenschaftliche Fragen neu zu formulieren.

* Geben Sie eine Erläuterung der Architekturkomponenten und Programmiermodelle, die für die skalierbare Big-Data-Analyse verwendet werden.

* Fassen Sie die Funktionen und den Wert der Kernkomponenten des Hadoop-Stacks zusammen, einschließlich des YARN-Ressourcen- und Jobverwaltungssystems, des HDFS-Dateisystems und des MapReduce-Programmiermodells.

* Installieren und führen Sie ein Programm mit Hadoop aus!

Dieser Kurs richtet sich an Neueinsteiger in die Datenwissenschaft. Es sind keine Programmierkenntnisse erforderlich, obwohl die Fähigkeit, Anwendungen zu installieren und eine virtuelle Maschine zu verwenden, erforderlich ist, um die praktischen Aufgaben abzuschließen.

Hardware-Anforderungen:
(A) Quad-Core-Prozessor (VT-x- oder AMD-V-Unterstützung empfohlen), 64-Bit; (B) 8 GB RAM; (C) 20 GB Festplatte frei. So finden Sie Ihre Hardwareinformationen: (Windows): Öffnen Sie das System, indem Sie auf die Schaltfläche Start klicken, mit der rechten Maustaste auf Computer klicken und dann auf Eigenschaften klicken. (Mac): Öffnen Sie die Übersicht, indem Sie auf das Apple-Menü und dann auf "Über diesen Mac" klicken. Die meisten Computer mit 8 GB RAM, die in den letzten 3 Jahren gekauft wurden, erfüllen die Mindestanforderungen. Sie benötigen eine Hochgeschwindigkeits-Internetverbindung, da Sie Dateien mit einer Größe von bis zu 4 GB herunterladen.

Softwareanforderungen:
Dieser Kurs stützt sich auf mehrere Open-Source-Softwaretools, einschließlich Apache Hadoop. Alle erforderliche Software kann kostenlos heruntergeladen und installiert werden. Zu den Softwareanforderungen gehören: Windows 7+, Mac OS X 10.10+, Ubuntu 14.04+ oder CentOS 6+ VirtualBox 5+.

Preis: Kostenlos anmelden!

Sprache: Englisch

Untertitel: Arabisch, Koreanisch, Englisch, Hindi, Persisch

Einführung in Big Data - Universität von Kalifornien San Diego