M枚chten Sie Ihr Wissen 眉ber die Big Data-Landschaft erweitern? Dieser Kurs richtet sich an diejenigen, die neu in der Datenwissenschaft sind und verstehen m枚chten, warum es das Zeitalter von Big Data gibt. Er richtet sich an diejenigen, die sich mit der Terminologie und den Kernkonzepten hinter Big-Data-Problemen, -Anwendungen und -Systemen vertraut machen wollen. Es richtet sich an diejenigen, die dar眉ber nachdenken wollen, wie Big Data 蹿眉谤 ihr Unternehmen oder ihre Karriere n眉tzlich sein k枚nnte. Er bietet eine Einf眉hrung in eines der am weitesten verbreiteten Frameworks, Hadoop, das die Analyse von Big Data vereinfacht und zug盲nglicher gemacht hat - und damit das Potenzial von Daten, unsere Welt zu ver盲ndern, erh枚ht! Am Ende dieses Kurses werden Sie in der Lage sein: * die Big-Data-Landschaft zu beschreiben, einschlie脽lich Beispielen von Big-Data-Problemen aus der realen Welt, einschlie脽lich der drei Hauptquellen von Big Data: Menschen, Organisationen und Sensoren.
* Die V's von Big Data (Volume, Velocity, Variety, Veracity, Valence und Value) zu erkl盲ren und zu erl盲utern, warum jedes dieser V's die Datenerfassung, -眉berwachung, -speicherung, -analyse und -berichterstattung beeinflusst * einen Mehrwert aus Big Data zu ziehen, indem Sie einen 5-stufigen Prozess zur Strukturierung Ihrer Analyse verwenden.
* Erkennen Sie, was Big-Data-Probleme sind und was nicht, und k枚nnen Sie Big-Data-Probleme in datenwissenschaftliche Fragen umwandeln. * Erkl盲ren Sie die architektonischen Komponenten und Programmiermodelle, die 蹿眉谤 skalierbare Big-Data-Analysen verwendet werden. * Fassen Sie die Funktionen und den Wert der Kernkomponenten des Hadoop-Stacks zusammen, einschlie脽lich des Ressourcen- und Jobmanagementsystems YARN, des Dateisystems HDFS und des MapReduce-Programmiermodells. * Installieren Sie ein Programm mit Hadoop und f眉hren Sie es aus! Dieser Kurs richtet sich an Einsteiger in die Datenwissenschaft. Es sind keine vorherigen Programmiererfahrungen erforderlich, aber die F盲higkeit, Anwendungen zu installieren und eine virtuelle Maschine zu verwenden, ist notwendig, um die praktischen Aufgaben zu erledigen.
Hardware-Anforderungen: (A) Quad-Core-Prozessor (VT-x- oder AMD-V-Unterst眉tzung empfohlen), 64-Bit; (B) 8 GB RAM; (C) 20 GB freier Speicherplatz. So finden Sie Ihre Hardware-Informationen: (Windows): 脰ffnen Sie System, indem Sie auf die Schaltfl盲che Start klicken, mit der rechten Maustaste auf Computer klicken und dann auf Eigenschaften klicken; (Mac): 脰ffnen Sie die 脺bersicht, indem Sie auf das Apple-Men眉 und dann auf "脺ber diesen Mac" klicken Die meisten Computer mit 8 GB RAM, die in den letzten 3 Jahren gekauft wurden, erf眉llen die Mindestanforderungen. Sie ben枚tigen eine Hochgeschwindigkeits-Internetverbindung, da Sie Dateien mit einer Gr枚脽e von bis zu 4 GB herunterladen werden.
Softwareanforderungen: Dieser Kurs basiert auf mehreren Open-Source-Softwaretools, darunter Apache Hadoop. Die gesamte erforderliche Software kann kostenlos heruntergeladen und installiert werden. Zu den Softwareanforderungen geh枚ren: Windows 7+, Mac OS X 10.10+, Ubuntu 14.04+ oder CentOS 6+ VirtualBox 5+.