In diesem IBM Kurs zum Selbststudium lernen Sie alles 眉ber Big Data! Sie werden mit den Merkmalen von Big Data und deren Anwendung in der Big Data-Analyse vertraut gemacht. Sie werden auch praktische Erfahrungen mit Big Data-Verarbeitungstools wie Apache Hadoop und Apache Spark sammeln.
Bernard Marr definiert Big Data als die digitalen Spuren, die wir in diesem digitalen Zeitalter erzeugen. Zu Beginn des Kurses werden Sie verstehen, was Big Data ist und wie die Erkenntnisse aus Big Data 蹿眉谤 eine Vielzahl von Anwendungsf盲llen genutzt werden k枚nnen. Sie werden auch untersuchen, wie Big Data Technologien wie Parallelverarbeitung, Skalierung und Datenparallelit盲t nutzt. Als n盲chstes lernen Sie Hadoop kennen, ein Open-Source-Framework, das die verteilte Verarbeitung gro脽er Datenmengen erm枚glicht, und sein 脰kosystem. Sie werden wichtige Anwendungen kennenlernen, die mit Hadoop Hand in Hand gehen, wie das Distributed File System (HDFS), MapReduce und HBase. Sie werden mit Hive vertraut gemacht, einer Data Warehouse-Software, die eine SQL-盲hnliche Schnittstelle zur effizienten Abfrage und Bearbeitung gro脽er Datens盲tze bietet. Anschlie脽end erhalten Sie einen Einblick in Apache Spark, eine Open-Source-Verarbeitungs-Engine, die Anwendern neue M枚glichkeiten zur Speicherung und Nutzung von Big Data bietet. In diesem Kurs erfahren Sie, wie Sie Spark nutzen k枚nnen, um zuverl盲ssige Erkenntnisse zu gewinnen. Der Kurs bietet einen 脺berblick 眉ber die Plattform und geht auf die Komponenten ein, aus denen Apache Spark besteht. Sie lernen DataFrames kennen und f眉hren grundlegende DataFrame-Operationen durch und arbeiten mit SparkSQL. Sie erfahren, wie Spark die von Ihrer Anwendung gestellten Anfragen verarbeitet und 眉berwacht und wie Sie die Arbeit mit der Spark Application UI verfolgen k枚nnen. Dieser Kurs enth盲lt mehrere praktische 脺bungen, die Ihnen helfen, die erlernten Konzepte anzuwenden und zu 眉ben. Sie werden Hadoop- und Spark-脺bungen mit verschiedenen Tools und Technologien durchf眉hren, darunter Docker, Kubernetes, Python und Jupyter Notebooks.