Dieser Workshop zeigt nach einem Einführungsvortrag über die Grundzüge von Big Data wichtige populäre Technologien wie unter anderem Hadoop, Hive, Avro, Spark, Kafka, Power BI und Machine Learning in einer nachvollziehbaren Live-Demo. Anhand eines konkreten Szenarios wird gezeigt, welche Aufgaben die verschiedenen Technologien haben und wie das Zusammenspiel praktisch funktioniert.
Die Themen im Überblick:
- Grundzüge Big Data
- HDFS als hochverfügbares Filesystem und Ressourcenplanung
- Datenbeschreibung mit Avro
- Import relationaler Daten mit Sqoop
- Hive als SQL-Sicht
- Kafka zur Streamverarbeitung
- Spark zur Datentransformation
- Power BI zur Datenvisualisierung
- Spark ML für Machine Learning
- Jupyter Notebook für Data Science
Sie haben auch Interesse? Wir bieten den Workshop auch als Inhouse Veranstaltung in Ihrem Unternehmen an. Kontaktieren Sie uns gerne dazu.