Im ersten Schritt setzen wir ein HDFS-Cluster auf. In weiterführenden Blogartikeln werden wir dieses Cluster um andere Komponenten des Hadoop-Ökosystems schrittweise erweitern.
Wir setzen docker-compose ein, um ein Container-Cluster aufzusetzen. Du benötigst also folgende Werkzeuge, um unser Beispiel auszuführen:
- git, um dir die Quellen und Skripte von unserem öffentlichen Repository zu holen
- docker und docker-compose, um das Cluster zu starten
- falls docker noch nicht installiert ist, so findest du die Anleitungen unter https://docs.docker.com/get-docker/
Wir haben für Dich alles vorbereitet. Du musst grundlegende Kenntnisse in Git und Docker mitbringen und schon kann es losgehen.
Los gehts
Im GitHub-Repository finden sich die Skripte für unser kleines Beispiel. Wir gehen Schritt für Schritt durch das Beispiel.