Вы находитесь на странице: 1из 9

Запустил docker-compose up

Docker ps
Поместили датасет test.csv из задачи с титаником на kaggle
https://www.kaggle.com/c/titanic/data
Содержимое

Структура
Запустил mapreduce вот отсюда:

https://stackoverflow.com/questions/43747834/split-a-file-into-no-of-small-files-in-
hdfs
И разбил файл на 5 частей. По 100 строк в каждой.

Хадуп поднят и работает нормально