Open AlanneSoares opened 2 months ago
Esse video abaixo também é bem legal: https://www.youtube.com/watch?v=knAS0w-jiUk
Vou deixar aqui também as portas usadas:
Perfeito também @Darly-Goncalves-21 esse tinha visto e acabei perdendo o link.
Agora sim consegui rodar... \o/
Segui esse tutorial Tutorial de instalação em ambiente local (texto e imagens)
Anotações para subir o Hadoop:
C:\Hadoop\sbin>start-dfs.cmd C:\Hadoop\sbin>start-yarn.cmd
hdfs dfs -mkdir /Darly/Hadoop/input hdfs dfs -put C:\Users\Darly\Desktop\big-data\CrimesOnWomenData.csv /darly/Hadoop/input/
Até que enfim vi na tela, puxando de um dataset que está no hdfs.
Começando a ficar melhor!
@Darly-Goncalves-21 subi algumas atualizações!!!
Referência:
Spark: Tutorial de instalação em ambiente local
Hadoop: Tutorial de instalação em ambiente local (texto e imagens)
Tutorial de instalação em ambiente local (vídeo em inglês)
Tutorial de instalação em ambiente local por sequência (vídeo em inglês)
Tutorial de configuração do PySpark na IDE PyCharm (vídeo em inglês)