AlanneSoares / spark-big-data

0 stars 0 forks source link

Configurar ambiente utilizando WSL 2 (Windows Subsystem for Linux) Ubuntu ou Windows e instalar o Spark e Hadoop #2

Open AlanneSoares opened 3 weeks ago

AlanneSoares commented 3 weeks ago

Referência:

Spark: Tutorial de instalação em ambiente local

Hadoop: Tutorial de instalação em ambiente local (texto e imagens)

Tutorial de instalação em ambiente local (vídeo em inglês)

Tutorial de instalação em ambiente local por sequência (vídeo em inglês)

Tutorial de configuração do PySpark na IDE PyCharm (vídeo em inglês)

Darly-Goncalves-21 commented 2 weeks ago

Esse video abaixo também é bem legal: https://www.youtube.com/watch?v=knAS0w-jiUk

Vou deixar aqui também as portas usadas:

http://localhost:9870/dfshealth.html#tab-overview image

http://localhost:8088/cluster image

AlanneSoares commented 2 weeks ago

Perfeito também @Darly-Goncalves-21 esse tinha visto e acabei perdendo o link.

AlanneSoares commented 2 weeks ago

Agora sim consegui rodar... \o/

Segui esse tutorial Tutorial de instalação em ambiente local (texto e imagens)

image

Darly-Goncalves-21 commented 1 week ago

Anotações para subir o Hadoop:

C:\Hadoop\sbin>start-dfs.cmd C:\Hadoop\sbin>start-yarn.cmd

hdfs dfs -mkdir /Darly/Hadoop/input hdfs dfs -put C:\Users\Darly\Desktop\big-data\CrimesOnWomenData.csv /darly/Hadoop/input/

http://localhost:9870/ http://localhost:8088/cluster

Darly-Goncalves-21 commented 1 week ago

Até que enfim vi na tela, puxando de um dataset que está no hdfs.

image

Darly-Goncalves-21 commented 1 week ago

Começando a ficar melhor!

image

AlanneSoares commented 1 week ago

@Darly-Goncalves-21 subi algumas atualizações!!!