AlanneSoares / spark-big-data

0 stars 0 forks source link

Configurar ambiente utilizando WSL 2 (Windows Subsystem for Linux) Ubuntu ou Windows e instalar o Spark e Hadoop #2

Open AlanneSoares opened 2 months ago

AlanneSoares commented 2 months ago

Referência:

Spark: Tutorial de instalação em ambiente local

Hadoop: Tutorial de instalação em ambiente local (texto e imagens)

Tutorial de instalação em ambiente local (vídeo em inglês)

Tutorial de instalação em ambiente local por sequência (vídeo em inglês)

Tutorial de configuração do PySpark na IDE PyCharm (vídeo em inglês)

Darly-Goncalves-21 commented 2 months ago

Esse video abaixo também é bem legal: https://www.youtube.com/watch?v=knAS0w-jiUk

Vou deixar aqui também as portas usadas:

http://localhost:9870/dfshealth.html#tab-overview image

http://localhost:8088/cluster image

AlanneSoares commented 2 months ago

Perfeito também @Darly-Goncalves-21 esse tinha visto e acabei perdendo o link.

AlanneSoares commented 2 months ago

Agora sim consegui rodar... \o/

Segui esse tutorial Tutorial de instalação em ambiente local (texto e imagens)

image

Darly-Goncalves-21 commented 2 months ago

Anotações para subir o Hadoop:

C:\Hadoop\sbin>start-dfs.cmd C:\Hadoop\sbin>start-yarn.cmd

hdfs dfs -mkdir /Darly/Hadoop/input hdfs dfs -put C:\Users\Darly\Desktop\big-data\CrimesOnWomenData.csv /darly/Hadoop/input/

http://localhost:9870/ http://localhost:8088/cluster

Darly-Goncalves-21 commented 2 months ago

Até que enfim vi na tela, puxando de um dataset que está no hdfs.

image

Darly-Goncalves-21 commented 2 months ago

Começando a ficar melhor!

image

AlanneSoares commented 2 months ago

@Darly-Goncalves-21 subi algumas atualizações!!!