tonykang22 / study

0 stars 0 forks source link

03. Hadoop ecosystem #161

Open callmeaxxe opened 1 year ago

callmeaxxe commented 1 year ago

1. Hadoop

Hadoop Ecosystem

image

너무 많음

데이터 수집

데이터 처리

데이터 저장

워크플로우 관리 도구

보안

메타데이터 관리

데이터 분석

시각화

callmeaxxe commented 1 year ago

2. 빅데이터 플랫폼과 Hadoop ecosystem

image

빅데이터 플랫폼 구축 아키텍쳐

Ingestion and Processing

Flume

Scoop

Kafka

Spark, Flink

Spark, Hadoop MapReduce, Hive

Storage

HDFS

Analytics and Prediction

Impala, Trino

Druid, Pinot

Spark, Mahout

Output

Superset

Workflow Management

Airflow, Oozie

callmeaxxe commented 1 year ago

3. Hadoop cluster 구축 고려사항

클러스터(Cluster)란?

image

Master / Worker Architecture

image

클러스터 규모 결정

스토리지 용량으로 결정하기

데이터 수집 속도로 결정하기

워크로드에 따른 하드웨어 선정