tonykang22 / study

0 stars 0 forks source link

01. 빅데이터란? #162

Open tonykang22 opened 1 year ago

tonykang22 commented 1 year ago

빅데이터처리 with Spark&Hadoop

Ch 01. 빅데이터란?

데이터의 시대

image

데이터 사용량은 더욱 빠르게 증가하고 있다.



image

Byte 가 쌀 한톨 부피를 가진다고 가정할 때, Zettabyte 는 쌀로 태평양을 덮을 정도의 양이다.



분당 발생하는 데이터 수



빅데이터란?



빅데이터의 3대 요소

image

3V 라고도 한다.




빅데이터가 왜 필요할까?



빅데이터 사용 사례

image

대부분 기업이 데이터 분석과 예측을 활용 중이다.

tonykang22 commented 1 year ago

플랫폼이란?

플랫폼의 정의

image

평평한 + 형태





다양한 플랫폼

하드웨어 플랫폼

image

생산 공정이나 환경을 의미 : Ex) 현대기아차는 플랫폼을 공유



소프트웨어 플랫폼

image



서비스 플랫폼

image

예로는 앱스토어가 있겠다.



빅데이터 플랫폼


빅데이터 플랫폼 요구사항

빅데이터 아키텍처

image
tonykang22 commented 1 year ago

빅데이터 아키텍처

image

크게 5 가지로 나뉜다.




Source

Data 종류


Data Source 종류



Data Ingestion and Processing


수집 도구


처리 도구


Lambda vs Kappa

image

Reference : https://luminousmen.com/post/modern-big-data-architectures-lambda-kappa

tonykang22 commented 1 year ago

Storage

Data Warehouse


Data Lake

image

Reference : https://aws.amazon.com/ko/blogs/korea/aws-lake-formation-now-generally-available/




Analytics and Prediction



Output