chominyeong / BIG-DATA-WO-SASAERU-GIJUTSU

빅데이터를 지탱하는 기술
0 stars 0 forks source link

[2024.02.04] chapter2. 빅데이터의 탐색 (1) - MY #3

Open chominyeong opened 8 months ago

chominyeong commented 8 months ago

2-1 크로스 집계의 기본

☑트랜잭션 테이블(cross table)

image

☑크로스 테이블(cross table)

image

☑크로스 집계(cross tabulation)

✅피벗 테이블 기능에 의한 크로스 집계

image

☑룩업 테이블(lookup table)

✅1) BI 도구에 의한 크로스 집계

✅2) Pandas에 의한 크로스 집계

image

✅3) SQL에 의한 테이블의 집계

SELECT date_trunc('month', "매출일") ::DATE AS "매출일", "점포 ID", "상품 ID", "고객 ID", sum("금액") AS "금액"
FROM "판매 이력"
GROUP BY 1, 2, 3, 4
chominyeong commented 8 months ago

2-2 열 지향 스토리지에 의한 고속화

3계층의 데이터 집계 시스템

캡처

행 지향(row-oriented) 데이터베이스

⭐열 지향(column-oriented) 데이터베이스

⭐MPP(massive parallel processing)

MPP 데이터베이스 vs 대화형 쿼리 엔진

집계 시스템 종류 스토리지의 종류 최적의 레코드 수
RDB 행 지향 ~수천만 정도
MPP 데이터베이스 열 지향(하드웨어 일체형) 수억~
대화형 쿼리 엔진 열 지향(분산 스토리지에 보관) 수억~


MPP가 하드웨어 일체형이면 일반인은 써볼 기회가 없을 것 같은디..