Open KilJaeeun opened 1 year ago
비즈니스 데이터 처리는 데이터베이스 쓰기가 보통 커머셜 트랜잭션에 해당했음. (책에 좀 생략되어 있는데, 읽은 데이터를 바탕으로 쓰고, 다수 레코드/테이블에 영향을 주는 쓰기를 뜻하는 듯)
OLTP는 low latency, high availability를 지향하도록 최적화 OLAP는 latency에 대한 jitter도 별로 안 높을테고, 넓은 레코드 범위 지향. 최적화 방식이 다름 이론상 둘이 같은 DBMS를 쓰는 것 같지만, 성능까지 적합한지 여부는 별개임
한 테이블을 기준으로 각 attribute가 다른 테이블의 외래키가 됨 -> 하나를 중심으로 -> 별모양 스키마 참조하는 테이블의 종류가 다양 -> 별의 가지가 갈라지는 것 같다 -> 눈꽃송이 스키마
분석을 할 때는 일부 칼럼(attribute)만 사용. 모든 레코드의 내용이 불필요한 경우가 많음 결국 레코드의 내용이 길어지면 locality가 떨어질 가능성이 높다 -> 아예 저장을 column 위주로 -> 칼럼 지향 저장소
칼럼 지향 -> 같은 속성의 다른 값들을 보관 -> 인코딩(압축) 가능
칼럼 위주로 저장하면 비슷한 데이터를 한번에 처리하기 쉬워지고, SIMD 등으로 성능 최적화가 가능 (이 부분 필요하면 미팅에서 설명해드림)
현재 칼럼을 기반으로 저번에 했던 SS테이블 등의 순서 도입하여 정렬이 가능함
이거 읽긴 했는데 이해 안되서 다시 보고 정리할게요
파트
발표자
발표 기간
마감기한
참고 링크