Open ghlnh opened 4 months ago
AWS에서 사용되는 NoSQL 기반의 데이터베이스 시스템으로 데이터의 가용성과 내구성을 보장하는 데 중점을 둠. 데이터의 복제본을 여러 노드에 분산시켜 신뢰성을 높임
표 1. 다이나모가 사용하는 기술과 그 장점에 대한 요약
아파치에서 만든 NoSQL 분산 데이터 베이스로 안정 해시를 이용한 링구조와 가십프로토콜을 구현하였다. 샤딩을 고려해야 할 필요도 없음. 단, Join이나 Transction 미지원
카산드라에 도입된 다이나모의 주요 특징
Symmetric, P2P 아키텍처
Gossip-based 클러스터 매니지먼트
분산 해시 테이블
Pluggable partitioning
Pluggable topology discovery
Pluggable placement strategies
튜닝 가능한 eventual consistency
구글의 빅테이블에서 도입된 주요 특징
스파스(Sparse) 컬럼 데이터 모델 : 수퍼컬럼 패밀리
SSTable 디스크 스토리지
Commit 로그에 적용
Memtable 버퍼 및 소트
Immutable SSTable 파일
하둡 통합 기능
빅테이블은 2015년 구글에서 발표한 NoSQL계열 컬럼형 데이터베이스로, HBase와 같은 컬럼형 데이터베이스의 원조격으로, 컬럼 패밀리 모델 등의 개념은 Bigtable에서 시작되었다고 볼 수 있다.
모든 클라이언트 요청은 프런트엔드 서버를 통과한 후 노드로 전송→테이블은 태블릿이라고 하는 연속된 행의 블록으로 분할되어 쿼리 워크로드를 분산되고, 태블릿은 Google 파일 시스템인 Colossus에 SSTable 형식으로 저장
중요한 건 데이터가 Bigtable 노드 자체에 저장되지 않음. 각 노드는 태블릿 집합에 대한 포인터가지며 그 결과는 아래와 같음
모든 데이터는 RowKey를 기준으로 분리된 데이터 노드에 SSTable이라 불리는 파일 형태로 분산되어 저장
Wow...
다이나모
AWS에서 사용되는 NoSQL 기반의 데이터베이스 시스템으로 데이터의 가용성과 내구성을 보장하는 데 중점을 둠. 데이터의 복제본을 여러 노드에 분산시켜 신뢰성을 높임
표 1. 다이나모가 사용하는 기술과 그 장점에 대한 요약
카산드라
아파치에서 만든 NoSQL 분산 데이터 베이스로 안정 해시를 이용한 링구조와 가십프로토콜을 구현하였다. 샤딩을 고려해야 할 필요도 없음. 단, Join이나 Transction 미지원
카산드라에 도입된 다이나모의 주요 특징
Symmetric, P2P 아키텍처
Gossip-based 클러스터 매니지먼트
분산 해시 테이블
Pluggable partitioning
Pluggable topology discovery
Pluggable placement strategies
튜닝 가능한 eventual consistency
구글의 빅테이블에서 도입된 주요 특징
스파스(Sparse) 컬럼 데이터 모델 : 수퍼컬럼 패밀리
SSTable 디스크 스토리지
Commit 로그에 적용
Memtable 버퍼 및 소트
Immutable SSTable 파일
하둡 통합 기능
빅테이블
빅테이블은 2015년 구글에서 발표한 NoSQL계열 컬럼형 데이터베이스로, HBase와 같은 컬럼형 데이터베이스의 원조격으로, 컬럼 패밀리 모델 등의 개념은 Bigtable에서 시작되었다고 볼 수 있다.
모든 클라이언트 요청은 프런트엔드 서버를 통과한 후 노드로 전송→테이블은 태블릿이라고 하는 연속된 행의 블록으로 분할되어 쿼리 워크로드를 분산되고, 태블릿은 Google 파일 시스템인 Colossus에 SSTable 형식으로 저장
중요한 건 데이터가 Bigtable 노드 자체에 저장되지 않음. 각 노드는 태블릿 집합에 대한 포인터가지며 그 결과는 아래와 같음
모든 데이터는 RowKey를 기준으로 분리된 데이터 노드에 SSTable이라 불리는 파일 형태로 분산되어 저장
References