morebo2ks / hadoop

5 stars 0 forks source link

8주차 hadoop 스터디 #10

Closed KilJaeeun closed 2 years ago

KilJaeeun commented 2 years ago

파트

wookiist commented 2 years ago

스터디 내역

hyunju-song commented 2 years ago

https://hazel-developer.tistory.com/289

jasonkang14 commented 2 years ago

https://www.notion.so/byeongjinkang/MongoDB-731d013d39a44636be12715d5d8cd76a

JSYoo5B commented 2 years ago

유재상 스터디 로그

MongoDB

Humongous Data에서 유래해서 이름 지음. 주요 특징으로는 문서 데이터 모델 CAP 분류에 따르면 HBase와 같이 Availability를 포기한 방향 (하지만 완전히 포기한 건 아니고, 잠시 Write가 불가능한 방식)

문서 데이터 -> 스키마 정의가 강요되지 않는다. 마치 JSON처럼 자체적으로 프라이머리 키를 만들어서 관리한다. 샤딩 등을 목적으로 indexing이 필요하다면 특정 키를 선택할 수 있다.

MongoDB Architecture

Availability를 포기한 방향, Primary(master)가 요청 받으면 그 기록을 바탕으로 secondary에서도 반영하여 replica 반영

Single Master 구조로 동작하며, Secondary 들 중 하나가 상황에 따라 Master가 될 수 있음. (선정 기준은 전체적인 node간 ping이 제일 낮은, 반응성이 가장 좋은 것을 선호)

Sharding

인덱싱을 기준으로 레플리카 셋을 나눠서 보관 (그림 보고 잘 이해가 안되는데, sharding마다 primary가 따로 있다는 뜻인가?)

MongoDB 장점

데이터베이스 기술 선택

주요 고려사항

KilJaeeun commented 2 years ago

https://www.notion.so/6-2-MongoDB-8595d97da03e4f6698ed4862d08d4f79#a0c835177fd04dea926d7f9011009384