1장 사용자 수에 따른 규모 확장성

Eeap commented 1 year ago

❓ Question

웹 서버와 데이터베이스 서버가 분산됨에 따라 데이터베이스 커넥션 관리
에러 로그를 모니터링 하는 방식(알려져 있지 않는 새로운 에러로그에 대한 처리는 어떻게 수행하는지 등등..)

📎 Additional context

ahyeon-github commented 1 year ago

📎 reference

[x] (요새 제가 영어 공부를 하고 있어서😅) 혹시 영어버전으로도 읽고 싶은 분들은 참고하세요 !

https://studylib.net/doc/25766177/system-design-interview

[x] 12 페이지에 나와있는 페이스북 논문 입니다 !

Scaling.Memcache.at.Facebook.pdf

[x] 이건 위의 논문을 번역한 블로그 글이에요!

https://changhoi.kim/posts/database/scaling-memcache-at-facebook/

ahyeon-github commented 1 year ago

Question 저는 프로젝트를 할 때 데이터베이스를 샤딩을 사용해본 적이 없어서 현업에서 어떻게 데이터베이스를 샤딩하여 운영을 하는지 궁금하였습니다

[x] 관리하는 데이터의 사이즈가 커지는 환경하에서 데이터베이스의 샤딩이 실무에서 사용하는데 굉장히 중요 , 데이터가 급격히 증가하게 되거나 트래픽이 특정 DB로 몰리는 상황을 대비해, 빠르고 유연하고 안전한 DB를 위해 샤딩을 고려하는 것이 좋음
[x] https://techblog.woowahan.com/2687/ 스프링에서 샤딩을 적용한 사례

bik1111 commented 1 year ago

3조 윤가영님께서 해당 부분 노션에 남겨주셔서 여기에도 공유합니다.

By 윤가영님

궁금해서 더 찾아본 것

데이터베이스 다중화는.. 성능이 안느려지나

https://dba.stackexchange.com/questions/37280/does-mysql-replication-hamper-the-performance-of-my-db

모든 경우에 마스터는 슬레이브에서 업데이트를 실제로 실행할 책임이 없으며, 단지 실행된 실제 입력 쿼리의 복사본(문 기반 모드)이나 각 쿼리가 실제로 삽입/업데이트/삭제한 행의 데이터(행 기반 모드) 중 하나를 슬레이브로 전송할 뿐입니다. 혼합 모드에서는 쿼리 옵티마이저가 이벤트별로 사용할 형식을 결정합니다.

요약

슬레이브를 두는 것 자체로는 주 서버에 대한 부하가 경미함 주 서버가 복제 환경에서 주로 하는 일 2가지 로컬 하드 드라이브에 이벤트를 구성하고 이를 이진 로그(binlog)에 기록 각 연결된 슬레이브에게 기록한 모든 이벤트의 사본을 전송 -> 위의 이유가 큰 비용이 아닌 이유 : 이진로그를 복제하는 것을 복제의 비용으로 여기지 X -> 복제를 하지 않더라도 항상 이진 로깅을 켜놓아야 하기 때문에 문제 해결 및 복구 도구로서 극히 가치 있는 기능
슬레이브에게 로깅을 전송하는 비용 역시 적음 주 서버는 슬레이브와 TCP 연결을 유지하며, 주 서버는 이벤트가 발생할 때 데이터를 소켓에 복사하기만 하면됨 따라서 그 이후부터는 주 서버는 슬레이브가 해당 이벤트를 실행하는지 여부나 언제 실행하는지에 대해서는 알지도 못하며 신경쓰지 않음.
어떤 경우에도 주 서버는 슬레이브에서 실제로 업데이트를 실행하는 것은 아님 (중요!!) 주 서버는 단지 슬레이브에게 두 가지 중 하나를 전송 : (1) 실제 실행된 쿼리의 사본 또는 (2) 각 쿼리에서 실제로 삽입/업데이트/삭제된 행들의 데이터. --> 여기서 (2)를 수행하는 과정에서도 위에서 언급한 이진로그를 기록하는 주 서버는 모든 이벤트를 매번 새롭게 갱신하는 것이 아니라 "실제로 변경"이 이루어진 것만 선별해서 기록, 데이터 변경 내역을 효율적으로 "압축" 하여 전송, 여러 개의 슬레이브에게 "병렬적" 으로 분산 전달

참고로, 여기서 말하는 다중화는 데이터원본을 저장하는 주 서버(MasterDB)와 사본을 저장하는 부 서버(SlaveDB)를 의미합니다. ( 책 P7 )

aws-cloud-clubs / 2023-system-design-interview-1st

1장 사용자 수에 따른 규모 확장성 #2

❓ Question

📎 Additional context

궁금해서 더 찾아본 것

요약