dunwu / blog

:dart: 钝悟的博客
https://dunwu.github.io/blog/
Creative Commons Attribution Share Alike 4.0 International
861 stars 230 forks source link

服务容错 | Dunwu #11

Closed dunwu closed 2 years ago

dunwu commented 2 years ago

https://dunwu.github.io/blog/9c24212e.html

服务容错 故障分类 从故障影响范围维度来看,分布式系统的故障可以分为三类: 集群故障:根据业务量大小而定,集群规模从几台到甚至上万台都有可能。一旦某些代码出现 bug,可能整个集群都会发生故障,不能提供对外提供服务。 机房故障:现在大多数互联网公司为了保证业务的高可用性,往往业务部署在不止一个机房。然而现实中,某机房的光缆因为道路施工被挖断,导致整个机房脱网的事情,也是时有发生的。并且这种事