alibaba / otter

阿里巴巴分布式数据库同步系统(解决中美异地机房)
Apache License 2.0
8.08k stars 2.49k forks source link

Cannal Binlog Dump进程卡在Writing to net状态 #524

Open yvesyuan opened 6 years ago

yvesyuan commented 6 years ago

最近一次机房断电维修, 所有OTTER相关服务器中的otter相关进程没有先stop就关机了, 复电启动以后OTTER同步出现了很奇怪的问题. 就是某些channel同步一段时间以后就会异常缓慢, select node中rows_select.log刷的很慢, 但并不是停住. 重启channel可以正常, 重启node也可以恢复正常, 但一段时间以后又一样. 最后查到, 是因为cannal在mysql服务器中的Binlog Dump进程一直卡在Writing to net状态, 将该进程kill掉, 该channel也可以恢复正常. 已经查过, 相关服务器的网络, 磁盘均正常. 目前采取的应对措施是, 监控mysql中的Binlog Dump进程, 一旦发现有hang住, 就kill掉. 不知这样会不会带来什么负面效果, 例如数据丢失等.

luyee commented 6 years ago

拉binlog的太多了吧~网络就那么大 拉1份跟拉10份 或者100份~

smallez commented 5 years ago

我也遇到类似的情况,一般在大批量刷数据的时候容易出现,这个有啥解决方案吗》?

jdj199222 commented 4 years ago

同样的情况,如何控制拉binlog的量呢