Closed Grade-Two closed 3 years ago
应用是什么协议,可能不支持回放。
btw,需要看镜像节点单个session会话过程,才能准确分析
我们用的thrift,全是短链接,每次请求都会建立tcp链接,然后释放。 镜像节点的session过程如下: 一开始的正常session:
然后情况逐渐变化:
最后完全gg:
跪求大佬指导。。。
从抓包来推测,应该是被干扰了。
可以同时在线上节点和镜像节点抓包,对同一个session(在抓包文件通过客户端端口号来过滤)进行对比,看看reset数据包是不是中途设备干的。
最可疑的地方: 同时发送fin和reset数据包(相差7us),不正常,tcpcopy没有发送这么快
线上节点:
镜像节点:
两边都抓到了,可以对应上。 后续那些整个stream只包含一条reset包的session也是两边各有一条,可以对应上,跪。。。 这可能是什么原因造成的ORZ。。。
@wangbin579 在CSDN联系您了,万望大佬回复T_T
不好意思,才回复。
csdn已经丢失账号,无法回复。
tcpcopy编译的时候,加上--with-debug选项,详细输出debug日志看看吧。 也只能从debug日志来查看,为什么连续发送要reset(其实是不相信tcpcopy有这么快的发送速度,需要debug日志来确认)。
qq群联系也行(521824702)
这个问题是集中发送大量路由消息,导致用户定制的os报fd错误,导致后续无法发送
感谢大佬 @wangbin579 ~就是这个原因,此问题已解决~
@Grade-Two 您好,我在使用TcpCOPY复制流量的时候遇到了类似的问题,方便请教下解决方法吗?谢谢
这是来自张越的自动回复邮件。您好,你的邮件已经收到,我会尽快给您回复。
每次开始复制时可以成功复制开始的部分请求,但往后绝大部分请求都无法复制成功,但也会有零星几个请求被复制过去。 启动指令: 10.160.158.12(线上节点): ./tcpcopy -x 1111-9.181.212.142:1111 -s 9.181.212.172 -c 10.0.4.172 -p 36524 -l ${log_path}/port_36524_1111 -d 9.181.212.142(镜像节点): route add -net 10.0.4.0 netmask 255.255.255.0 gw 9.181.212.172 9.181.212.172(辅助节点): ./intercept -i bond1 -F 'tcp and src port 1111' -p 36524 -l ${log_path}/port_36524 -d
tcpcopy_log:
intercept_log:
线上节点抓包(前面正常,然后):
镜像节点抓包(前面正常,然后):
检查了线上节点的iptables,没有限制output:
请问大佬们,这是因为什么原因造成的?