coolsnowwolf / lede

Lean's LEDE source
Other
29.83k stars 19.53k forks source link

x86/x64 开启 SFE 后有自动 KP/重启 问题调查 #6489

Closed coolsnowwolf closed 3 years ago

coolsnowwolf commented 3 years ago

目前零星收到一些反馈,主要是 x86/x64 开启 SFE 后,在某些主板上会有 KP/重启的问题

现在需要收集下信息,遇到这种情况的 CPU/主板/网卡 都是些什么? 用哪些插件为主?

NagaseKouichi commented 3 years ago

J4205软路由,网卡是I211。似乎是开启SFE之后在负载比较大的时候,会重启。比如我用docker运行了JD薅羊毛脚本,晚上0点的时候跑的脚本比较多,如果软路由开了SFE,在0点左右就有可能会重启

lqhorochi commented 3 years ago

没有出现过,i350t2虚拟化和i350t4直通,虚拟化都没有问题 还有bcm5719直通也没有问题

binge8 commented 3 years ago

3215U,i211网卡,主板未知,关闭SFE一个月都没问题,开启SFE几乎每天一次无规律重启。主要用KP.SSRPLUS+,JD薅羊毛,微信推送,dockerman等

Neverends4 commented 3 years ago

插个楼,我的MT7621 红米RM2100开了SFE/flowoffload+闭源驱动也会随机重启,而且不一定是在负载大的时候……关了就最长26天没重启……前后自己编译了多个版本。然后kernel crushlog好像没用,是空的。正在尝试是不是闭源/开源wifi驱动的问题。

NagaseKouichi commented 3 years ago

同楼上,小娱路由器C1开了flowoffload也会随机重启

hxlls commented 3 years ago

小马V1 开启SFE 无重启无报警,开启flowoffload 会日志报错,服务跑的比较多 image 以前也用过docker ,也没出现过问题,只是docker 不懂是不是因为op 内核关系,限制CPU使用率等会有部分小功能不能生效

dhso commented 3 years ago

主板:J1900 插件:Docker,SS 内存:几乎空闲,无繁重任务 重启:每天不定时重启,有时重启失败无法使用,需要再次手动重启。

目前已经关闭SFE,运行正常。

mjyhj commented 3 years ago

信步26026 N2600 开了SFE,大概一星期重启一次,关了后十几天一直稳定

y9858 commented 3 years ago

R2S 开Sfe会假死 几乎天天都会 必须断电重启 现在没编译SFE 正常了

ghost commented 3 years ago

give you a tip it's only about the X86/X64 architecture,and I have the same problem on the J4125cpu

trueboost commented 3 years ago

CPU是奔腾4405U 网卡是82574L SSP PASSWALL JD 插件为主

AwesomeSky commented 3 years ago

imageimage J1900 intel 82583V 关闭SFE已稳定运行一个月 开启后平均每天重启一次

github-xihe commented 3 years ago

CPU:i3-5010U 网卡:螃蟹8111 插件:docker、ssrp 开启SFE后,一天会不定时几小时重启一次,关闭后运行几天未出现重启现象。后面取消编译SFE改用flowoffload,开启flowoffload后未出现自动重启现象。

llivenan commented 3 years ago

设备:M93P 主板:Q87 CPU:I5-4590T
网卡:板载英特尔219LM MINIPCIE转英特尔I210网卡 OPENWRT版本:R20.9.13-X64,R20.12.31-X64,R21.1.8-X64,三个版本都试过 ESXI虚拟OPENWRT,开启SFE,基本10个小时左右会死机,设备无响应,重启后恢复,故障重复,不用SFE或用FLOWOFFLOAD后测试十来天,网络正常,无死机,无重启,爱雕哥,大雕十八。

WYC-2020 commented 3 years ago

看来sfe还真是害了不少人哈哈

asushugo commented 3 years ago

这个问题挺久的了,目前我遇到的是信步N2600,还有D525的,都可以复现这个问题,一般来说用一两天就会莫名其妙重启,只要关闭SFE或者切换到Flow就不会再出现了,插件就只运行了网易云解锁和SSRP,网卡是intel的,具体型号忘记了

4.14内核(含4.14)之前没有任何问题,4.19之后的内核都有这个问题

db-one commented 3 years ago

J1900 微软虚拟机环境 之前开启sfe一切正常,后来入了京东云,20M上行跑满上传,负载一高,就开始不定时系统重启,基本都在十来个小时左右,最多不超过一天,我装了外部日志服务器抓日志,也没看到有什么异常,后来是关闭了serverchan解决的,但不清楚和sfe有没有关系,不过症状倒是跟大家差不多,不过sfe好像是对京东云跑流量有点影响,也干脆一起关了,现在一切正常

LeanFly commented 3 years ago

设备情况:Intel 3867U,4口Intel i211网卡 常用插件:SSRplus、uhttpd、upnp、adbybyplus、v2rayserver、dnspod动态域名 不定时自动重启,还会出现DHCP不分配ip的情况 sfe、flowoffload切换重写固件都不行,现在换到ikuai+op

z1790 commented 3 years ago

j1900 211网口 docker ssr 开sfe随机重启。。。有时候是几个小时。。有时候是几天。。关掉sfe就没重启过,不过sfe确实是降低不少cpu的使用率

xe5700 commented 3 years ago

歌华链 MT7621 SFE FLOWOFFLOAD都会重启,不过SFE更离谱,疯狂重启,有时候刚开机就重启,似乎最多没撑过12小时。 FLOWOFFLOAD+HWNAT倒是重启频率不是特别高,但偶尔也会发生。

Annyoo2021 commented 3 years ago

8600T /Z390ITX /I211 219,固件只用大雕牌,嘿嘿不喜欢太多无用的功能。物理机、群里的X86 5.4内核固件。如openwrt-x64-R21.1.8-generic-squashfs-combined.img 。所遇问题如下: 1、开启、SFE,经常不定时重启。需要稳定用网,没时间测试关闭SFE后的状态。 2、SSR重启后是关闭状态,不会自动运行,得每次手动开启。 3、设置没变,GFW模式。但SSR导致部分国内网站打不开 (没记录具体网站),关闭SSR正常。 4、设置没变,DDNS-阿里云- 重启后 IP长时间不变动。外网无法访问。 所遇问题太多,重新格式化重刷几次设置好几次,都无果。没办法,又需要稳定用网,只能换回去年的4.19固件:openwrt-R20.4.8-x64-combined-squashfs(此版本之前稳定运行快1年没出任何问题)。暂时不敢再刷新固件了。望大佬解决。

顺便问下雕哥、openwrt-R20.4.8-x64-combined-squashfs 这个4.19内核的版本 还继续更新吗,还是以后都只有5.4的了?

sxx1314 commented 3 years ago

#5349 sfe导致重启最早起源于4.19最后几个版本然后一直延续5.4,不怎么需要这玩意就一直拖着没review,只有压测结果。目前情况看和硬件关系也不太大。

iGoogleVip commented 3 years ago

老大 我的也重启 但不知道什么原因 来看了一下 原来是sfe的问题 flowoffload怎么切换也不会 大佬们 flowoffload 怎么切换呀

iGoogleVip commented 3 years ago

我的是x86 虚拟机

cevinwu87 commented 3 years ago

J1900,网卡RTL8111,主要插件ssr,upnp,群里面最新的R21.1.8会莫名重启,之前的版本都没有遇到自己重启的情况

db-one commented 3 years ago

J1900 微软虚拟机环境 之前开启sfe一切正常,后来入了京东云,20M上行跑满上传,负载一高,就开始不定时系统重启,基本都在十来个小时左右,最多不超过一天,我装了外部日志服务器抓日志,也没看到有什么异常,后来是关闭了serverchan解决的,但不清楚和sfe有没有关系,不过症状倒是跟大家差不多,不过sfe好像是对京东云跑流量有点影响,也干脆一起关了,现在一切正常

补一个当时导出来的日志记录 2020-08-22T15:28:19+00:00 OpenWrt crond[16666]: crond (busybox 1.31.1) started, log level 8 2020-08-22T15:28:20+00:00 OpenWrt dnsmasq[16599]: Connected to system UBus 2020-08-22T20:00:00+00:00 OpenWrt crond[16666]: USER root pid 29039 cmd /usr/bin/serverchan/serverchan send & 2020-08-23T02:00:00+00:00 OpenWrt crond[16666]: USER root pid 25646 cmd lua /usr/share/passwall/rule_update.lua nil log > /dev/null 2>&1 & 2020-08-23T05:28:53+00:00 OpenWrt kernel: [162679.994484] ------------[ cut here ]------------ 2020-08-23T05:28:53+00:00 OpenWrt kernel: [162679.998113] Kernel BUG at kfree+0x16a/0x1c0 [verbose debug info unavailable] 2020-08-23T05:28:55+00:00 OpenWrt kernel: [162680.072437] invalid opcode: 0000 [#1] SMP PTI 2020-08-23T05:28:55+00:00 OpenWrt kernel: [162680.106647] CPU: 1 PID: 22575 Comm: iptables Not tainted 5.4.51 #0 2020-08-23T05:28:55+00:00 OpenWrt kernel: [162680.142131] Hardware name: Microsoft Corporation Virtual Machine/Virtual Machine, BIOS 090007 05/18/2018 2020-08-23T05:28:55+00:00 OpenWrt kernel: [162680.190104] RIP: 0010:kfree+0x16a/0x1c0 2020-08-23T05:28:55+00:00 OpenWrt kernel: [162680.222098] Code: ff ff c3 49 8b 04 24 31 db a9 00 00 01 00 74 06 41 0f b6 5c 24 51 49 8b 04 24 a9 00 00 01 00 75 0b 49 8b 44 24 08 a8 01 75 02 <0f> 0b 89 d9 ba ff ff ff ff be 06 00 00 00 48 c7 c7 80 42 28 82 d3 2020-08-23T05:28:55+00:00 OpenWrt kernel: [162680.310087] RSP: 0018:ffffc9000973fcd0 EFLAGS: 00010246 2020-08-23T05:28:55+00:00 OpenWrt kernel: [162680.350079] RAX: ffff88801faa2708 RBX: 0000000000000000 RCX: 0000000000000010 2020-08-23T05:28:55+00:00 OpenWrt kernel: [162680.390076] RDX: 0000000000000000 RSI: 00000000002a0000 RDI: ffff88800a800000 2020-08-23T05:28:55+00:00 OpenWrt kernel: [162680.423422] RBP: ffffc9000973fce8 R08: 0000000000000001 R09: 00000000f0000000 2020-08-23T05:28:55+00:00 OpenWrt kernel: [162680.474085] R10: 0000000000000004 R11: 0000000000000000 R12: ffff88801faa0000 2020-08-23T05:28:55+00:00 OpenWrt kernel: [162680.518082] R13: ffffffff82289d78 R14: ffff88800a800000 R15: ffffffff82279580 2020-08-23T05:28:55+00:00 OpenWrt kernel: [162680.562101] FS: 00007efe12631d48(0000) GS:ffff88801f440000(0000) knlGS:0000000000000000 2020-08-23T05:28:55+00:00 OpenWrt kernel: [162680.606080] CS: 0010 DS: 0000 ES: 0000 CR0: 0000000080050033 2020-08-23T05:28:55+00:00 OpenWrt kernel: [162680.646101] CR2: 0000000000c74000 CR3: 0000000014c7e000 CR4: 00000000001006e0 2020-08-23T05:28:55+00:00 OpenWrt kernel: [162680.694150] Call Trace:

22号8点的时候serverchan通知了一次信息,23号两点时候PW更新了一次规则,后面就没有任何日志了,然后到5.28分直接重启了,也可能重启时候日志没来得及输出到rsyslog,固件是LEAN+PW

image

iGoogleVip commented 3 years ago

把那个sfe关了 稳定运行 老大的代码真好 真稳定

ghost commented 3 years ago

我的开了sfe之后pppoe连接不知道啥时候就掉了,然后死活连不上。只能取消sfe的编译。cpu i5 10代、网卡是rtl8111。

系统server 2019,固件是运行在hyper-v虚拟机上的。(kvm虚拟机未测试稳定性。)

使用flowoffload后虚拟出来的网卡超过1月后莫名其妙的掉速。pppoe连接自动重启。

日志没截取出来。

网卡的速度从刚开始的1gb/s全双工掉到了10mb/s。

删了hyper-v的交换机后再重建,网卡的速度又重新恢复到1gb/s。

主要使用多拨插件、kms激活、ssr+、smartdns、turbo acc加速(sfe和flowoffload都有问题)、mwan3、upnp

icefruit-j commented 3 years ago

开了DNS加速会导致科学谷歌打不开的问题

dolphinpaopao commented 3 years ago

x64正常,不管是物理机还是pve虚拟机,e3+h81+i350t2/rtl8111e。不过我编译的固件手动替换了upnp为2.1版本,其他没变。反正我这里用upnp 2.1的版本,迅雷bt等下载软件使用正常,防火墙的端口转发也是设置保存就能生效。稳定好用不折腾。目前使用的内核为5.4.86/R20.12.12。👍

zhaoxp520 commented 3 years ago

i5 3337U Intel 82574L网卡 只要不编译docker,怎么开都不会重启,编译了docker进去,无论容器多不多负载大不大,不关sfe就会不定时重启。 常开插件,openclash,微信推送,网易云解锁,kms……

plasmolysis369 commented 3 years ago

Intel I7 5775c,华擎H97主板,I350 t4加rtl8125b,运行在proxmox ve虚拟机上,开启sfe后出现过一次直接卡死无法进入后台,无法ssh连接,vnc无法控制,虚拟机后台强制关闭无效,只能强行关闭物理机,关闭sfe后无类似情况

BOBINIUNIU commented 3 years ago

个人觉得J1900以上级别的软路由就别开SFE了,转发能力已经足够了。SFE,BBR有时候会和其他插件冲突,成为一种负优化。 P.S 有人测试过开SFE和不开SFE包转发性能的对比吗?

ghost commented 3 years ago

个人觉得J1900以上级别的软路由就别开SFE了,转发能力已经足够了。SFE,BBR有时候会和其他插件冲突,成为一种负优化。 P.S 有人测试过开SFE和不开SFE包转发性能的对比吗?

这个我会注意下的。我cpu级别比你说的那个高,i5 10代的

lfdfxl commented 3 years ago

小米R3G,MT7621的CPU开启HWNAT也有不定时重启现象,大佬也关注一下。

badcrazy commented 3 years ago

hp t520 ,amd gx-212jc,主板型号不知道,rtl8151gh(板载)+rtl8111f(minipcie转接)双网卡,插件只开启了京东签到、kms和openclash,bt下载时两次遇到重启,当时cpu占用未知,基本肯定在50%以上,连接数在10%以上 而且感觉是农历年前后的版本才出现,这个软路由用了2个多月,之前的版本并没遇到类似情况

guestid commented 3 years ago

小娱,开HWNAT不定时会重启

eallion commented 3 years ago

我直接没有编译 sfe

iso-lib commented 3 years ago

PVE+华擎J3455 应该是rtl8111网卡吧 op只编译了passwall+frpc+sfe,还有mpd-full作为音乐服务器 很稳. 其实没特殊要求那个eSir的精品小包还不错 只不过网上的固件都没编译kmod-sound-core/kmod-usb-audio,我需要接一个usb声卡输出声音,只能自己编译.

MrEsquire commented 3 years ago

V8~BFAP%5Q% AZ_%0ASZG~8 宿主系统:esxi7.0 CPU:i5-10600 主板:B460M 网卡:i350t4v2网卡直通 ,8125网卡直通 sfe开启会死机 cpu占用直接拉满,我esxi都进不去了

iso-lib commented 3 years ago

竞斗云 ipq4019 SFE+BBR 电脑斗鱼全屏+手机音频投屏,手机WIFI征战着大哥大的LOL排位赛,剑圣疯狗模式制霸全图的时候,重启断网了。 不知道这算不算? 没开BBR的时候,也是电脑斗鱼全屏手机WIFI征战大哥大完全没问题。 开了BBR不到一天,才玩了两三把。就开始出现卡延迟高,然后下一把就突然红了电脑上也听不到队友说话,我以为是宽带问题马上切出去开加速器,结果加速到80不动了,电脑斗鱼黑屏,右下角网线图标消失,地球仪图标出现,才意识到坏了竞斗云崩了重启0.0 流量打完对局后看系统日志,结果第一行Thu Mar 18 00:00:11 2021 kern.info kernel: [ 0.000000] Booting Linux on physical CPU 0x0 很明显日志没了,因为电脑上微信朋友问我掉线了?是3点10分

竞斗云不是x86吧..........................

HiGarfield commented 3 years ago

以前发现过一个问题,SFE开启的情况下,SQM QoS再开启,如果使用cake,则会随机导致负载跑满,然后看门狗超时而重启。关了SFE就一切正常。

此问题跟机型无关。ar71xx ramips都会有这个问题。

shu0802 commented 3 years ago

3865u\i211网卡,开启sfe会偶尔断网和重启

微信图片_20210320104808 微信图片_20210320104816
QZQ-QSQ commented 3 years ago

主板:3215U工控软路由。 插件:Docker,xray,dlna,aria2,网易云。(其他默认设置编译的功能,但只开启括号前的) 内存:内存剩余79% 其他:cpu温度40左右。活动连接500左右,大部分都是空闲任务,偶尔aria2限速7M下BT,平时大都看网页视频,手机应用等。 重启:每天不定时重启。

dolphinpaopao commented 3 years ago

我有意测试观察过,对比出问题的配置,我没有编译docker、nwan。lan关闭桥接,不论是pve还是物理机安装,目前开启SFE都很稳定。距离上次编译固件已稳定运行30天。所以可能是组件冲突导致内核崩溃重启或者硬件有问题,比如内存。 op1 op2 op3

shu0802 commented 3 years ago

我有意测试观察过,对比出问题的配置,我没有编译docker、nwan。lan关闭桥接,不论是pve还是物理机安装,目前开启SFE都很稳定。距离上次编译固件已稳定运行30天。所以可能是组件冲突导致内核崩溃重启或者硬件有问题,比如内存。 op1 op2 op3

我有意测试观察过,对比出问题的配置,我没有编译docker、nwan。lan关闭桥接,不论是pve还是物理机安装,目前开启SFE都很稳定。距离上次编译固件已稳定运行30天。所以可能是组件冲突导致内核崩溃重启或者硬件有问题,比如内存。 op1 op2 op3

我有意测试观察过,对比出问题的配置,我没有编译docker、nwan。lan关闭桥接,不论是pve还是物理机安装,目前开启SFE都很稳定。距离上次编译固件已稳定运行30天。所以可能是组件冲突导致内核崩溃重启或者硬件有问题,比如内存。 op1 op2 op3

内核版本可以看出来你的固件编译已经有一些时间了

dolphinpaopao commented 3 years ago

我有意测试观察过,对比出问题的配置,我没有编译docker、nwan。lan关闭桥接,不论是pve还是物理机安装,目前开启SFE都很稳定。距离上次编译固件已稳定运行30天。所以可能是组件冲突导致内核崩溃重启或者硬件有问题,比如内存。 op1 op2 op3

我有意测试观察过,对比出问题的配置,我没有编译docker、nwan。lan关闭桥接,不论是pve还是物理机安装,目前开启SFE都很稳定。距离上次编译固件已稳定运行30天。所以可能是组件冲突导致内核崩溃重启或者硬件有问题,比如内存。 op1 op2 op3

我有意测试观察过,对比出问题的配置,我没有编译docker、nwan。lan关闭桥接,不论是pve还是物理机安装,目前开启SFE都很稳定。距离上次编译固件已稳定运行30天。所以可能是组件冲突导致内核崩溃重启或者硬件有问题,比如内存。 op1 op2 op3

内核版本可以看出来你的固件编译已经有一些时间了

大兄弟,就算是再新的固件,编译完成再观察两月也变成旧版本固件了,一个月前编译还只是调整增加了ipv6,没有其他变动。所以确切说来这个版本已经稳定运行三个月。以前编译的固件也没有遇到开启SFE导致每天重启问题,我都是默认关闭桥接开启SFE的。

shu0802 commented 3 years ago

我有意测试观察过,对比出问题的配置,我没有编译docker、nwan。lan关闭桥接,不论是pve还是物理机安装,目前开启SFE都很稳定。距离上次编译固件已稳定运行30天。所以可能是组件冲突导致内核崩溃重启或者硬件有问题,比如内存。 op1 op2 op3

我有意测试观察过,对比出问题的配置,我没有编译docker、nwan。lan关闭桥接,不论是pve还是物理机安装,目前开启SFE都很稳定。距离上次编译固件已稳定运行30天。所以可能是组件冲突导致内核崩溃重启或者硬件有问题,比如内存。 op1 op2 op3

我有意测试观察过,对比出问题的配置,我没有编译docker、nwan。lan关闭桥接,不论是pve还是物理机安装,目前开启SFE都很稳定。距离上次编译固件已稳定运行30天。所以可能是组件冲突导致内核崩溃重启或者硬件有问题,比如内存。 op1 op2 op3

内核版本可以看出来你的固件编译已经有一些时间了

大兄弟,就算是再新的固件,编译完成再观察两月也变成旧版本固件了,一个月前编译还只是调整增加了ipv6,没有其他变动。所以确切说来这个版本已经稳定运行三个月。以前编译的固件也没有遇到开启SFE导致每天重启问题,我都是默认关闭桥接开启SFE的。

之前的内核版本也正常,就是到101、105后才出现这种情况。不知与开启桥接模式是否有关。

dolphinpaopao commented 3 years ago

我有意测试观察过,对比出问题的配置,我没有编译docker、nwan。lan关闭桥接,不论是pve还是物理机安装,目前开启SFE都很稳定。距离上次编译固件已稳定运行30天。所以可能是组件冲突导致内核崩溃重启或者硬件有问题,比如内存。 op1 op2 op3

我有意测试观察过,对比出问题的配置,我没有编译docker、nwan。lan关闭桥接,不论是pve还是物理机安装,目前开启SFE都很稳定。距离上次编译固件已稳定运行30天。所以可能是组件冲突导致内核崩溃重启或者硬件有问题,比如内存。 op1 op2 op3

我有意测试观察过,对比出问题的配置,我没有编译docker、nwan。lan关闭桥接,不论是pve还是物理机安装,目前开启SFE都很稳定。距离上次编译固件已稳定运行30天。所以可能是组件冲突导致内核崩溃重启或者硬件有问题,比如内存。 op1 op2 op3

内核版本可以看出来你的固件编译已经有一些时间了

大兄弟,就算是再新的固件,编译完成再观察两月也变成旧版本固件了,一个月前编译还只是调整增加了ipv6,没有其他变动。所以确切说来这个版本已经稳定运行三个月。以前编译的固件也没有遇到开启SFE导致每天重启问题,我都是默认关闭桥接开启SFE的。

之前的内核版本也正常,就是到101、105后才出现这种情况。不知与开启桥接模式是否有关。

老早前就有其他人上报出现过SFE重启问题,在我的网络500/50和使用环境(bt下载、远程、游戏和视频)下没有复现,所以可能是使用了不太成熟的组件比如docker,nwan冲突或者开启了有冲突的功能,比如桥接加速,上面明确提示到和vpn/桥接模式可能有冲突。openwrt在x86平台作为路由使用个人感觉设置好后是非常稳定的了,其他平台没用过,印象中驱动问题比较多。

Neverends4 commented 3 years ago

红米2100。之前wifi闭源驱动重启,试了编译开源驱动+sfe,只开启了sfe和ipv6加速,没用bbr,LS说的桥接模式加速也没开,还是随机重启了,开机时间4天多。 版本:OpenWrt R21.2.1 / LuCI Master (git-20.343.54716-6fc079f) 插件: vlmcsd KMS服务器 upnp dns=https-proxy nlbwmon带宽监控 wireguard(应该和这个没关系,之前没加入编译也随机重启) 没有docker,但是有vlan看iptv,不过之前某次重启是午夜,iptv肯定没有用,看起来关系也不大?