Open Fearyncess opened 11 months ago
我也遇到了类似问题
附带两份日志:
3a6000-evb-rx590-aosc-6.7.0-amdgpu-dmesg.log 3a6000-evb-rx590-aosc-6.7.0-amdgpu-dmesg-2.log
参考:https://bbs.loongarch.org/d/327-amdgpu/4
[LiarOnce](https://bbs.loongarch.org/u/451)
19 天前
已编辑
目前更新了 https://github.com/loongson/Firmware/tree/main/6000Series/PC/XA61200 的固件然后关闭 DPM 运行就正常了
内核参数参考:
GRUB_CMDLINE_LINUX="radeon.cik_support=0 radeon.si_support=0 amdgpu.cik_support=1 amdgpu.si_support=1 amdgpu.sg_display=0 amdgpu.runpm=0 amdgpu.dpm=0"
参考:https://bbs.loongarch.org/d/327-amdgpu/4
[LiarOnce](https://bbs.loongarch.org/u/451) 19 天前 已编辑 目前更新了 https://github.com/loongson/Firmware/tree/main/6000Series/PC/XA61200 的固件然后关闭 DPM 运行就正常了 内核参数参考: GRUB_CMDLINE_LINUX="radeon.cik_support=0 radeon.si_support=0 amdgpu.cik_support=1 amdgpu.si_support=1 amdgpu.sg_display=0 amdgpu.runpm=0 amdgpu.dpm=0"
@phorcys 如果关闭DPM,那么显卡将不会自动调频,这会导致gpu工作频率降低
参考:https://bbs.loongarch.org/d/327-amdgpu/4
[LiarOnce](https://bbs.loongarch.org/u/451) 19 天前 已编辑 目前更新了 https://github.com/loongson/Firmware/tree/main/6000Series/PC/XA61200 的固件然后关闭 DPM 运行就正常了 内核参数参考: GRUB_CMDLINE_LINUX="radeon.cik_support=0 radeon.si_support=0 amdgpu.cik_support=1 amdgpu.si_support=1 amdgpu.sg_display=0 amdgpu.runpm=0 amdgpu.dpm=0"
我加上这一串参数后,感觉显示变卡了。
参考:https://bbs.loongarch.org/d/327-amdgpu/4
[LiarOnce](https://bbs.loongarch.org/u/451) 19 天前 已编辑 目前更新了 https://github.com/loongson/Firmware/tree/main/6000Series/PC/XA61200 的固件然后关闭 DPM 运行就正常了 内核参数参考: GRUB_CMDLINE_LINUX="radeon.cik_support=0 radeon.si_support=0 amdgpu.cik_support=1 amdgpu.si_support=1 amdgpu.sg_display=0 amdgpu.runpm=0 amdgpu.dpm=0"
我加上这一串参数后,感觉显示变卡了。
这个问题就是越快,越高级的卡越容易发生,一切能让卡变慢的方法都能降低概率。
对于RX550这样的北极星架构的卡其实是不太建议用我的这个内核参数的,这些参数对GCN 1.0/2.0架构生效,因为我使用的是一块R5 340 (GCN 1.0 Oland)的显卡。
过几天我会买一块RX560的显卡继续测试一下
如今这事终于是确定了。
其实并没有,我自己一开始的测试发现到后来有一些旗舰性能gcn显卡用户的测试结果,表明了这个问题从7A桥片出现到现在,一直都是存在的。并且根据一些不太适宜公开的讨论以及chenhuacai老师的补丁提交信息(详见https://github.com/chenhuacai/linux/commit/741913c04d00072229330fe51862730339935fb4 ),可以得出这个问题无法在7A桥片上被彻底解决,只能尽可能做mitigation以降低问题出现的概率。
发件人: dg1vg4 @.> 发送时间: 2024年6月27日 22:32 收件人: loongson/Firmware @.> 抄送: Lain Yang @.>; Author @.> 主题: Re: [loongson/Firmware] XA61200主板上搭配RX550独显出现cpu死锁现象 (Issue #83)
如今这事终于是确定了。
― Reply to this email directly, view it on GitHubhttps://github.com/loongson/Firmware/issues/83#issuecomment-2194893549, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AMXLODSIKYO2KG3PI6OLCULZJQPAXAVCNFSM6AAAAABASPBOSWVHI2DSMVQWIX3LMV43OSLTON2WKQ3PNVWWK3TUHMZDCOJUHA4TGNJUHE. You are receiving this because you authored the thread.Message ID: @.***>
故障触发条件:在未设置其他额外amdgpu相关参数的情况下,在firefox内调用amdgpu驱动提供的VAAPI硬解接口,较长时间(3分钟到10分钟不等)持续播放任意高码率H264视频(未超出rx550硬解单元处理能力范围)。 后使用
amdgpu.pcie_gen_cap=0x00020002
参数强制锁定显卡仅使用PCIe2.0速率,该问题不再出现。故障症状:图形界面死锁,其中一个cpu核心死锁,看门狗当机,键盘鼠标操作均无反应。
故障固件:UDK2018_3A6000-7A2000_Desktop_EVB_V4.0.05636-stable202311_support_fastboot_rel.fd
如何复现故障:
死锁时的journalctl日志