边玩游戏边跑大模型!AMD RX 7900 GRE首次实现DX12+ROCm双任务并发
AMD RX 7900 GRE突破极限!DX12游戏与AI推理首次无冲突并发,GitHub开源补丁让A卡玩家边玩《彩虹六号》边跑大模型,稳定不崩溃,显存占用仅9.5GB。
AMD显卡用户在Windows系统下试图同时运行AI推理和大型DX12游戏时,显卡常因驱动级资源冲突崩溃,错误代码为exit code 2或0xc0000005。这一困扰开发者数年的局面,近日被GitHub用户Beat-k通过开源项目彻底解决。
该开发者通过GitHub开源项目BEA_ROCm发布补丁方案,在Radeon RX 7900 GRE显卡上首次实现了DX12游戏与ROCm AI推理的无冲突并发。
同时,他排查出导致崩溃的多层原因,包括Flash Attention KV缓冲区布局解析差异、SDMA引擎队列冲突、显存过度分配、AMD AGS库与Adrenalin驱动冲突,以及驱动遥测模块对内核调度的破坏。

需要指出的是,这些Bug存在层级依赖的堵塞效应,必须按顺序逐个解决才能暴露下一层问题。
修复方案采用双层补丁架构。第一层通过环境变量补丁集在ROCm子进程启动前应用环境变量预置修复。
第二层向llama.cpp提交35行C++补丁,针对gfx1100架构进行Windows ROCm的流同步与Flash Attention门控处理。
实测结果显示,修复方案通过了10轮《彩虹六号:围攻》DX12游戏+Ollama 7B模型推理的压力测试,游戏全程无一崩溃。
AI推理平均延迟12.2秒,显存占用稳定在9.5GB,DX12负载在6轮游戏中保持饱和。
SDK已开源,上游PR准备就绪,并已通过第三方在gfx1101/Ubuntu平台完成交叉验证。
这表示A卡用户终于可以在游戏的同时自由使用本地AI,也为RDNA 3全系显卡在Windows平台上的AI+图形多任务解锁了系统级的通用修复路径。

- 1王祖贤致天下少侠:期待相遇于大荒!18周年专属问候请查收
- 2光影细节拉满!国产虚幻5大作《诡秘之主》全新实机视频曝光
- 3取消点卡,《逆水寒》想给经典MMO一个新答案?
- 4人宠合一!《伊莫》实机曝光,抓宠开放世界终于有新活了
- 5等了十年!《彩虹六号》国服终于开测,这十年到底卡在哪?
- 6《三国杀》IP首款战棋游戏《三国杀:天命棋局》6月18日开启测试
- 7离了大谱的网游!《Sol: Enchant》吹过的牛逼到底有多牛逼?
- 8狂卖1600万份后,《弧光猎人》是怎么理解“撤离射击”这个品类的?
- 9《无冕余烬》流放之路+方舟?从养成内核到后续游玩搬砖评估!
- 10韩国像素MMO新作《鬼怪世界》公开世界观,预约7月开启

