英伟达提醒:尽快激活ECC缓解措施,防范显卡Rowhammer攻击

AI世纪 2025-07-13
存储 2025-07-13

7 月 12 日消息,科技媒体 昨日(7 月 11 日)发布博文,报道称英伟达已提醒用户,尽快激活系统级错误纠正码(ECC)缓解措施,从而保护采用 GDDR6 显存的显卡,防范 攻击。

援引博文介绍, 是一种硬件故障,可以通过软件方式触发,其原因在于显存颗粒距离过近。该攻击方式最初针对 DRAM,但实测也影响显存。

攻击者在获取足够的读写操作后,访问显存行,控制相邻数据位在 1 和 0 之间变换,从而改变显存中的信息,可能导致服务拒绝、数据损坏甚至权限提升等。

系统级错误纠正码ECC启用方法_英伟达GDDR6显卡Rowhammer攻击_GDDR

英伟达GDDR6显卡Rowhammer攻击_系统级错误纠正码ECC启用方法_GDDR

英伟达GDDR6显卡Rowhammer攻击_GDDR_系统级错误纠正码ECC启用方法

英伟达推荐用户启用系统级错误纠正码(ECC),通过添加冗余位来保持数据的完整性,纠正个位错误,以维护数据的可靠性和准确性。

在工作站和数据中心 GPU 中,VRAM 处理大量数据集和与 AI 工作负载相关的精确计算,必须启用 ECC 以防止关键错误。

的安全通知指出,多伦多大学的研究人员展示了“针对未启用系统级 ECC 的 A6000 GPU 带有 GDDR6 内存的潜在 攻击”,这些学者开发了一种名为 的攻击方法,用于翻转 GPU 内存的位。

尽管与基于 CPU 的 DDR4 相比,GDDR6 的延迟更高、刷新速度更快,使得对 GDDR6 的攻击更加困难,但研究人员还是证明了在 GPU 内存银行上实施 攻击是可能的。

英伟达表示,除了 RTX A6000 之外,推荐以下产品启用系统级 ECC:

数据中心 GPU:

工作站 GPU:

嵌入式 / 工业 GPU:

英伟达表示,像 RTX 50 系列()、 数据中心 GB200、B200、B100 以及 数据中心 H100、H200、H20 和 GH200 这样的新型 GPU,内置了芯片级 ECC 保护,无需用户干预。