首页 / 芯片半导体 / 正文

AMD发布的EPYC 7002 “Rome”服务器芯片指南中承认了由于时钟倒计时器存在BUG,导致第二代EPYC芯片正常运行1044天后出现内核卡死情况。 该芯片的时钟倒计时器存在Bug,该芯片每正常运行1044天,都将出现内核卡死,也就是说,每隔2.93年,采用该芯片的服务器都必须重新启动一次。

AMD在指南中表示,导致这个问题的原因是内核无法脱离CC6省电模式(Core C6 State),进入该模式之后,会降低电压和时钟频率。 需要注意的是,AMD方面表示,这一Bug将不会进行修复,也没有给出定期重启以外的解决方案。 国外科技媒体technewsspace认为理由要么是修复成本太高,要么是受影响用户规模不大。

如果你的服务器使用EPYC Roma芯片并且正常运行已经接近或超过1044天,可能需要考虑重新启动服务器以避免出现内核卡死的问题。按照AMD的建议,每隔2.93年(约为1044天)重新启动一次服务器可能是一个解决方法。 如果你是受影响的用户,你也可以联系AMD或服务器制造商以获取更多的支持和建议。他们可能会提供特定的操作指南或替代解决方案来减轻这个问题的影响。

Reddit用户acid_migrain经过详细的演算,认为实际导致卡死的时间并非1044天,而是1042天12个小时。

在该问题中,内核无法脱离CC6省电模式(Core C6 State),进入该模式之后,会降低电压和时钟频率,这是导致问题的主要原因。

此问题可能是由于芯片设计中的错误所致。 AMD表示没有计划修复该漏洞,TechNewsSpace认为理由要么是修复成本太高,要么是受影响用户规模不大。

如有侵权请及时联系我们处理,转载请注明出处来自