之间网

RaspberryPi5补丁通过NUMA仿真将性能提升高达18%

科技前沿
导读 Igalia是一家免费软件咨询公司,其最出名的可能是其在RaspberryPi的GPU方面的工作,该公司透露,它正在研究ARM64设备的NUMA(非统一内存访问...

Igalia是一家免费软件咨询公司,其最出名的可能是其在RaspberryPi的GPU方面的工作,该公司透露,它正在研究ARM64设备的NUMA(非统一内存访问)仿真。到目前为止,这些调查已经为RaspberryPi5带来了潜在的显著性能提升,TvrtkoUrsulin在Linux内核列表中通过一条消息讨论了这一点。

补丁详细信息已发布到邮件列表中,看起来大约有100行。然而,这100行可能会对RaspberryPi5和许多其他ARM64设备产生重大影响。

根据帖子。“该系列添加了一个非常简单的NUMA仿真实现,并允许在arm64平台上选择它。”

这可将单核性能提高6%,将多核性能提高约18%。这些数字是使用Geekbench6测试运行确定的。

Ursulin更深入地解释道:“[...]将物理RAM分成块并利用交错等分配策略可以使BCM2721内存控制器更好地利用物理内存组织中的并行性。”

这对RaspberryPi5意味着什么?性能已经很强大的2.4GHzArmCPU总体上表现更佳,可以轻松超频至3GHz或更高。

该代码已提交审查,如果运气好并经过Linux内核开发人员的努力,这个补丁可以为RaspberryPi5和许多其他ARM64设备提升更多性能。

NUMA模拟主要用于具有多个处理器的系统,是一种计算机内存设计,其中内存访问时间取决于相对于处理器的内存位置。简而言之,NUMA允许每个CPU拥有自己的本地连接内存组,同时仍然可以访问直接连接到系统中其他处理器的内存。这会导致“近”内存(本地连接)的延迟较快,但“远”内存(直接连接到系统中其他处理器的内存)的延迟稍慢。

Linux内核文档页面在Linux软件堆栈方面对NUMA进行了更深入的介绍。“Linux将系统的硬件资源划分为多个称为“节点”的软件抽象。Linux将节点映射到硬件平台的物理单元上,抽象出某些架构的一些细节。与物理单元一样,软件节点可能包含0个或更多CPU、内存和/或IO总线。同样,与访问更远的单元相比,对“更近”节点(映射到更近单元的节点)上的内存的访问通常会经历更快的访问时间和更高的有效带宽。”

该补丁声称,“代码非常简单,可以使用新的NUMA_EMULATIONKconfig选项启用新功能,然后在运行时使用现有的(与其他平台共享)numa=fake=内核启动参数。”

我们将对此进行调查,看看是否可以重现Igalia的结果。

标签: