Nvidia正准备发布另一款针对中国的GPUSKU,旨在遵守美国出口法规。路透社的消息人士透露,Nvidia的最新GPU将是BlackwellB200的一个分支,后者是Nvidia迄今为止最快的AIGPU。该GPU预计将于明年推出,但规格仍是一个悬而未决的问题。
这款新暂定名为“B20”,将由Nvidia在该地区的主要合作伙伴之一浪潮在中国各地分销。据报道,B20将于2025年第二季度正式亮相。
目前,关于经过阉割的BlackwellGPU的规格完全未知,但B20似乎不可避免地将成为入门级部件——与拥有业界领先AI性能的B200形成鲜明对比。美国对中国GPU出口有严格的性能规定,使用一种称为“总处理能力”(TPP)的指标,该指标考虑了GPU计算能力的TFLOPS数量和精度。具体来说,将TFLOPS(不考虑稀疏性)乘以位精度即可得到TPP。
当前限制设定为4,800TPP。作为参考,HopperH100和H200远远超过了这个标准,两个GPU上都是16,000TPP——该指标并不直接考虑内存带宽或容量,而这两者是H200带来的主要改进。甚至RTX4090也凭借660.6TFLOPS的FP8计算能力超过了限制。在4,800TPP限制内最强大的Nvidia桌面GPU是RTX4090D,它是专门为遵守出口限制而制造的。Blackwell
提高了计算性能的标准,双解决方案可能产生约4,500TFLOPS的FP8计算能力。这将使其成为允许限制的7.5倍。即使是性能较弱的B100也能提供3.5PFLOPS的密集FP8计算,即28,000TPP。B20
还面临额外的限制,因为美国还实施了专门针对数据中心GPU的“性能密度”(PD)限制(消费级GPU不受此限制)。将TPP得分除以尺寸可得到PD指标;任何超过6.0的值都会受到限制。使用该指标,每个RTX40系列GPU都将被限制用于数据中心,而Blackwell的密度和性能应该会超过AdaLovelace。因此,为了遵守规定,Nvidia将需要严重限制B20的性能和/或使用相应更大的。(我们仍然不知道已经发布的B200的确切尺寸。)