人工智能初创公司Etched发布了用于人工智能的搜狐ASIC,声称它比NVIDIA的下一代BlackwellB200GPU速度更快、价格更便宜。
Etched押下“人工智能领域最大赌注”,推出搭载Transformer引擎的搜狐ASIC,业绩可观
并不是每天都会有公司出现并在AI计算性能方面挑战NVIDIA之类的公司,但看起来Etched可能会这样做。
该公司目前依赖于“TransformerEngine”,这是OpenAI的ChatGPT和Meta的LlamaLLMAI模型中使用的神经网络架构。然而,他们决定更进一步,推出一款名为Sohu的专用ASIC机器,其唯一目的是为客户提供一种据称比NVIDIA的Blackwell快10倍、比NVIDIA的HopperAIGPU快20倍的选择。
Etched的这些言论确实有些大胆,他们也有一些基准来支持这些言论。该公司表示,一个搜狐ASIC每秒可以处理超过500,000个Llama70B代币,相当于160个NVIDAH100。
除此之外,搜狐还可以为现有的每一种现代AI模型提供服务,无论是Meta的Llama还是谷歌的Anthropic,而且该团队表示,他们也可以针对进一步的集成做出调整,确保ASIC的广泛采用。
“压缩FLOPS”是搜狐最擅长的,该公司透露,他们的ASIC已成功实现令人印象深刻的90%利用率,是市场水平的两倍。Etched通过将更大比例的晶体管专门用于变压器来实现这一目标,而NVIDIA等其他公司则更注重可编程性,这就是为什么他们的生态系统无法像搜狐那样压缩FLOPS。