之间网

ChatGPT迎来了新的强大对手Anthropic声称其Claude3AI击败了它

科技前沿
导读 人工智能公司Anthropic正在预览其新的Claude3模型系列,该公司声称该模型在多个基准测试中可以胜过谷歌的Gemini和OpenAI的ChatGPT。这组由...

人工智能公司Anthropic正在预览其新的Claude3模型“系列”,该公司声称该模型在多个基准测试中可以胜过谷歌的Gemini和OpenAI的ChatGPT。

这组由三款“能力”各异的人工智能组成。Claude3Haiku位居末位,其次是Claude3Sonnet,而Claude3Opus则位居榜首。Anthropic称,这三款人工智能由于其多模态性、更高的准确度、对上下文的更好理解和速度,在各方面都表现出“强大的性能”。这三款人工智能的另一个值得注意的地方是,它们更愿意回答棘手的问题。

Anthropic解释称,老版本的Claude有时会拒绝回答超出安全范围的提示。现在,Claude3系列将采用更细致的响应方式,让它们能够回答这些棘手的问题。

尽管性能全面提升,但大部分公告都强调Opus在所有这些领域都是最好的。他们甚至说该模型“展现出接近人类水平的理解能力……[对于]复杂任务”。

为了测试它,Anthropic对Opus进行了“大海捞针”或NIAH评估,以了解它能够多好地回忆数据。事实证明,它相当不错,因为人工智能可以几乎完美地记住信息。该公司继续声称Opus非常聪明,能够解决数学问题、生成计算机代码,并表现出比GPT-4更好的推理能力。

这项技术并非完美无缺。尽管Anthropic声称他们的人工智能已经提高了准确性,但幻觉问题仍然存在。模型产生的响应可能包含错误信息,尽管与Claude2.1相比,这种情况大大减少。此外,Opus在回答问题时速度与Claude2相当,但速度有点慢。

当然,这并不是说Haiku或Sonnet不如Opus,因为它们有特定的用例。例如,Haiku擅长快速回复和“从非结构化数据中”获取信息。此外,它在回答数学问题方面不如Opus。Sonnet是一种更大规模的模型,旨在帮助人们节省琐碎任务的时间,甚至可以解析“来自图像的文本”,而Opus则是大规模操作的理想选择。

标签: