之间网

Meta发布四个新的公开AI模型供开发人员使用

生活
导读 Meta基础人工智能研究团队的人工智能研究人员正在向研究人员和开发人员公开提供四种新的人工智能模型,以创建新的应用程序。该团队在arXiv...

Meta基础人工智能研究团队的人工智能研究人员正在向研究人员和开发人员公开提供四种新的人工智能模型,以创建新的应用程序。该团队在arXiv预印本服务器上发布了一篇论文,概述了其中一种新模型JASCO及其用途。

随着人们对AI应用的兴趣日益浓厚,该领域的主要参与者正在创建可供其他实体使用的AI模型,以将AI功能添加到自己的应用程序中。在这项新工作中,Meta团队推出了四种新模型:JASCO、AudioSeal和两个版本的Chameleon。

JASCO的设计目标是接受不同类型的音频输入,并创造出更出色的声音。该团队表示,该模型允许用户调整鼓声、吉他和弦甚至旋律等特性,以创作出一首曲子。该模型还可以接受文本输入,并用它来为曲子增添韵味。

举个例子,要求模型生成一首带有大量低音和鼓点的蓝调曲调。然后,模型会给出关于其他乐器的类似描述。Meta团队还将JASCO与其他设计用于执行相同任务的系统进行了比较,发现JASCO在三个主要指标上的表现都优于它们。

AudioSeal可用于为AI应用生成的语音添加水印,这样一来,结果很容易被识别为人工生成的。他们指出,它还可用于为添加到真实语音中的AI语音片段添加水印,并且它将附带商业许可证。

两个Chameleon模型都将文本转换为视觉描述,并且功能有限。团队指出,7B和34B版本都要求模型能够理解文本和图像。因此,它们可以进行反向处理,例如生成图片说明。

标签: