JASCO、AudioSeal、Chameleon 7B 和 34B:Meta 的人工智能创新四重奏

Meta Fundamental AI 研究团队的研究人员同时宣布发布四种创新模型。

来源:安全实验室新闻频道

Meta Fundamental AI 研究团队的研究人员同时宣布发布四种创新模型。

Meta* 基础人工智能研究团队的研究人员宣布发布四种针对开发人员和研究人员的新人工智能模型。其中包括 JASCO、AudioSeal 和 Chameleon 模型的两个版本。最引人注目的例子之一是 JASCO 模型,在 arXiv 服务器上的一篇文章中详细描述了该模型。

告诉

JASCO:改善声音并创造旋律

JASCO 模型能够分析各种录音并提高其质量。用户将能够自定义单个乐器的声音,例如鼓、低音吉他,甚至旋律。此外,JASCO可以根据文本描述从头开始生成音乐。例如,您可以要求模型创作一首具有强劲低音和鼓声的布鲁斯歌曲,然后详细说明其他乐器的声音。 Meta* 的研究人员将 JASCO 与类似系统进行比较,发现他们的设计在三个关键领域优于竞争对手。

JASCO

AudioSeal:标记人工生成的语音

AudioSeal模型旨在为AI应用程序生成的语音添加水印,从而轻松识别人工生成的内容。 AudioSeal 还可用于标记添加到真实语音中的人工语音片段。该模型将在商业许可下提供,这扩大了其在各种商业项目中使用的可能性。

Chameleon:将文本转换为视觉效果

两种 Chameleon 型号 7B 和 34B 旨在将文本转换为视觉图像,并且功能有限。该团队指出,在 7B 和 34B 这两个版本中,模型必须能够理解文本和图像。因此,他们可以执行逆向处理,例如为图像生成标题。

文本