详细内容或原文请订阅后点击阅览
适合非英语国家的人工智能图像生成器
尽管文本到图像的生成正在迅速发展,但这些人工智能模型大多以英语为中心。这加剧了非英语国家的数字不平等。阿姆斯特丹大学理学院的研究人员创建了 NeoBabel,这是一种可以使用六种不同语言运行的人工智能图像生成器。通过将其研究的所有元素开源,任何人都可以在 [...]
来源:ΑΙhub尽管文本到图像的生成正在迅速发展,但这些人工智能模型大多以英语为中心。这加剧了非英语国家的数字不平等。阿姆斯特丹大学理学院的研究人员创建了 NeoBabel,这是一种可以使用六种不同语言运行的人工智能图像生成器。通过将研究的所有要素开源,任何人都可以在该模型的基础上进行构建,并帮助推动包容性人工智能研究。
当您使用 AI 生成图像时,如果提示是英文,结果通常会更好。这是因为许多人工智能模型的核心都是英语:如果您使用其他语言,则在创建图像之前您的提示会被翻译成英语。然而,世界上大多数人的母语不是英语,这使他们处于不利地位。
同时,文本到文本生成器可以流利地说 200 多种语言。这就是为什么 UvA 信息学研究所的研究人员与专门从事文本生成的公司 Cohere 实验室合作。研究团队在这些文本生成器中集成了图像生成系统,创建了先进的多语言图像生成器。该图像生成器名为 NeoBabel,目前支持六种语言:英语、法语、荷兰语、中文、印地语和波斯语。
完全开源
大多数图像生成模型都是由几家美国大公司构建的,他们很少透露其模型的所有细节。 NeoBabel 研究团队成员、计算机科学正教授 Cees Snoek 表示:“通常,大部分工作都是闭源的,因此我们无法确切地看到模型是如何工作的。我们不知道数据是否存在偏差、系统是如何创建的以及如何改进。这违背了我们的学术原则。”
一张桌子和一只熊
提示要求用荷兰语提供一张桌子和一只熊的图像。在荷兰语中,熊是“啤酒”,这让大多数图像生成器感到困惑。
走向视频
了解更多
阿姆斯特丹大学
