详细内容或原文请订阅后点击阅览
ruDALL-E神经网络现在可以根据外语描述生成图片
开放神经网络 ruDALL-E 的网站可以根据文本描述生成图像,现在不仅可以处理俄语文本,还可以处理其他语言的文本。在 Salut 移动应用程序和 Sber 设备上,您甚至可以通过语音请求创建图片;您可以在其中尝试该模型的演示网站也已收到英文翻译。
来源:Robogeek新闻频道(关于机器人技术的俄罗斯与世界新闻)开放神经网络 ruDALL-E 的网站可以根据文本描述生成图像,现在不仅可以处理俄语文本,还可以处理其他语言的文本。在 Salut 移动应用程序和 Sber 设备上,您甚至可以通过语音请求创建图片;您可以在其中尝试该模型的演示网站也已收到英文翻译。
自 ruDALL-E 发布以来的一周内,世界各地的用户已经使用 ruDALL-E 生成了超过 300 万张图像,使用各种机器翻译系统生成俄语查询,现在将能够进行英语和其他语言的查询。输入文本时,模型独立判断输入语言并生成相应的图像。
ruDALL-E创建 ruDALL-E 的原型是英语语言的 DALL-E 神经网络,由 OpenAI 于 2021 年首次提出。与此同时,一家美国公司的研究人员并没有公开该模型,仅限于对架构的一般描述和一组令人印象深刻的手工选择的模型运行示例。基于 OpenAI 出版物,SberDevices 和 Sber AI 团队在 SberCloud 的协助下,创建了类似的解决方案,并在基于 Christofari 超级计算机的 ML Space 平台上启动了神经网络训练,在俄语方面获得了类似的结果,后来又在多语言版本。
该模型有两个版本:ruDALL-E XL(包含 13 亿个参数)和 ruDALL-E XXL(包含 120 亿个参数)。较小的功能可以通过从 Github 和 Hugging Face 下载来免费使用。这两个模型也可以在 SberCloud 的预训练模型和数据集的 DataHub 中心的 ML Space 中找到。