详细内容或原文请订阅后点击阅览
使用人工智能创建“逼真的说话头像”
由南洋理工大学 (NTU) 副教授卢世建领导的研究小组开发了一种计算机程序,可以创建一个人说话时的面部表情和头部动作的逼真视频。这仅需要录音和面部照片。
来源:Robogeek新闻频道(关于机器人技术的俄罗斯与世界新闻)由南洋理工大学 (NTU) 副教授卢世建领导的研究小组开发了一种计算机程序,可以创建一个人说话时的面部表情和头部动作的逼真视频。这仅需要录音和面部照片。
多样化而逼真的面部动画 (DIRFA) 是一款基于人工智能的软件,在收到录音和照片后,会创建一个虚拟人物的 3D 视频,展示逼真且一致的面部动画,并与语音同步。据报道,该计划的效果优于现有的在姿势改变和情绪控制方面存在问题的方法。为此,该团队使用来自开放数据库的超过 100 万个视听片段(涉及 6000 多人)对 DIRFA 进行了训练,以预测语音信号并将其与面部表情和头部运动相关联。
研究人员预计 DIRFA 将能够在包括医疗保健在内的各个行业和领域找到新的应用,因为它可以创建更复杂、更真实的虚拟助手。对于有言语障碍的人来说,它也可以是一个有用的工具,帮助他们通过富有表现力的化身或数字表示来表达他们的想法和情感,从而增强他们的沟通能力。
“我们的研究的影响可能是深远的,因为它通过结合人工智能和机器学习等技术来创建高度逼真的人们说话视频,彻底改变了多媒体通信领域,”石建副教授说“我们的程序还建立在以前的研究基础上,代表了技术的进步,因为用我们的软件创建的视频通过精确的嘴唇动作、强大的面部表情和自然的头部姿势得到了增强,仅使用它们的音频和静态图像。”
音频驱动的说话脸部生成,具有多样化但逼真的面部动画视频