华盛顿大学研究人员创建了 PaperTok,这是一个人工智能系统,可帮助用户将研究论文转化为引人入胜的短视频

华盛顿大学团队开发了一款 AI 工具,可以帮助用户将研究论文转化为 45 秒的视频。研究人员将一篇论文上传到该工具,该工具使用 Google Gemini 编写一个简短的脚本来解释该论文。然后,研究人员可以迭代编辑文字记录和生成的视频剪辑。

来源:华盛顿大学

最近,华盛顿大学亲社会计算小组的学生注意到社交媒体上的一个趋势:人们正在使用生成式人工智能制作科学短视频。问题在于这些人不是科学家,考虑到人工智能容易犯错误,这可能会加速错误信息的传播。因此该实验室想知道如何让科学家和其他研究人员更好地适应 TikTok 这样的平台。

“另一种选择是,在没有科学家的情况下谈论科学,”共同主要作者 Meziah Ruby Cristobal 说道,他是威斯康星大学以人为本的设计和工程专业的博士生。

这些讨论促使团队构建了 PaperTok,这是一种人工智能工具,可以帮助用户将研究论文转化为 45 秒的视频。研究人员将一篇论文上传到该工具,该工具使用 Google Gemini 编写一个简短的脚本来解释该论文。然后,研究人员可以迭代编辑文字记录和生成的视频剪辑。

该团队于 4 月 17 日在巴塞罗那举行的计算机协会计算机系统人为因素会议上展示了其研究成果。

“出于多种原因,大多数人不阅读研究论文,”资深作者、华盛顿大学以人为本的设计和工程教授加里·谢 (Gary Hsieh) 说。 “我在阅读不熟悉领域的论文时仍然面临挑战。因此,我们希望找到一种方法来快速将论文转变为外行人愿意参与的格式,并且我们想研究他们如何参与其中。”

目前,PaperTok 仅供付费 Google Gemini 订阅的用户使用。这些用户可以访问 PaperTok 网站并上传研究论文。然后,系统会提供四个选项来用作视频中的挂钩。例如,PaperTok 上的一个 PaperTok 视频开头是这样的:“阅读一篇厚重的学术论文是否会不知所措?”

欲了解更多信息,请联系 Hsieh(garyhs@uw.edu)、Shin(dhoon@uw.edu)和 Cristobal(meziah@uw.edu)。