详细内容或原文请订阅后点击阅览
耳塞中的微型摄像头让用户可以与 AI 谈论他们所看到的内容
华盛顿大学的研究人员开发了一种名为 VueBuds 的系统,该系统使用现成的无线耳塞中的微型摄像头,让用户能够与人工智能模型谈论他们面前的场景。例如,用户可能会看着韩国食品包装并说:“嘿 VueBuds,帮我翻译一下。”然后他们会听到人工智能声音说:“可见的文字翻译成英语是‘冷面’。
来源:华盛顿大学华盛顿大学的研究人员开发了第一个系统,该系统在现成的无线耳塞中集成了微型摄像头,使用户能够与人工智能模型谈论他们面前的场景。例如,用户可能会转向韩国食品包装并说:“嘿 Vue,帮我翻译一下。”然后他们会听到人工智能的声音说:“可见的文字翻译成英语是‘冷面’。”
名为 VueBuds 的原型系统可以拍摄低分辨率的黑白图像,然后通过蓝牙将图像传输到手机或其他附近的设备。然后,设备上的小型人工智能模型会在一秒钟左右回答有关图像的问题。为了隐私,所有处理都在设备上进行,系统录制时小灯会亮起,用户可以立即删除图像。
该团队将于 4 月 14 日在巴塞罗那举行的计算机协会计算机系统人为因素会议上展示其研究成果。
“我们还没有看到大多数人采用智能眼镜或 VR 耳机,部分原因是很多人不喜欢戴眼镜,而且它们常常会带来隐私问题,比如录制高分辨率视频并在云端处理,”资深作者、华盛顿大学保罗·G·艾伦计算机科学与工程学院教授 Shyam Gollakota 说。 “但几乎每个人都已经佩戴了耳塞,因此我们想看看是否可以将视觉智能放入微型、低功耗的耳塞中,并在此过程中解决隐私问题。”
摄像头比耳塞中已有的麦克风消耗更多电量,因此使用与智能眼镜中相同类型的高分辨率摄像头是行不通的。此外,大量信息无法通过蓝牙连续传输,因此系统无法运行连续视频。
该团队发现,使用低功耗相机(大约一粒米大小)拍摄低分辨率的黑白静态图像可以限制电池消耗,并允许蓝牙传输,同时保持性能。
