OpenAI 和 Jony Ive 的语音优先 AI 设备面临重大延迟——隐私、个性和计算障碍,2026 年发布陷入停滞

据 Windows Central 报道,Sam Altman 和设计师 Jony Ive 之间大肆宣传的 AI 硬件项目面临严重延迟,目前预计在 2026 年之后发布。这种无屏幕、始终在线的语音伴侣旨在重新定义人类与人工智能的交互,但隐私问题、计算需求,甚至如何赋予它“个性”都减缓了开发速度。在幕后,OpenAI 让语音听起来真正像人类的雄心壮志与技术和道德限制发生了冲突。据传,这款设备将 Jony Ive 的苹果时代设计的温暖与 OpenAI 的对话能力融为一体,但它也遇到了与其他人在这个领域遇到的同样的紧张局势。 [...]

来源:AI 2 People

据 Windows Central 报道,Sam Altman 和设计师 Jony Ive 之间大肆宣传的 AI 硬件项目面临严重延迟,目前预计在 2026 年之后发布。

2026 年之后 Windows 中心

无屏幕、始终在线的语音伴侣旨在重新定义人类与人工智能的交互,但隐私问题、计算需求,甚至如何赋予它“个性”都减缓了开发速度。

在幕后,OpenAI 让语音听起来真正像人类的雄心壮志与技术和道德限制发生了冲突。

据传,这款设备将 Jony Ive 的苹果时代设计的温暖与 OpenAI 的对话能力融为一体,但它也遇到了与其他人在这个领域遇到的同样的紧张局势。

例如,Anthropic 的 Claude Voice 测试版已经在测试类似的领域,尝试在语气中表达同理心,但仍在努力避免奇怪的反应。

Sam Altman 表示,他希望助手“感觉像是一个存在,而不是一个工具”,但当人工智能声音越来越难以与人类声音区分开时,这就很棘手。

最近的《Live Science》报告发现,在 58% 的试验中,人们错误地识别了克隆声音——本质上就像是抛硬币一样。

最近的 Live Science 报告

想象一下,对于一款设计用于在家中持续监听的设备来说,这会让隐私变得多么复杂。

当 OpenAI 解决计算和字符挑战时,其他科技巨头正在向前推进。

亚马逊最新的 Echo 型号刚刚推出了新的自适应人工智能语音,可以根据用户情绪改变语气。

与此同时,谷歌的 DeepMind 团队正在推动 WaveFit 2,这是一种下一代语音模型,可以克隆具有精确语调和节奏的口音。现实主义的门槛不断提高,风险也不断提高。

WaveFit 2

就我个人而言,我认为这种延迟可能因祸得福。我们已经看到了当语音技术推出时会发生什么——尴尬的音调变化、隐私问题、当你的助手听起来有点太有感情时偶尔会产生的生存恐惧。

也是