详细内容或原文请订阅后点击阅览
科学家使用 IBM 量子计算机训练了一个 AI 模型 - 它正确地回答了基本模型无法回答的问题
当通过量子计算机运行人工智能模型时,科学家仅通过添加相对少量的参数就提高了准确性。
来源:LiveScience研究人员开发出一种方法,通过利用量子计算机的力量来减少人工智能 (AI) 系统的不确定性。他们表示,他们的工作代表了在生产规模、预训练的大型语言模型(LLM)中“量子增强”的首次演示。
用于衡量 AI 系统(例如 Anthropic 的 Claude、OpenAI 的 ChatGPT 和类似服务)质量和功能的关键指标之一是一个称为“困惑度”的单位,通常表示为 PPL。这衡量了系统正确预测句子或单词序列中下一个单词的一般能力。
具有低 PPL 的系统被认为能够更好地预测下一个单词,而具有高 PPL 的系统在数学上更有可能产生不稳定的输出。有多种方法可以减少大型 AI 模型中的 PPL,包括微调、在更大的数据集上进行训练以及添加参数。
例如,GPT-5.5 估计有 2 万亿到 5 万亿个参数。在所有标准法学硕士中,每个参数都会占用系统内存中的空间,这意味着随着这些模型变得更大、能力更强,它们需要越来越大的基础设施。
但多元宇宙计算公司的科学家们已经找到了扩大人工智能基础设施规模的替代方案。在 5 月 7 日上传到 arXiv 预印本数据库的一项新研究中,他们提出,人工智能模型中参数数量相对较小的增加可以显着降低使用量子电路块(量子计算的基本单位)运行模型时的困惑度。
量子增强人工智能向前迈进了一步
在这项研究中,研究人员创建并执行了称为凯莱参数化单一适配器 (CUA) 的量子电路块。
将世界上最迷人的发现直接发送到您的收件箱。
IBM 公布了到 2029 年建造世界上第一台容错量子计算机 Starling 的计划。
(图片来源:IBM)
