双子座扩散:Google DeepMind的新文本扩散模型

双子座扩散是由Google DeepMind开发的实验文本扩散模型,它代表了语言建模方面的重要一步。双子座扩散与传统模型(例如自回归语言模型)之间的区别在于文本的生成方式。尽管这些传统模型为单词构建文本单词,但双子座扩散使用了一种方法,其中它以随机的“噪声”开头,并逐渐[…] Gemini扩散:Google DeepMind的新文本扩散模型首次出现在AI新闻上。

来源:AI新闻

双子座扩散是由Google DeepMind开发的实验文本扩散模型,它代表了语言建模方面的重要一步。双子座扩散与传统模型(例如自回归语言模型)之间的区别在于文本的生成方式。

双子座扩散

尽管这些传统模型为单词构建文本,而双子座扩散使用了一种方法,该方法以随机的“噪声”开头,并逐渐将其完善为相干的文本或代码。这意味着该模型可以在整个过程中迭代并纠正错误,这使其对于处理需要编辑的数据特别有力。

速度:据说双子座的扩散速度明显快于以前的模型,并且能够每秒产生约1479个令牌。尽管有一定的初始潜伏期(约0.84秒),但可能会比相应的自回旋模型快4-5倍的速度可能是可能的。

速度

阅读有关扩散模型的更多信息:

专家声明:许多专家注意到扩散技术可能必须改变AI的景观的潜力。一位专家评论说,这项技术允许在每个改进步骤中考虑整个上下文的更全面方法,这使得更容易纠正顺序词生成中经常发生的错误类型。

您如何测试双子座扩散?

尽管Gemini扩散目前处于实验阶段,对有兴趣测试它的开发人员提供了等待列表,但许多人指出,这种类型的模型可以通过以前无法使用的方式结合速度和定性文本生产来彻底改变AI应用程序。

更多信息:

deepmind-gemini扩散