对我们所有的毕业生和即将到来的CGCA成员来说,最热烈的问候!我将在最近的晚宴上见到你们中的一些人,在本期其他地方的Colin Kerr的文章中,我们将听到更多的声音。这是我将记住的事件,并且出于所有正确的原因!当我为IE最新一期的IE写这篇注释时,我对人工智能(AI)的复兴公共兴趣(AI)相当介意,这次是由Chatgpt(其变体和竞争者)体现的特定机器智能形式驱动的。的确,这不仅是因为人造和生物智能之间的相似之处通常在我的思想中,还因为起草文本的过程(这种活动被隐含地理解为只能由人类才能进行的一种创造过程),现在可以说是开始体验海洋变化的。很明显,有一个很小但并不重要的,数量的创意作家,他们正在与可以总结,重塑甚至对书面文本发表评论的软件代理合作起草文章。以这种方式使用代理似乎范围从规划整个文章到词缩短单个段落;撰写科学文章的协作方法可能会遵循1。可以公平地说,尽管在所谓的生成形式的机器学习中取得了明显进展 - 那些经过培训的机器学习训练的新示例的培训 - 以及在大语言模型(LLMS)中应用这些原理的早期芽,但很少有人可能会预见到这一点的速度是我们的速度。据估计,与Chatgpt互动的人数在公开发布的两个月内越过了1亿个大关。培训此类LLM的工程专长是强大的。在法国公共赠款的协助下,数百名研究人员的合作开发和发布了大型语言模型,也许鲜为人知。 Bloom接受了刚过1.6多个文本的语料库培训,涵盖了46种人类语言和13种编程语言,并以约25吨的25吨Co 2发射器的范围(当时非常有效的计算小时)(以及非常有效的Jean Zay Hartware 2)进行培训。碳撞击估计比GPT3.5(是当前使用最广泛使用的Chatgpt版本的LLM)的碳效果相当小,部分原因是使用了法国网格(57 GCO 2 EQ/kWh)。数据清洁,模型体系结构和培训绽放的基本原理使您着迷3。
主要关键词