OpenAI终于发布了开放式语言模型

OpenAI终于发布了自2019年GPT-2以来的首个开放式大型语言模型。这些新的“ GPT-oss”型号有两种不同的尺寸,并且在多个基准测试中与公司的O3-Mini和O4-Mini型号相似。与通过OpenAI的Web界面可用的模型不同,这些新的Open模型可以自由下载,运行,甚至……

来源:MIT Technology Review _人工智能

“我们的绝大多数[企业和初创公司]客户已经在使用许多开放模型,” OpenAI的研究计划经理Casey Dvorak在媒体上介绍了该模型版本。 “由于没有OpenAI的[竞争]开放模型,我们想堵塞差距,并实际上允许他们全面使用我们的技术。”

新型号有两种不同的尺寸,其中较小的可以在16 GB的RAM上运行,这是Apple当前在其计算机上提供的最低量。较大的型号需要高端笔记本电脑或专用硬件。

开放型号有一些关键用例。一些组织可能想自定义出于自己的目的自定义模型,或者通过在自己的设备上运行模型来节省资金,尽管该设备的前期成本很高。其他人 - 医院,律师事务所和政府 - 可能出于数据安全原因可以在本地运行的模型。

OpenAI通过在Apache 2.0许可下释放其开放模型来促进此类活动,从而允许模型用于商业目的。艾伦AI研究所的培训后负责人内森·兰伯特(Nathan Lambert)说,这种选择是值得称赞的:此类许可对于中国开放模型发行是典型的,但梅塔(Meta)以定制,更加限制性的许可发布了其Llama模型。他说:“对于开放社区来说,这是一件非常好的事情。”

研究LLM的工作方式的研究人员也需要开放模型,以便他们可以详细检查和操纵这些模型。普林斯顿大学助理教授彼得·亨德森(Peter Henderson)说:“这在某种程度上是关于重新确定OpenAI在研究生态系统中的主导地位。”亨德森说,如果研究人员确实采用GPT-soss作为新的主力手术,那么Openai可能会看到一些具体的好处,它可能会采用其他研究人员发现的创新,以进入其自己的模型生态系统中。

博客文章