OpenAI终于发布了开放式语言模型 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

OpenAI终于发布了开放式语言模型

2025年8月5日 17:00 33 Comments

OpenAI终于发布了自2019年GPT-2以来的首个开放式大型语言模型。这些新的“ GPT-oss”型号有两种不同的尺寸，并且在多个基准测试中与公司的O3-Mini和O4-Mini型号相似。与通过OpenAI的Web界面可用的模型不同，这些新的Open模型可以自由下载，运行，甚至……

来源:MIT Technology Review _人工智能

“我们的绝大多数[企业和初创公司]客户已经在使用许多开放模型，” OpenAI的研究计划经理Casey Dvorak在媒体上介绍了该模型版本。 “由于没有OpenAI的[竞争]开放模型，我们想堵塞差距，并实际上允许他们全面使用我们的技术。”

新型号有两种不同的尺寸，其中较小的可以在16 GB的RAM上运行，这是Apple当前在其计算机上提供的最低量。较大的型号需要高端笔记本电脑或专用硬件。

开放型号有一些关键用例。一些组织可能想自定义出于自己的目的自定义模型，或者通过在自己的设备上运行模型来节省资金，尽管该设备的前期成本很高。其他人 - 医院，律师事务所和政府 - 可能出于数据安全原因可以在本地运行的模型。

OpenAI通过在Apache 2.0许可下释放其开放模型来促进此类活动，从而允许模型用于商业目的。艾伦AI研究所的培训后负责人内森·兰伯特（Nathan Lambert）说，这种选择是值得称赞的：此类许可对于中国开放模型发行是典型的，但梅塔（Meta）以定制，更加限制性的许可发布了其Llama模型。他说：“对于开放社区来说，这是一件非常好的事情。”

研究LLM的工作方式的研究人员也需要开放模型，以便他们可以详细检查和操纵这些模型。普林斯顿大学助理教授彼得·亨德森（Peter Henderson）说：“这在某种程度上是关于重新确定OpenAI在研究生态系统中的主导地位。”亨德森说，如果研究人员确实采用GPT-soss作为新的主力手术，那么Openai可能会看到一些具体的好处，它可能会采用其他研究人员发现的创新，以进入其自己的模型生态系统中。

博客文章

负责人较小的计算机 OpenAI 使用事务所实际上不同的模型前期成本较大的许可运行的数据安全自定义典型的新型号型号目的开放研究出于自己的计划经理允许亨德森开放型详细检查研究计划研究人员检查和具体的设备的可能生态系统研究所工作方式

OpenAI终于发布了开放式语言模型

其他外部链接

Tags

XiaoMi-AI