详细内容或原文请订阅后点击阅览
OpenAI发布了最强大的开放型
无
来源:QudataOpenAI发布了最强大的开放型
本周Openai公布了两种开放式语言模型-GPT-OSS-1220B和GPT-OSS-20B。这些新模型旨在在宽松的Apache 2.0许可下为更广泛的受众带来强大的推理功能,灵活的工具使用和开发人员级定制。
OpenAI已公布了两种开放式语言模型与专有的GPT-4或GPT-4O模型不同,专门在OpenAI的云基础架构上托管的GPT-Oss型号可供任何人在本地下载和通过各种部署平台下载并运行,从而实现低级,较低范围,内部设备推断和增强的数据控制。
GPT-OSS-1220B和GPT-OSS-20B模型经过设计,可以在推理密集型任务上表现良好,同时保持资源效率。旗舰120b型号包含170亿个参数,并且由于Experts(MOE)体系结构的混合物,每个令牌仅激活51亿个参数,从而可以在单个80 GB GPU上运行该模型。同时,20B版本使用的每个令牌使用36亿个活动参数,仅需要16 GB的内存 - 非常适合消费者笔记本电脑和边缘设备。
这两种模型都支持128,000个to上下文窗口,低,中和高努力水平以及结构化输出格式的思想链(COT)推理。他们还与工具使用功能(例如Python代码执行和Web搜索)集成在一起 - 为代理工作流提供供电。
使用OpenAI最先进的技术进行了培训,包括高计算的增强学习,监督的微调和训练后的对齐过程,GPT-Soss模型与OpenAI的O系列模型(例如O3,O4-Mini)共享了一个发育谱系。
此外,Openai还通过500,000美元的奖金发起了红色团队挑战,以进一步浮出任何新颖的安全漏洞,鼓励全球AI社区在压力测试模型方面进行协作。