详细内容或原文请订阅后点击阅览
OpenAI 免费发布其新的 o3-mini 推理模型
周四,微软宣布将向其 Copilot 用户推出 OpenAI 的推理模型 o1,现在 OpenAI 正在向使用免费版 ChatGPT 的用户发布一种新的推理模型 o3-mini。这将标志着绝大多数人首次能够使用 OpenAI 的推理模型之一……
来源:MIT Technology Review _人工智能这些类型的模型在解决复杂问题时最有效,因此如果你正在努力解决任何博士级数学问题,你可以尝试一下。或者,如果你在让以前的模型正确响应你最先进的提示时遇到问题,你可能想在它们身上尝试这个新的推理模型。要试用 o3-mini,只需在 ChatGPT 上启动新提示时选择“推理”即可。
在 ChatGPT 上启动新提示虽然推理模型具有新功能,但它们是有代价的。OpenAI 的 o1-mini 的运行成本是其等效非推理模型 GPT-4o mini 的 20 倍。该公司表示,其新模型 o3-mini 的每输入令牌成本比 o1-mini 低 63% 但是,以每百万输入令牌 1.10 美元的价格计算,它的运行成本仍然比 GPT-4o mini 高出约 7 倍。
20 次这个新模型是在 DeepSeek 发布后不久发布的,不到两周前,DeepSeek 发布震惊了人工智能世界。DeepSeek 的新模型表现与顶级 OpenAI 模型一样好,但这家中国公司声称,它的训练成本约为 600 万美元,而 OpenAI 的 GPT-4 的训练成本估计超过 1 亿美元。(值得注意的是,很多人都在质疑这一说法。)
DeepSeek此外,DeepSeek 的推理模型每百万输入令牌的成本为 0.55 美元,是 o3-mini 价格的一半,因此 OpenAI 在降低成本方面还有很长的路要走。据估计,考虑到产生答案所需的计算量更大,推理模型的能源成本也比其他类型高得多。
这波新的推理模型也带来了新的安全挑战。 OpenAI 使用一种称为“审议对齐”的技术来训练其 o 系列模型,基本上让它们在推理的每个步骤中参考 OpenAI 的内部策略,以确保它们不会忽略任何规则。
审议对齐 根据