Grok 3刚摇晃AI(并且可能走得太远)

埃隆·马斯克(Elon Musk)的AI Venture Xai刚刚推出了最新的车型Grok 3,它几乎一夜之间飙升至Chatbot Arena排行榜的顶部。

来源:营销人工智能研究所

埃隆·马斯克(Elon Musk)的AI Venture Xai刚刚推出了最新的车型Grok 3,它几乎一夜之间飙升至Chatbot Arena排行榜的顶部。

埃隆·马斯克(Elon Musk)的AI Venture Xai刚刚推出了最新的车型Grok 3,它几乎一夜之间飙升至Chatbot Arena排行榜的顶部。 聊天机器人竞技场排行榜

它已经超越了既定的球员,包括OpenAI的最新产品和Google的Gemini,跨越数学,编码和复杂的推理任务。

,但真实的故事不仅仅是模特的令人垂涎的功能。 Grok 3的发布也引起了人们对AI安全性,护栏的严重关注,以及当AI公司乘坐没有典型限制或长达数月的“红色团队”过程的最先进模型时会发生什么。

Grok 3的启动

为了将其全部分解,我在人工智能展览会第137集中与营销AI Institute创始人兼首席执行官Paul Roetzer进行了交谈。

人工智能节目的第137集 人工智能节目的第137集

Grok 3的快速上升

grok 3是对巨人的培训,该巨人的高级集体是先前最先进型号的计算的10倍。结果自言自语:

    2025年美国邀请赛数学考试(AIME)的精度为93.3%(在Grok首次亮相前一周发布)。在复杂任务(例如编码,高级数学和多步逻辑问题)上表现出色。
  • 2025年美国邀请赛数学考试(AIME)的准确性为93.3%(在Grok首次亮相前一周发布)。 在复杂的任务,高级数学和多步逻辑问题等复杂任务上表现出色。 Roetzer对发展速度印象深刻。 “在高水平上,技术成就与建造时间的时间令人难以置信,”他说。”他们很快赶上了。” “在高水平上,技术成就与建造时间的时间令人难以置信,”他说。”他们很快赶上了。” 一个更“打开”的模型 - 也许太开放了
  • 2025年美国邀请赛数学考试(AIME)的准确性为93.3%(在Grok首次亮相前一周发布)。
  • 在复杂的任务,高级数学和多步逻辑问题等复杂任务上表现出色。

    Roetzer对发展速度印象深刻。

    “在高水平上,技术成就与建造时间的时间令人难以置信,”他说。”他们很快赶上了。”

    “在高水平上,技术成就与建造时间的时间令人难以置信,”他说。”他们很快赶上了。”

    一个更“打开”的模型 - 也许太开放了