图 0.1:2023 年 6 月至 2024 年 12 月期间著名通用 AI 模型在关键基准测试中的得分。与之前的最先进水平(阴影区域)相比,o3 表现出显着提高的性能。这些基准测试是该领域对编程、抽象推理和科学推理最具挑战性的测试。对于未发布的 o3,显示公告日期;对于其他模型,显示发布日期。包括 o3 在内的一些较新的 AI 模型受益于改进的支架和测试时的更多计算。资料来源:Anthropic,2024 年;Chollet,2024 年;Chollet 等人,2025 年;Epoch AI,2024 年;Glazer 等人,2024 年;OpenAI,2024a;OpenAI,2024b;Jimenez 等人,2024 年; Jimenez 等人,2025 年。
DMA 适用于核心平台服务。尽管有些公司可能只提供 AI 产品,但另一种可能有效的盈利途径是提供生成式 AI 平台。例如,OpenAI 创建了几个大型基础模型(例如 GPT-4 和 DALL-E),可作为各种应用程序的基础。该公司开始以不同的方式将这些基础模型货币化,包括:(i) 使用“免费增值”商业模式直接向公众发布一些模型(例如 ChatGPT);(ii) 提供对其模型的 API 访问并支持在其基础上构建应用程序的开发。后者允许组织将 OpenAI 的模型集成到自己的产品中,然后将其提供给公众。如果生成式 AI 应用程序是作为平台提供的,则可以将其纳入 DMA 的职权范围。
行业领导者在多模式AI中的竞争既快速,又是愤怒,这证明了硬件和软件中尖端技术的快速发展。这始于2023年3月OpenAI的GPT-4推出,随后迅速发行了Google的Gemini版本和Microsoft的Llava13b,这是一种大型视觉模型,于2023年10月发布,以及Claude 3,并于2023年12月首次亮相。在2024年2月,Openai推出了Sora,专门研究文本到视频的一代,标志着这一充满活力的景观中的另一个里程碑。和2024年3月17日,X.AI发布了Grok-1,这是314B令牌Moe模型。随着每个发行版,我们预计技术巨头之间的竞争会加剧。因此,主队必须准备捍卫我们国家的国土安全部。
AI法规议员急于赶上Openai的Chatgpt的发行,以迅速出现和吸收AI技术。提出的AI法规正在出现,以解决这项新技术尤其是在美国,英国和欧盟的风险。在此期间,我们已经看到使用现有的隐私法作为调节AI的直率工具。例如,意大利数据保护局和ICO分别针对Openai和Snap采取了行动。在每种情况下,6监管机构的重点是据称是不公平的处理,并且在培训或部署生成AI技术的背景下如何使用个人数据的透明度不足。尽管为了调节AI的目的而受到了隐私法规的局限性,但我们希望在来年看到数据保护执法权的进一步使用,而我们等待最终将控制这些新兴技术的创建和使用的新法律框架。
OpenAI O1代表了人工整体的重要里程碑,该里程碑在需要强大的推理能力的许多挑战任务上实现了专家级别的表现。Openai声称O1背后的主要techinique是秘密学习(Openai,2024a; b)。最近的作品使用诸如知识蒸馏之类的替代方法来模仿O1的推理风格,但是它们的有效性受到教师模型的能力上限的限制。因此,本文从强化学习的角度来解析了实现O1的路线图,重点关注四个关键组成部分:政策初始化,奖励设计,搜索和学习。策略初始化使模型能够开发类似人类的推理行为,使他们能够有效地探索解决方案空间的复杂问题。奖励设计通过奖励成型或奖励建模提供密集有效的信号,这是搜索和学习的指导。搜索在训练和测试阶段生成高质量的解决方案中起着至关重要的作用,这可以通过更多的计算产生更好的解决方案。学习利用通过搜索改进策略生成的数据,可以通过更多的参数和更多的搜索数据来实现更好的性能。现有试图重现O1的开源项目似乎是我们路线图的一部分或变体。共同强调了学习和搜索如何推动O1的进步,从而为LLM的开发做出了有意义的贡献。
• ChatGPT by OpenAI / Microsoft • Bard by Google • ERNIE bot ( 文心一言) by Baidu • Tongyi Qianwen ( 通义千问) by Alibaba • SenseChat ( 商量) by SenseTime • SparkDesk ( 讯飞星火) by iFLYTEK ( 科大讯飞 )
OpenAI 于 2022 年 11 月启动的 ChatGPT 引发了关于人工智能对高等教育影响的重要讨论。当学生使用它来撰写论文时,它打破了现状。与谷歌的 Gemini 和微软的 Copilot 一样,OpenAI 的 ChatGPT 是能够模仿人类对话的强大大型语言模型 (LLM) 的典型示例。大型语言模型在识别语言模式和预测上下文单词方面表现出色,并且擅长以最少的用户输入生成连贯且相关的文本响应。通过利用其广泛的训练语言模式数据库,大型语言模型可以提供准确反映用户输入上下文的生成文本响应。凭借对语言的掌握,他们可以创作创意诗歌,撰写全面连贯的文章,深入分析主题,并有说服力地提出论点。
作为其中的一部分,自 2022 年 12 月起,一系列“聊天机器人” 1 和其他工具已公开,以促进生成式人工智能的使用。这些工具有可能改变我们合成信息的方式、加强写作过程或操纵和利用庞大的数据集。一些例子包括 OpenAI 的 ChatGPT、微软的 Bing Image Creator、OpenAI 的 DALL·E、谷歌的 Bard、独立的 Stable Diffusion 等。所有这些在使用时都有我们应该意识到的权衡。例如,许多新工具不承认版权法,盲目使用大量内容,其中一些内容受到法律框架的保护。在使用这些工具的输出时,还需要考虑道德义务。因此,制作和发布这些人工智能生成的内容需要承担责任。一些与知识产权有关的诉讼已经提起,要么是因为侵犯知识产权 2 ,要么是因为诽谤 3 。
2022 年 11 月,OpenAI 发布 ChatGPT,在全球公众、媒体和各行各业掀起了一股人工智能 (AI) 热潮。这种生成式 AI 模型(也称为生成式大型语言模型或 LLM)在科技界引发了一场关于谁拥有最佳 AI 产品的新竞赛。一方面,微软与 OpenAI 的合作伙伴关系在将生成式 AI 融入众多应用中方面处于领先地位,而谷歌等其他大公司则以 BARD 的形式加紧推出自己的 AI 技术。最近,诸如 Meta 的 Llama 之类的生成式 AI 的开源版本越来越受欢迎,因为它们使最终用户能够为自己的特定应用微调生成式 AI,而无需从头开始训练生成式 AI 所需的大量成本和数据。
耳鼻喉科是在创新时代的悬崖上,准备将人工智能(AI)整合到其研究框架中。AI有可能使用大量数据集来提高诊断,疾病早期探测,治疗计划和患者监测的精度。机器学习算法可以分析超出人类感知的声音细微差别,从而允许早期干预和改善患者预后。此外,聊天机器人可以彻底改变患者的互动。在术后护理中或在慢性耳鼻喉科迷失方面的管理期间,聊天机器人,例如Chatgpt(Openai,OpenAI,美国旧金山,美国),可以促进实时症状跟踪并提供即时建议。这不仅增强了患者的依从性,而且还弥合了临床环境之外的沟通差距。此外,研究中的AI驱动工具可以通过文献筛选,提出假设,甚至可以预测