CAISI对DeepSeek AI模型的评估发现缺点和风险

NIST 人工智能标准与创新中心评估了来自中华人民共和国人工智能公司 DeepSeek 的几个领先模型。

来源:美国国家标准技术研究所

华盛顿 — 美国商务部国家标准与技术研究院 (NIST) 的人工智能标准与创新中心 (CAISI) 对中华人民共和国 (PRC) 开发商 DeepSeek 的人工智能模型进行了评估,发现它们在性能、成本、安全性和采用方面落后于美国模型。

“得益于特朗普总统的人工智能行动计划,商务部和 NIST 人工智能标准与创新中心发布了针对美国与对手人工智能的开创性评估,”商务部长霍华德·卢特尼克 (Howard Lutnick) 表示。 “报告清楚地表明,美国人工智能占据主导地位,DeepSeek 远远落后。这种弱点不仅仅是技术上的。它表明了为什么依赖外国人工智能是危险和短视的。通过制定标准、推动创新和确保美国安全,商务部将确保美国在人工智能领域继续保持领先地位。”

CAISI 评估还指出,DeepSeek 模型在安全性和模型响应审查方面的缺陷可能会对应用程序开发人员、消费者和美国国家安全构成风险。尽管存在这些风险,DeepSeek 仍是领先的开发商,并为全球使用中国模型的快速增长做出了贡献。

CAISI 的专家在跨越一系列领域的 19 个基准测试中评估了三个 DeepSeek 模型(R1、R1-0528 和 V3.1)和四个美国模型(OpenAI 的 GPT-5、GPT-5-mini 和 gpt-oss 以及 Anthropic 的 Opus 4)。这些评估包括最先进的公共基准以及 CAISI 与学术机构和其他联邦机构合作制定的私人基准。

来自CAISI的评估 美国的人工智能行动计划

CAISI 是美国政府内部业界的主要联络点,旨在促进与商业人工智能系统相关的测试、协作研究和最佳实践开发,也是 NIST 努力确保和推进美国在人工智能领域的领导地位的关键要素。

主要发现

DeepSeek 模型的使用成本高于同类美国模型。