New Report: Expanding the AI Evaluation Toolbox with Statistical Models
NIST AI 800-3 认为,LLM 评估的统计有效性得益于评估者明确采用模型来分析评估结果并披露相关假设。广义线性混合建模是一种有前途的方法,可以为更有原则的人工智能评估统计奠定基础。未来的 CAISI 和 NIST 出版物将进一步探讨统计模型在人工智能评估中的应用。
Technologies and Use Cases for Smart Standards
人工智能、区块链和物联网等新兴技术的快速发展和部署正在推动对能够跟上技术变革加速步伐的标准的需求不断增加。作为
VIEWPOINT: How AI Can Help Enforce the Biological Weapons Convention
唐纳德·特朗普总统最近向联合国大会提出了关于使用人工智能系统支持《生物武器公约》监督和执行的提案,这是将新兴技术方法集中于国际生物安全方面的一个重要里程碑。
AI Poses New Challenges, Opportunities for Army Vehicle Maintenance
丹尼斯·维内特少校在陆军联合兵种支援司令部从事部队设计工作时,意识到未来规划中存在重大差距。
JUST IN: Advanced AI Models Refuse Military Queries at Alarming Rates, New Report Finds
根据 EdgeRunner AI 进行的一项研究,美国人工智能公司构建的许多大型语言模型都难以处理与军事相关的查询,从而限制了它们的作战效用。
SIPRI researchers inform global military AI summit
2 月 4 日至 5 日,SIPRI 研究人员参加了第三届 REAIM 峰会,这是一次多利益相关方聚会,致力于就军事领域人工智能的负责任开发和使用进行国际对话。
AI in Chinese, Indian and US Nuclear Postures, Norms and Systems
本背景概述了中国、印度和美国将人工智能融入各自核态势、规范和体系的过程。
We’re All Entrepreneurs Now — Learning, Pivoting, and Thriving the Age of AI
工作的未来不会在教学大纲中传承或在法规中编纂。愿意构建、学习和调整的人们将通过尝试、错误和适应来发现它。
The AI Future: Between Certain Doom and Endless Prosperity
如果我们抵制极端的影响,致力于遵守纪律、尊重权利、迭代治理,人工智能时代就不会被厄运或狂妄所定义。
AI giant Palantir moves its headquarters from Colorado to Florida
Palantir 加入了向佛罗里达州不断发展的技术移民行列。不幸的是,陷入困境的科罗拉多州人民仍将受到联邦资助的 Palantir 正在建造的反乌托邦技术圆形监狱的影响。
Massachusetts Guardsman advances AI innovation through fellowship
马萨诸塞州国民警卫队高级飞行员马修赖特最近在麻省理工学院完成了一项具有挑战性的为期五个月的奖学金计划......
Pennsylvania Guard Soldiers strengthen AI skills
宾夕法尼亚州印第安敦加普堡 — 宾夕法尼亚州国民警卫队士兵和文职人员于 2 月 11 日至 12 日参加了人工智能 201 课程。
Army AI prototypes speed up acquisition, enable faster capability delivery
快速获得士兵所需能力的能力至关重要。陆军正在试验的新的人工智能工具旨在加快采办过程。
Evaluating AI agents: Real-world lessons from building agentic systems at Amazon
在这篇文章中,我们提出了一个针对 Amazon 代理 AI 系统的综合评估框架,该框架通过两个核心组件解决了 Amazon 代理 AI 应用程序的复杂性:一个通用评估工作流程,用于标准化不同代理实施中的评估程序;以及一个代理评估库,该库在 Amazon Bedrock AgentCore 评估中提供系统测量和指标,以及 Amazon 使用案例特定的评估方法和指标。
Build unified intelligence with Amazon Bedrock AgentCore
在这篇文章中,我们将演示如何通过客户代理和知识引擎 (CAKE) 的实际实施,使用 Amazon Bedrock AgentCore 构建统一智能系统。
Army doctrine writers embrace AI to speed knowledge to the force
堪萨斯州利文沃思堡 – 陆军条令的编写过程传统上以年为单位,但在 21 世纪得到了升级。也感谢数字化...
Army Doctrine Writers Embrace AI to Speed Knowledge to Force
陆军联合兵种条令局正在通过战略训练和发展计划整合人工智能,以提高效率和研究速度。