Measuring perception in AI models
感知——通过感官体验世界的过程——是智能的重要组成部分。而构建具有人类水平的感知理解世界的代理是一项核心但具有挑战性的任务,这在机器人、自动驾驶汽车、个人助理、医学成像等领域变得越来越重要。所以今天,我们推出了感知测试,这是一个使用真实世界视频来帮助评估模型感知能力的多模式基准。
Measuring perception in AI models
感知 - 通过感官体验世界的过程 - 是智力的重要组成部分。对世界具有人层感知理解的建筑代理是一项核心但具有挑战性的任务,在机器人技术,自动驾驶汽车,个人助理,医学成像等方面变得越来越重要。因此,今天,我们推出了感知测试,这是一种使用现实世界视频的多模式基准测试,以帮助评估模型的感知能力。
Measuring perception in AI models
感知 - 通过感官体验世界的过程 - 是智力的重要组成部分。对世界具有人层感知理解的建筑代理是一项核心但具有挑战性的任务,在机器人技术,自动驾驶汽车,个人助理,医学成像等方面变得越来越重要。因此,今天,我们推出了感知测试,这是一种使用现实世界视频的多模式基准测试,以帮助评估模型的感知能力。
Measuring perception in AI models
感知 - 通过感官体验世界的过程 - 是智力的重要组成部分。对世界具有人层感知理解的建筑代理是一项核心但具有挑战性的任务,在机器人技术,自动驾驶汽车,个人助理,医学成像等方面变得越来越重要。因此,今天,我们推出了感知测试,这是一种使用现实世界视频的多模式基准测试,以帮助评估模型的感知能力。
Measuring perception in AI models
感知 - 通过感官体验世界的过程 - 是智力的重要组成部分。对世界具有人层感知理解的建筑代理是一项核心但具有挑战性的任务,在机器人技术,自动驾驶汽车,个人助理,医学成像等方面变得越来越重要。因此,今天,我们推出了感知测试,这是一种使用现实世界视频的多模式基准测试,以帮助评估模型的感知能力。
受到大规模语言建模进展的启发,我们采用类似的方法来构建文本输出领域之外的单一通用代理。我们称之为 Gato 的代理是一种多模式、多任务、多体现的通用策略。具有相同权重的相同网络可以玩 Atari、为图片添加字幕、聊天、用真正的机械臂堆叠积木等等,并根据其上下文决定是否输出文本、关节扭矩、按钮按下或其他标记。
Why haven't we seen any mainstream games utilizing LLM-driven AI NPCs?
因为这很难……我们在过去四年中一直致力于这项工作。制作一个简单的概念验证 (PoC) 很容易(我们已经见过很多),但要将其完善到生产级别,需要付出 1,000 倍的努力,因为会出现更深层次的复杂性:1) 成本:通过 API 使用 LLM 意味着有人必须为每个玩家每小时支付数千个代币。是的,你可以在玩家的 GPU 上运行较小的 LLM(例如 Mistral、Llama3 8b),但质量和功能可能不足以提供引人入胜的叙事和游戏玩法。2) 现在还为时过早:GPT-3.5 才 1.5 年,GPT-4 才 1 年。3) 当前的 LLM:它们可能无法在长时间的游戏会话中运行多智能体叙事。上下文大小不足以一
Робот JumpRoACH имитирует настоящего жука (+ видео)
在寻找最成功的机器人甲虫设计的过程中,基于生物自然的多模式运动系统正在变得时尚。结合跑步和跳跃等技能,您可以创建具有最高效运动系统的小型机器人,使它们一次充电即可移动更远,帮助它们克服障碍并在崎岖的地形上移动。
Promega Launches Portable 96-Well Plate Reader to Analyse Luminescent Cell Health Assays
从事生物发光研究的研究人员现在有了更方便、更经济高效的研究工具。Promega 公司新推出的 MyGlo™ 试剂读取器是一款便携式 96 孔板读取器,专为特定的 Promega 发光分析而定制。这款新设备提供了广泛的动态范围,而价格仅为多模式读取器的一小部分……