ECOLE: Environment-driven Conceptual Learning
项目负责人:William Corvey 博士 赞助组织:DARPA网站:https://www.darpa.mil/program/environment-driven-conceptual-learning 项目概要:国防部和情报界需要能够稳健且自动分析大量多模态数据的计算系统。此外,
Measuring perception in AI models
感知 - 通过感官体验世界的过程 - 是智力的重要组成部分。对世界具有人层感知理解的建筑代理是一项核心但具有挑战性的任务,在机器人技术,自动驾驶汽车,个人助理,医学成像等方面变得越来越重要。因此,今天,我们推出了感知测试,这是一种使用现实世界视频的多模式基准测试,以帮助评估模型的感知能力。
Measuring perception in AI models
感知 - 通过感官体验世界的过程 - 是智力的重要组成部分。对世界具有人层感知理解的建筑代理是一项核心但具有挑战性的任务,在机器人技术,自动驾驶汽车,个人助理,医学成像等方面变得越来越重要。因此,今天,我们推出了感知测试,这是一种使用现实世界视频的多模式基准测试,以帮助评估模型的感知能力。
Measuring perception in AI models
感知——通过感官体验世界的过程——是智能的重要组成部分。而构建具有人类水平的感知理解世界的代理是一项核心但具有挑战性的任务,这在机器人、自动驾驶汽车、个人助理、医学成像等领域变得越来越重要。所以今天,我们推出了感知测试,这是一个使用真实世界视频来帮助评估模型感知能力的多模式基准。
Measuring perception in AI models
感知 - 通过感官体验世界的过程 - 是智力的重要组成部分。对世界具有人层感知理解的建筑代理是一项核心但具有挑战性的任务,在机器人技术,自动驾驶汽车,个人助理,医学成像等方面变得越来越重要。因此,今天,我们推出了感知测试,这是一种使用现实世界视频的多模式基准测试,以帮助评估模型的感知能力。
Measuring perception in AI models
感知 - 通过感官体验世界的过程 - 是智力的重要组成部分。对世界具有人层感知理解的建筑代理是一项核心但具有挑战性的任务,在机器人技术,自动驾驶汽车,个人助理,医学成像等方面变得越来越重要。因此,今天,我们推出了感知测试,这是一种使用现实世界视频的多模式基准测试,以帮助评估模型的感知能力。
New Year 2021 is approaching: Is 2020 really a bad year? A comparison with history
2020 新冠病毒之年!!对很多人来说,2020 年可能是糟糕的一年。今年可能是糟糕的一年,原因有很多,比如工作、见不到亲人的环境,或者经济危机。很多模仿 2020 年的表情包到处流传。那么,这真的是糟糕的一年吗?让我们回顾一下历史。这是对世界事件的历史对比。历史上可能还发生过更糟糕的事件。即便如此,拥有一台仍然是普通人无法承受的。2020- 新冠疫情夺走许多人的生命截至 12 月 17 日,新冠病毒疫情已影响全球 7450 万人。据约翰霍普金斯大学称,另有 1600 万人死亡。然而,这并不是说它是世界上最严重的流行病。是的,仅自 1346 年以来,鼠疫就已在欧洲夺走了 2500 万人的生命。
受到大规模语言建模进展的启发,我们采用类似的方法来构建文本输出领域之外的单一通用代理。我们称之为 Gato 的代理是一种多模式、多任务、多体现的通用策略。具有相同权重的相同网络可以玩 Atari、为图片添加字幕、聊天、用真正的机械臂堆叠积木等等,并根据其上下文决定是否输出文本、关节扭矩、按钮按下或其他标记。
Tackling multiple tasks with a single visual language model
我们推出了 Flamingo,这是一种单一的视觉语言模型 (VLM),它在广泛的开放式多模态任务中为少量学习树立了新的领先地位。
星期六,几个人过来演练并测试他们想在 2022 年 Enfilade 上进行的利萨战役 (1866) 游戏的一些想法。所以我们设置了意大利和奥地利线的部分,并进行了几轮炮击和撞击,以制定了几套规则。他们将使用旧湾区船厂线的 1/600 比例的船只。并非所有船只都已完成,但看起来不错。奥地利铁甲舰向意大利线移动意大利领先集团我们对不同规则的玩法有了很好的了解,并确定了他们将在游戏中使用哪一套。撞击 Re D'Italia 我还花了一点时间在飞行博物馆查看西北比例模型师小组的一些比例模型。有很多模型可看,但不出所料,展览以飞机模型为主。看看他们拥有的所有模型总是很有趣。我喜欢看模型,而且我知道如果
Stanford AI Lab Papers at ICCV 2021
国际计算机视觉会议 (ICCV 2021) 将于下周以线上方式举办。我们很高兴与大家分享 SAIL 的所有成果,您可以在下面找到论文、视频和博客的链接。欢迎直接联系作者,了解更多有关斯坦福大学的工作!已接受论文列表GLoRIA:用于标签高效医学图像识别的多模态全局-局部表示学习框架作者:Mars Huang联系方式:mschuang@stanford.edu关键词:医学图像、自监督学习、多模态融合通过点-体素扩散生成和完成 3D 形状作者:Linqi Zhou、Yilun Du、Jiajun Wu联系方式:linqizhou@stanford.edu链接:论文 | 视频 |网站关键词:扩散、形
Stanford AI Lab Papers at ICCV 2021
国际计算机视觉会议 (ICCV 2021) 将于下周以线上方式举办。我们很高兴与大家分享 SAIL 的所有成果,您可以在下面找到论文、视频和博客的链接。欢迎直接联系作者,了解更多有关斯坦福大学的工作!已接受论文列表GLoRIA:用于标签高效医学图像识别的多模态全局-局部表示学习框架作者:Mars Huang联系方式:mschuang@stanford.edu关键词:医学图像、自监督学习、多模态融合通过点-体素扩散生成和完成 3D 形状作者:Linqi Zhou、Yilun Du、Jiajun Wu联系方式:linqizhou@stanford.edu链接:论文 | 视频 |网站关键词:扩散、形
ABBYY приглашает на научную онлайн-конференцию по компьютерной лингвистике «Диалог 2020»
参赛者将总结自动上位词预测、句法分析和非平凡关系提取方面的竞赛结果,专家将讨论语言模型和语言学多模态的发展。
据神经网络行业联盟新闻报道,该车配备了多模态神经控制器,在该控制器的帮助下,无法用手臂或腿控制汽车的驾驶员将能够能够借助工作肢体以及眼睛与汽车进行交互。
Why haven't we seen any mainstream games utilizing LLM-driven AI NPCs?
因为这很难……我们在过去四年中一直致力于这项工作。制作一个简单的概念验证 (PoC) 很容易(我们已经见过很多),但要将其完善到生产级别,需要付出 1,000 倍的努力,因为会出现更深层次的复杂性:1) 成本:通过 API 使用 LLM 意味着有人必须为每个玩家每小时支付数千个代币。是的,你可以在玩家的 GPU 上运行较小的 LLM(例如 Mistral、Llama3 8b),但质量和功能可能不足以提供引人入胜的叙事和游戏玩法。2) 现在还为时过早:GPT-3.5 才 1.5 年,GPT-4 才 1 年。3) 当前的 LLM:它们可能无法在长时间的游戏会话中运行多智能体叙事。上下文大小不足以一
Робот JumpRoACH имитирует настоящего жука (+ видео)
在寻找最成功的机器人甲虫设计的过程中,基于生物自然的多模式运动系统正在变得时尚。结合跑步和跳跃等技能,您可以创建具有最高效运动系统的小型机器人,使它们一次充电即可移动更远,帮助它们克服障碍并在崎岖的地形上移动。
Маленький робот Picobug ходит, летает и хватает вещи (+ видео)
是吗,两条腿走路对人来说是很方便的。唯一令人失望的是,许多动物想出了更好的移动方式。例如,鸟类和昆虫用翅膀飞行,用腿行走。这种多模态使鸟类和昆虫成为多才多艺、适应性强的生物,这就是为什么你几乎可以在任何地方找到它们。
Европейские ученые разрабатывают робота-дерево
动物使用许多有效的运动方式,因此我们已经看到很多模仿动物的机器人也就不足为奇了。最近的例子包括猎豹、鱼和蛇机器人。正如我们所理解的,植物只是坐在一处吗?但事实上,它们也可以移动,只是不一定从 A 点移动到 B 点。考虑到这一点,欧洲项目 PLANTOID 的一个联盟目前正在开发一种树木机器人。它的后代最终可能会被用于探索其他行星。