Google DeepMind unveils Gemini Robotics 1.5 to bring AI agents into the physical world
Google DeepMind推出了Gemini Robotics 1.5,这是一种新型视觉语言动作(VLA)模型,旨在帮助机器人执行具有更大自主性和透明度的复杂,多步骤的任务。该版本包括两个互补模型:Gemini Robotics 1.5和Gemini Robotics-ER 1.5。前者是DeepMind迄今为止最先进的VLA系统,能够转动视觉输入和说明[…]
From Laundry to Laptops: DeepMind’s New Robot Learns Everyday Chores
Google DeepMind刚刚发布了其Gemini Robotics 1.5系统,AI的飞跃使机器人可以处理日常家庭任务,例如按颜色对洗衣服进行分类或选择在下雨天打包的东西。根据FT的覆盖范围,这种升级将推理与现实世界的适应性融合在一起 - 即使机器现在可以处理我们曾经认为需要人类判断的任务。真正吸引我的不仅是洗衣头,而且这些机器人可以从网络上提取信息来指导他们的行动。想象一下,一个机器人在伦敦弄清楚回收规则,另一个在东京,然后立即分享该知识。那是[…]
Intrinsic and Google DeepMind unveil AI breakthrough for multi-robot orchestration
Google母公司Alphabet拥有的机器人软件公司Interinsic宣布了人工智能的重大进步,使多个工业机器人能够在共享环境中共同工作而无需碰撞。该发展源于Google Deepmind Robotics(现在显然是双子座机器人技术)领导的长期研究 - 与[…]
Google DeepMind’s Genie 3 Could Be the Virtual World Breakthrough AI Has Been Waiting For
Google DeepMind只是在Genie 3上撤回了窗帘,这是一种实时的,逼真的“世界模型”,可以直接从文本提示中引起交互式环境。
GPT-5最终降落,炒作与反弹相匹配。在这一集中,Paul和Mike分享了他们从新模型中分享他们的外卖,提供了有关DeepMind的感人逼真的Genie 3 World Model的重力的见解,揭开了困惑的隐形爬行争议,触及了Openai的Openai的Openai发行版,并传闻了5000亿美元的估值,以及在我们的快速频道部分中获得的更多内容。
NASA计划到2030年在月球上部署100 kW的核反应堆,旨在支持永久的月球行动和维护利益。 DeepMind揭示了“ Genie 3” AI,它呈现交互式模拟。首次出现在科学询问者上。
DeepMind Genie 3 en världsmodell som skapar interaktiva simuleringar
DeepMind最近推出了其新的世界模型Genie 3,可以创建真实的时间交互式模拟。这项技术代表了AI和生成模型世界的重大进展。这是基于多个来源的Genie 3中最重要的特征和创新的汇编。实际 - 时间精灵3中的交互式仿真是[…] DeepMind Genie 3的世界模型,该模型最初出现在AI新闻上。
Google DeepMind releases new world model with ‘vast space’ to train robots and autonomous systems
Google DeepMind揭开了Genie 3,这是其生成世界模型的最新版本,将其描述为创建更智能和适应性的仿真环境(包括用于机器人应用程序)的一步。尽管该公司的公告主要关注视频预测和一般AI学习的进步,但Genie 3与[…]
Google DeepMind’s new AI can help historians understand ancient Latin inscriptions
Google DeepMind揭开了新的人工智能软件,可以帮助历史学家恢复古代拉丁版画背后的含义和背景。埃涅阿斯可以分析用长天气的石头写的单词,以说何时何地刻有刻画。它遵循Google以前的考古工具iThaca,该工具还使用深度学习来重建和上下文化古代文本,…
DeepMind and OpenAI claim gold in International Mathematical Olympiad
在享有声望的年轻数学家竞争中,两种AI模型首次达到了金牌标准 - 他们的开发人员声称这些AI很快就会解决棘手的科学问题
DeepMind’s Quest for Self-Improving Table Tennis Agents
几乎没有一天,没有令人印象深刻的新机器人平台从全球学术实验室和商业初创公司出现。尤其是人形机器人看起来越来越有能力帮助我们在工厂,最终在家庭和医院中。但是,要使这些机器真正有用,他们需要精致的“大脑”来控制其机器人身体。传统上,编程机器人涉及专家花费无数小时精心编写复杂行为,并详尽地调整参数,例如控制器的增益或运动规划权重,以实现所需的性能。尽管机器学习(ML)技术有希望,但需要学习新的复杂行为的机器人仍然需要大量的人类监督和重新设计。在Google DeepMind,我们问自己:我们如何使机器人能够更加整体,连续地学习和适应,从而减少了每项重大改进或新技能的专家干预瓶装的瓶颈?这个问题是我们
DeepMind’s AlphaGenome Uses AI to Decipher Noncoding DNA for Research, Personalized Medicine
此AI系统可以一次分析多达100万个DNA字母,预测非编码区域的微小变化如何触发从癌症到罕见的遗传疾病的所有内容,并有可能革新个性化医学
Google DeepMind推出了一种旨在通用敏捷性和快速任务适应的高效,设备机器人的模型。这款新产品被称为Gemini Robotics On Device,是Gemini Robotics VLA(Vision Language Action)模型的优化版本,该版本最初于3月推出,以将Gemini 2.0的多模式推理整合到物理应用中。双子座机器人[…]
Gemini Diffusion: Google DeepMinds nya textdiffusionsmodell
双子座扩散是由Google DeepMind开发的实验文本扩散模型,它代表了语言建模方面的重要一步。双子座扩散与传统模型(例如自回归语言模型)之间的区别在于文本的生成方式。尽管这些传统模型为单词构建文本单词,但双子座扩散使用了一种方法,其中它以随机的“噪声”开头,并逐渐[…] Gemini扩散:Google DeepMind的新文本扩散模型首次出现在AI新闻上。
AlphaEvolve: Google DeepMind’s Groundbreaking Step Toward AGI
Google DeepMind揭开了Alphaevolve,这是一种旨在自主发现新型算法和科学解决方案的进化编码剂。这项研究在题为“ Alphaevolve:科学和算法发现的编码剂”的论文中发表,这是迈向人工通用智能(AGI)甚至人工上智能(ASI)的基本步骤。与其依靠静态微调或[…] Alphaevolve:Google DeepMind迈出的AGI的开创性步骤首先出现在Unite.ai上。
AlphaEvolve: Google DeepMinds revolutionerande algoritmiska kodningsagent
alphavolve是由Google的双子座模型运行的编码代理,专门设计用于检测和优化算法。它结合了创造性问题 - 从大语言模型中解决能力和自动评估者,这些评估者验证结果,并使用进化框架来改善最有前途的想法。该系统使用-ART语言模型的状态合奏:Gemini Flash,即[…]帖子Alphavolve:Google DeepMind的革命性算法编码代理首次出现在AI新闻上。