arxiv关键词检索结果

周五视频:跳跃机器人腿、行走机器人桌

Video Friday: Jumping Robot Leg, Walking Robot Table

视频星期五是每周精选的精彩机器人视频,由 IEEE Spectrum robotics 的朋友收集。我们还发布未来几个月即将举行的机器人活动的每周日历。请将您的活动发送给我们以供收录。ICRA@40:2024 年 9 月 23 日至 26 日,荷兰鹿特丹SIROS 2024:2024 年 10 月 14 日至 18 日,阿联酋阿布扎比ICSR 2024:2024 年 10 月 23 日至 26 日,丹麦奥登塞Cybathlon 2024:2024 年 10 月 25 日至 27 日,苏黎世欣赏今天的视频!马克斯普朗克智能系统研究所和苏黎世联邦理工学院的研究人员开发了一种带有人造肌肉的机器人腿。

Transformer?扩散?输血!

Transformer? Diffusion? Transfusion!

最新多模态转输模型的简单介绍最近,Meta 和 Waymo 发布了他们的最新论文 —Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model,该论文将流行的 Transformer 模型与扩散模型相结合,用于多模态训练和预测目的。与 Meta 之前的工作一样,Transfusion 模型基于带有早期融合的 Llama 架构,它同时采用文本 token 序列和图像 token 序列,并使用单个 Transformer 模型来生成预测。但与以前的技术不同,Transfusion 模型对图像 t

如何使用 LlamaIndex 工作流简化我的研究和演示

How I Streamline My Research and Presentation with LlamaIndex Workflows

以可靠性、灵活性和可控性协调 AI 工作流的示例LlamaIndex 最近推出了一项新功能:工作流。它对于那些想要创建既可靠又灵活的 AI 解决方案的人来说非常有用。为什么?因为它允许您使用控制流定义自定义步骤。它支持循环、反馈和错误处理。它就像一个支持 AI 的管道。但与通常以有向无环图 (DAG) 形式实现的典型管道不同,工作流还支持循环执行,使其成为实现代理和其他更复杂过程的良好候选。介绍工作流测试版:使用 LlamaIndex 创建复杂 AI 应用程序的新方法 - LlamaIndex,LLM 应用程序的数据框架在本文中,我将展示如何使用 LlamaIndex 工作流简化我研究某个主题

时间序列对于 LLM 来说并没有那么不同

Time Series Are Not That Different for LLMs

利用 LLM 的力量进行时间序列建模基础模型推动了计算语言学和计算机视觉领域的最新进步,并在人工智能 (AI) 中取得了巨大成功。成功的基础模型的关键思想包括:海量数据:庞大而多样的训练数据涵盖了全面的分布,使模型能够近似任何潜在的测试分布。可转移性:记忆和回忆所学信息的机制,例如提示 [1] 和自我监督的预训练 [2],使模型能够有效地适应新任务。在 LLM 成功之后,时间序列基础模型的开发变得更加密集。图片来自论文 https://arxiv.org/pdf/2403.14735.大型时间序列基础模型 (LTSM)随着基础模型在计算语言学领域的成功,越来越多的研究工作旨在在另一种类型的序列

理解和实施 Medprompt

Understanding and Implementing Medprompt

深入研究提示框架背后的细节Medprompt 策略各个组成部分的说明(图片取自 Medprompt 论文 [1] (https://arxiv.org/abs/2311.16452) 中的图 6)在我的第一篇博客文章中,我探讨了提示及其在大型语言模型 (LLM) 中的重要性。提示对于从 LLM 获得高质量的输出至关重要,因为它可以指导模型的响应并确保它们与手头的任务相关。在此基础上,尝试使用 LLM 解决用例时经常会出现两个关键问题:仅使用提示可以将性能提升到多远,以及何时您会咬紧牙关并决定微调模型可能更有效?在做出利用提示的设计决策时,需要考虑几个因素。像小样本提示和思路链 (CoT) [2

一项技术使机器人能够确定它们是否能够举起沉重的箱子

A technique allows robots to determine whether they are able to lift a heavy box

人形机器人,即身体与人类相似的机器人,很快就能帮助人们完成各种各样的任务。这些机器人被设计用来完成许多任务,包括拾取不同形状、重量和大小的物体。虽然迄今为止开发的许多人形机器人能够拾取小而轻的物体,但举起笨重或沉重的物体往往更具挑战性。事实上,如果物体太大或太重,机器人最终可能会将其摔坏或掉落。考虑到这一点,约翰霍普金斯大学和新加坡国立大学 (NUS) 的研究人员最近开发了一种技术,使机器人能够确定它们是否能够举起具有未知物理特性的重箱子。这项技术发表在 arXiv 上的一篇论文中,该技术可以开发出能够更有效地举起物体的机器人,从而降低它们拾起无法支撑或携带的物体的风险。“我们特别感兴趣的是人

PROTAC 诱导结构预测的迭代细化模型

An iterative refinement model for PROTAC-induced structure prediction

这项工作被接受为 ICLR 2024 生物分子设计生成和实验视角研讨会的口头报告。有关更多信息,请查看我们在 arXiv 上的论文。什么是 PROTAC?蛋白质是分子机器,可执行人体生长所需的许多功能。当蛋白质发生故障时 […]

NIST 工具将使大量数学研究论文更容易在线查​​看

NIST Tool Will Make Math-Heavy Research Papers Easier to View Online

由 NIST 科学家开发的工具将帮助 arXiv 预印本变得更容易获取。

#359 – 安德鲁·斯特罗明格:黑洞、量子引力和理论物理学

#359 – Andrew Strominger: Black Holes, Quantum Gravity, and Theoretical Physics

安德鲁·斯特罗明格是哈佛大学的理论物理学家。请查看我们的赞助商来支持此播客:- Eight Sleep:https://www.eightsleep.com/lex 获得特别优惠- Rocket Money:https://rocketmoney.com/lex- Indeed:https://indeed.com/lex 获得 75 美元信用额度- ExpressVPN:https://expressvpn.com/lexpod 获得 3 个月免费使用 剧集链接:Andrew 的网站:https://www.physics.harvard.edu/people/facpages/stromi

#325 – Michael Levin:生物学、生命、外星人、进化、胚胎发生和异种机器人

#325 – Michael Levin: Biology, Life, Aliens, Evolution, Embryogenesis & Xenobots

迈克尔·莱文 (Michael Levin) 是塔夫茨大学的生物学家,致力于研究理解和控制生物系统中复杂模式形成的新方法。请查看我们的赞助商来支持此播客:- Henson Shaving:https://hensonshaving.com/lex 并使用代码 LEX 获得 100 个免费刀片和剃须刀- Eight Sleep:https://www.eightsleep.com/lex 获得特别优惠- LMNT:https://drinkLMNT.com/lex 获取免费样品包- InsideTracker:https://insidetracker.com/lex 获得 20% 折扣剧集链接

#306 – Oriol Vinyals:深度学习和通用人工智能

#306 – Oriol Vinyals: Deep Learning and Artificial General Intelligence

Oriol Vinyals 是 DeepMind 的研究总监和深度学习负责人。请查看我们的赞助商来支持此播客: - Shopify:https://shopify.com/lex 获得 14 天免费试用 - Weights & Biases:https://lexfridman.com/wnb - Magic Spoon:https://magicspoon.com/lex 并使用代码 LEX 获得 5 美元折扣 - Blinkist:https://blinkist.com/lex 并使用代码 LEX 获得 25% 的高级折扣 EPISODE LINKS:Oriol 的 Twitter:ht

等权重 HAR 组合

Equal-weight HAR combination

这真是让我震惊。真是太有见地了。在另一个背景下,等权重组合规则!另请参阅我与 Minchul Shin 合作的论文,这些论文分别明确指出了点预测和密度预测的权重相等:Diebold, F.X. 和 Shin, M. (2019),“机器学习用于正则化调查预测组合:部分平等的套索及其衍生物”,《国际预测杂志》,35,1679-1691。Diebold, F.X.、Shin, M. 和 Zhang, B. (2022),“关于概率评估的聚合:欧元区通胀和实际利率的正则化预测密度混合”,《计量经济学杂志》,即将出版。工作论文,arXiv:2012.11649。HAR 模型中的预测组合难题作者:Cle

#120 – François Chollet:智力测量

#120 – François Chollet: Measures of Intelligence

François Chollet 是 Google 的人工智能研究员,也是 Keras 的创建者。通过支持我们的赞助商来支持此播客(并获得折扣):- Babbel:https://babbel.com 并使用代码 LEX- MasterClass:https://masterclass.com/lex- Cash App:下载应用程序并使用代码“LexPodcast”剧集链接:Francois 的 Twitter:https://twitter.com/fcholletFrancois 的网站:https://fchollet.com/关于智力的衡量(论文):https://arxiv.org

使用 tfprobability 的简易 PixelCNN

Easy PixelCNN with tfprobability

PixelCNN 是一种深度学习架构(或架构包),旨在生成高度逼真的图像。要使用它,无需对 arXiv 论文进行逆向工程或搜索参考实现:TensorFlow Probability 及其 R 包装器 tfprobability 现在包含一个 PixelCNN 分布,可用于以可参数化的方式训练直接定义的神经网络。

开放科学要点:预印本

Open Science Essentials: Preprints

2 分钟内了解开放科学要点,第 4 部分 在研究文章发表在期刊上之前,您可以免费将其提供给任何人阅读。您可以在自己的网站上执行此操作,也可以在预印本服务器(例如 psyarxiv.com)上执行此操作,其他研究人员也在那里分享他们的预印本,……继续阅读“开放科学要点:预印本”

百度人工智能超级计算机 (Minwa) 在图像识别方面击败谷歌

Baidu’s Artificial-Intelligence Supercomputer (Minwa) Beats Google at Image Recognition

近来,图像分类中不断提升的判别能力的竞争愈演愈烈。2 天前,中国百度搜索公司宣布,他们打破了微软研究院在图像识别领域创下的记录,错误率仅降低了 0.36%。微软在近 3 个月前的 2015 年 2 月首次超越了人类的识别性能,而谷歌目前排名第二。所有这一切都是通过使用深度卷积网络和深度学习方案实现的,即构建神经形态识别方案,其中原始信息经过多个中间层,然后给出所需的类别识别输出。这是通过使用巨大的计算能力(超级计算机)来实现的,这种能力被用于对大量真实数据进行系统训练。这些新闻是对之前关于人类情感模拟和识别的文章的后续报道,科学家报告说,相应的系统可以达到并略微超过人类对情感的识别性能!对于那

モデルの里付け理论-大きいモデルほど性能!?

大規模言語モデルの裏付け理論-大きいモデルほど高性能!?

AI(人工智能)一词已经在日常生活中使用了很长时间。根据总务省《信息通信白皮书》,我们目前正处于第三次人工智能热潮。 这种热潮始于 2000 年代的日本。机器学习,即人工智能通过使用被称为大数据的大量数据自行获取知识,已经投入实际应用。此外,深度学习已经开始,人工智能通过定量地表示识别知识等对象时应注意的特征来获取知识。 然后,在 2020 年代,出现了大规模语言模型(LLM)。这是一种基于深度学习技术创建的语言模型,其特点是能够流畅地处理语言,类似于人类对话或聊天交流。为此,需要解释对方所说的词语(数据),相应地预测对话的主题,并做出适当的回应。这导致了生成式人工智能的出现,例如 OpenA