复合 AI 系统、Txt2SQL 和数据代理。关于 Apple 智能模型。构建 AI 代理的课程。 NVIDIA Nemotron-4 340B。新内存调优。agentUniverse。让我们重现 GPT-2。代理混合
TinyAgent: Function Calling at the Edge
LLM 能够通过普通语言(例如英语)执行命令,这使得代理系统能够通过协调正确的工具集(例如 ToolFormer、Gorilla)来完成用户查询。这与最近的多模式努力(例如 GPT-4o 或 Gemini-1.5 模型)一起扩大了 AI 代理的可能性范围。虽然这非常令人兴奋,但这些模型的模型大小和计算要求通常要求在云端进行推理。这可能会给它们的广泛采用带来一些挑战。首先,将视频、音频或文本文档等数据上传到云端的第三方供应商可能会导致隐私问题。其次,这需要云/Wi-Fi 连接,而这并不总是可行的。例如,部署在现实世界中的机器人可能并不总是有稳定的连接。除此之外,延迟也可能是一个问题,因为将大量数
AI 编码代理的状态。SWE-Agent。Amazon Q。Devin。OpenDevin。Devika。Blackbox AI。GPT-Engineer。ChatDev。KHOJ 个人 AI 代理。Perplexica。 CogVLM2。世界模型。
Developing Strong Self-Efficacy with Student Agency
学生代理的自我效能 代理是研究人员提到的一套基本技能的综合集合,因为自我效能、计划和行动、反思学习和拥有成长心态对学生的长期成功至关重要。Debbie Thomas Silver 博士和 Debra Stafford 的《教孩子茁壮成长》一书中对此进行了解释。Silver 博士和 […]
To build a better AI helper, start by modeling the irrational behavior of humans
一种新技术可用于预测在朝着未知目标努力时表现不佳的人类或 AI 代理的行为。
USAMMC-K provides MEDLOG support during Freedom Shield 2024
美国陆军韩国医疗物资中心的支援人员在 2024 年自由之盾行动期间履行了其作为驻韩美军医疗物资战区首席代理的职责。
USAMMC-K provides MEDLOG support during Freedom Shield 2024
大韩民国卡罗尔营 - 韩国美国陆军医疗物资中心的维持人员发挥了他们作为战区医疗物资牵头代理的作用......
Soft Computing, Volume 28, Issue 7-8, April 2024
1) 某些树结构的紧密度作者:Hande Tunçel Gölpek页数:5751 - 57632) 使用新的数据驱动优化方法进行家庭医疗保健设备生产组合设计作者:Mohammad Sheikhasadi、Amirhossein Hosseinpour...Masoud Rabbani页数:5765 - 57843) 用于强广义最小标签生成树问题的基于社区的之字形引导算法作者:Hao Long、Yinyan Long...Fu-ying Wu页数:5785 - 57934) 具有增强开发和探索功能的持续人工学习优化作者:Ling Wang、Yihao Jia...Minrui Fei页数:57
Deepland’s XLand: What it is and How it Will Advance AI
重要性:XLand 是人工智能代理的数字 3D 训练环境。该环境类似于丰富多彩的电子游戏游乐场。在这个游乐场中,玩家面临着需要解决的数十亿个不同任务。
Британские роботы по утилизации бомб получают тактильную обратную связь (+видео)
如果拆弹专家能够在可以远程控制的机器人代理的帮助下完成工作,那么他们就不必在每次需要拆除爆炸装置时冒着生命危险。
Introducing our work on general-purpose LLM Agents
在 GoodAI,我们致力于突破人工智能的界限。我们目前的重点是开发基于大型语言模型 (LLM) 的代理,这些代理的个性超越了简单的对话,而是表现出 LLM 驱动的行为,与人类和其他代理以及他们的虚拟环境进行交互。我们的代理从反馈中学习,存储长期记忆并表达以目标为导向的行为。我们正在 LLM 之上构建一个认知架构,用作推理引擎,并添加长期记忆,这是持续学习的基础。释放大型语言模型代理的潜力自 2021 年以来,我们一直将我们的研究应用于 AI People 的开发,这是我们的内部视频游戏,LLM 代理在其中栩栩如生。在这个开放式沙盒模拟中,代理彼此之间以及与环境之间进行交互,建立关系并表现出情
LLM Agent taught to control drones
在上面的视频中,我们演示了我们的一个 LLM 代理学习如何使用 API 来控制无人机四轴飞行器的学习过程。初始阶段需要我们向代理提供详细而全面的说明,说明如何发送 HTTP 请求以及通过 API 可以使用哪些命令。随着视频的进展,代理很快掌握了这些说明,并利用它已有的知识来执行高级而复杂的任务,例如让无人机沿着方形轨迹飞行。这展示了代理的弹性和自适应学习能力 - 代理如何从错误和错误假设中恢复。此版本的持续学习代理代表了我们的第一个原型(体现在 Python 终端中的代理)的重大进步。这个增强的代理可以访问不同形式的工作记忆和长期记忆,使其能够有效地管理几种类型的记忆不一致,例如矛盾或过时的信
Introducing GoodAI LTM Benchmark
作为我们在持续学习领域研究工作的一部分,我们正在开源一个基准,用于测试代理在非常长的对话中执行涉及高级使用记忆的任务的能力。除其他外,我们评估代理在需要动态维护记忆或长期整合信息的任务上的表现。我们正在开源:现行的 GoodAI LTM 基准。我们的 LTM 代理。我们的实验数据和结果。我们表明,信息的可用性是解决这些任务的必要条件,但不是充分条件。在我们的初始基准中,具有 8k 上下文的对话 LTM 代理与具有 128k 个令牌的长上下文 GPT-4-1106 相当。在内存要求高出 10 倍的更大基准测试中,我们的具有 8k 上下文的对话式 LTM 代理的性能比上下文大小为 128,000
GoodAI LTM Benchmark v3 Released
GoodAI LTM 基准测试的主要目的一直是作为我们在开发能够持续和终身学习的代理方面取得进展的客观衡量标准。但是,我们也希望它对开发此类代理的任何人都有用。为了实现这一点,我们已将此版本定位为更易于理解并产生更标准化的结果,我们希望这些结果更容易进行比较和分析。从基准测试的第一个版本开始,我们就将特定的测试实例分组到数据集或任务类型中。例如,有一个名为“购物清单”的数据集,我们可以从中抽取任意数量的不同测试实例,以评估代理记住一系列物品并保留用户购物清单的更新版本的能力。在早期版本中,每个测试可能会产生任意数量的分数点,并且这些分数点未标准化。这可能导致令人困惑的情况,即通过高度复杂的测试
LTM Benchmark: Improvements and new reports
在 GoodAI,我们致力于开发能够持续和终身学习的代理。作为我们努力的一部分,我们之前已经开源了 GoodAI LTM 基准,这是一套旨在评估任何对话代理的长期记忆 (LTM) 能力的测试。在这个基准中,所有任务都作为代理和我们的虚拟测试人员之间一次非常长的对话的一部分进行。基准交织了来自不同任务的信息和探索性问题,尽管特别注意将它们编织成自然对话。LTM = 长期记忆作为我们对具有 LTM 的代理进行研究的直接结果,GoodAI LTM 基准在不断发展。对我们来说,它是评估我们的代理和验证我们的假设的宝贵工具。此外,它帮助我们描述不同代理失败的方式,因此它为我们提供了目标。在 GoodAI
Smart IDReader распознает клиентов быстро и на СОВЕСТЬ
第一张分期卡(QIWI集团的项目)“Conscience”将Smart Engines开发的客户文档识别模块集成到其销售代理的移动应用程序中。
Thomas Schelling, Methodological Subversive
托马斯·谢林昨天去世,享年 95 岁。在经济理论几乎成为应用数学的代名词的时代,他仅通过密切观察、精确推理和易于描述但具有复杂和令人惊讶的属性的简单模型,就成功地对广泛的现象产生了深刻的见解。我认为这一点得到了广泛的赞赏。但他的工作的另一个特点是缺乏对专业方法规范的关注。这使他能够非常自由地产生新知识,并在方法上进行创新,而这些创新最终可能比他对经济和社会生活的具体见解更为重要。例如,考虑一下他著名的“棋盘”自形成社区模型,该模型首次在 1969 年的一份备忘录中提出,其版本发表在 1971 年的一篇文章和 1978 年的著作《微观动机和宏观行为》中。这个模型很简单,可以用几段话来口头描述,但
客座文章作者:Martin Stránský,研究科学家 @GoodAI图 1. GoodAI 架构开发路线图比较(全尺寸)人工智能,尤其是深度学习领域的最新进展令人叹为观止。这对于任何对该领域感兴趣的人来说都是非常鼓舞人心的,但人类水平的人工智能的真正进展却很难评估。人工智能的评估是一个非常困难的问题,原因有很多。例如,对智能机器的基本要求缺乏共识是开发比较不同代理的统一方法的主要障碍之一。尽管许多研究人员专门关注这个主题(例如 José Hernández-Orallo 或 Kristinn R. Thórisson 等),但该领域将受益于人工智能社区的更多关注。评估人工智能的方法是帮助评