LLM关键词检索结果

国际清算银行在 AI/LLM 和女权主义与生殖方面犯了错误

The BIS gets it wrong on AI/LLM and feminism & reproduction

国际清算银行发布了一份关于人工智能和大型语言模型实用性的公告。他们对此并不十分满意。当面对需要推理他人知识和反事实的逻辑难题时,大型语言模型 (LLM) 显示出独特且具有启发性的失败模式。 当面对互联网上可用的难题原始措辞时,LLM 表现完美,但当偶然细节发生变化时,表现不佳,这表明缺乏对底层逻辑的真正理解。 我们的研究结果并没有减损央行在数据管理、宏观分析和监管/监督方面应用机器学习的巨大进展。然而,它们确实表明,在需要严格推理的经济分析环境中部署 LLM 时应谨慎行事。

如何在软件开发人员的工作中使用 LLM [包括案例研究]

How To Use LLMs in a Software Developer’s Work [Case Study Included]

如果您想知道 DLabs.AI 的开发人员如何使用 AI,以及您如何使用 AI,那么您来对地方了。通过回顾我们如何创建一个名为 SugarAssist 的内部项目(糖尿病助手),您将了解我们在日常工作中在哪里以及如何使用 AI。文章如何在软件开发人员的工作中使用 LLM [包括案例研究] 由 DLabs.AI 提供。

弥合差距:企业搜索和 LLM 如何彻底改变知识管理

Bridging the Gap: How Enterprise Search and LLMs are Revolutionizing Knowledge Management

为什么重要:在此博客文章中探索企业搜索和大型语言模型 (LLM) 在革新知识管理方面的变革性协同作用。

大型语言模型 LLM 指南

A Guide Large Language Model LLM

大型语言模型 (LLM):2024 年完整指南 您需要了解的有关 LLM 的一切 索引表 简介 什么是大型语言模型? 基本因素 LLM 的流行示例 LLM 的构建块 LLM 模型是如何训练的? LLM 依靠监督学习还是无监督学习 训练 LLM LLM 的兴起 流行用例 […]

大型语言模型 (LLM):最重要的 3 种方法

Large Language Models (LLM): Top 3 of the Most Important Methods

大型语言模型最近因其高度称职的用例 ChatGPT 一夜成名而获得了巨大的关注。看到 ChatGPT 和其他聊天机器人的成功,许多人和组织开始对探索支持此类软件的技术感兴趣。大型语言模型是该软件背后的支柱,它使 [...]

介绍我们在通用 LLM 代理方面的工作

Introducing our work on general-purpose LLM Agents

在 GoodAI,我们致力于突破人工智能的界限。我们目前的重点是开发基于大型语言模型 (LLM) 的代理,这些代理的个性超越了简单的对话,而是表现出 LLM 驱动的行为,与人类和其他代理以及他们的虚拟环境进行交互。我们的代理从反馈中学习,存储长期记忆并表达以目标为导向的行为。我们正在 LLM 之上构建一个认知架构,用作推理引擎,并添加长期记忆,这是持续学习的基础。释放大型语言模型代理的潜力自 2021 年以来,我们一直将我们的研究应用于 AI People 的开发,这是我们的内部视频游戏,LLM 代理在其中栩栩如生。在这个开放式沙盒模拟中,代理彼此之间以及与环境之间进行交互,建立关系并表现出情

教授 LLM 代理控制无人机

LLM Agent taught to control drones

在上面的视频中,我们演示了我们的一个 LLM 代理学习如何使用 API 来控制无人机四轴飞行器的学习过程。初始阶段需要我们向代理提供详细而全面的说明,说明如何发送 HTTP 请求以及通过 API 可以使用哪些命令。随着视频的进展,代理很快掌握了这些说明,并利用它已有的知识来执行高级而复杂的任务,例如让无人机沿着方形轨迹飞行。这展示了代理的弹性和自适应学习能力 - 代理如何从错误和错误假设中恢复。此版本的持续学习代理代表了我们的第一个原型(体现在 Python 终端中的代理)的重大进步。这个增强的代理可以访问不同形式的工作记忆和长期记忆,使其能够有效地管理几种类型的记忆不一致,例如矛盾或过时的信

HALLM:通过 Python 终端观察和行动的代理

HALLM: An Agent that Observes and Acts through a Python Terminal

在 GoodAI,我们致力于安全 AGI 的进步。大型语言模型 (LLM) 无疑提供了强大的功能,但它们本身也存在局限性 — 尤其是无法在部署后学习新技能。我们的创新方法正是在这里大放异彩。我们设计的代理不仅可以利用 LLM 的基础功能,还可以对其进行显著扩展。通过我们独特的架构和新颖的方法,我们的代理赋予 LLM 持续学习的能力,使它们能够理解复杂的指令、随着时间的推移进行适应,并在复杂的推理和解决问题的任务中表现出色。HALLM 可以联系用户以询问更多信息,或者如果它认为用户可以帮助它做某事,例如安装 Python 包或重新启动系统。在上面的视频中,HALLM 使用内置函数“input”要

为什么我们没有看到任何主流游戏使用 LLM 驱动的 AI NPC?

Why haven't we seen any mainstream games utilizing LLM-driven AI NPCs?

因为这很难……我们在过去四年中一直致力于这项工作。制作一个简单的概念验证 (PoC) 很容易(我们已经见过很多),但要将其完善到生产级别,需要付出 1,000 倍的努力,因为会出现更深层次的复杂性:1) 成本:通过 API 使用 LLM 意味着有人必须为每个玩家每小时支付数千个代币。是的,你可以在玩家的 GPU 上运行较小的 LLM(例如 Mistral、Llama3 8b),但质量和功能可能不足以提供引人入胜的叙事和游戏玩法。2) 现在还为时过早:GPT-3.5 才 1.5 年,GPT-4 才 1 年。3) 当前的 LLM:它们可能无法在长时间的游戏会话中运行多智能体叙事。上下文大小不足以一

查找黄金示例:一种更智能的文化学习方法

Finding Golden Examples: A Smarter Approach to In-Context Learning

从随机示例选择到系统的Aupair生成 - 如何使LLM提示实际上是在工作的帖子查找黄金示例:更智能的秘密学习方法首先出现在数据科学方面。

llms中上下文工程的温和介绍

A Gentle Introduction to Context Engineering in LLMs

提示之前,请设计上下文。这是每个人都需要的初学者指南。

Microsoft揭幕项目IRE:自主检测恶意软件的AI

Microsoft unveils Project Ire: AI that autonomously detects malware

Microsoft的项目IRE使用AI自动反向工程师并将软件分类为恶意或良性。 Microsoft宣布了IRE Project IRE,这是一种自动人工智能(AI)系统,可以自主反向工程和对软件进行分类。 IRE项目是使用LLM驱动的自动型恶意软件分类系统,该系统使用分解器和其他工具,审查其输出,并确定[…]

Microsoft研究人员对AI安全代理的看涨,即使它让74%的恶意软件通过

Microsoft researchers bullish on AI security agent even though it let 74% of malware slip through

IRE项目有望使用LLMS检测代码是恶意还是benignmicrosoft推出了它声称可以在没有人为援助的情况下检测恶意软件的自主AI代理。

早期的书籍出版:成长为学者

Early-Career Book Publishing: Growing Roots as Scholars

In the 1st installment of 3 career-focused articles, scientists who completed books as early-career researchers reflect on the positive outcomes the experience had on their professional development.

AI判断AI:使用Amazon Nova缩放非结构化文本分析

AI judging AI: Scaling unstructured text analysis with Amazon Nova

在这篇文章中,我们强调了如何在亚马逊基岩中部署多个生成AI模型,以指示LLM模型创建文本响应的主题摘要。然后,我们展示如何使用多个LLM模型作为陪审团来审查这些LLM生成的摘要,并分配评分来判断摘要标题和摘要描述之间的内容一致性。

HandMade.com如何现代化产品图像和描述使用Amazon Bedrock和Amazon OpenSearch Service

How Handmade.com modernizes product image and description handling with Amazon Bedrock and Amazon OpenSearch Service

在这篇文章中,我们探索了领先的手工艺品市场HandMade.com如何通过使用Amazon Bedrock和Amazon OpenSearch服务实施AI-Driens的产品来对其产品描述进行现代化处理。该解决方案结合了人类的Claude 3.7十四行诗LLM,用于生成描述,亚马逊泰坦文本嵌入式V2用于矢量嵌入的V2以及语义搜索功能,以自动化和增强超过60,000个项目的目录中的产品描述。

周末阅读:重新思考位置在英国高等教育政策中的作用

Weekend Reading: Rethinking the Role of Place in UK Higher Education Policy

在由技能,知识和组织绩效中心(Skope)会议提示的HEPI注释中,尼克·希尔曼(Nick Hillman)问:Robbins开创性的Robbins报告是否应告知即将到来的16年后战略?他提到了Skope教授Robson教授提出的关于“鼓励基于地点的方法……并以协调代替竞争的需求。

参议院确认特朗普对反恐机构的选秀

Pat Tillman's Brother Allegedly Started a Fire at California Post Office to Send a Message

新近密封的法院文件称,理查德·蒂尔曼(Richard Tillman)向警察承认,他将车辆驱车带入北加州邮局,并着火了,“试图向美国政府发表声明”。