输出的关键词检索结果

使用功能测试掌握提示工程:可靠LLM输出的系统指南

Mastering Prompt Engineering with Functional Testing: A Systematic Guide to Reliable LLM Outputs

如何使用由输入/输出数据固定装置组成的算法测试的系统方法进行及时评估,可以使复杂AI任务的及时工程更加可靠。邮政及时及时使用功能测试的帖子促进工程:可靠的LLM输出的系统指南首先出现在数据科学方面。

时光倒流:输入输出的不确定性让时间倒流

Назад в прошлое: неопределенность входа-выхода поворачивает время вспять

一组科学家已成功在量子系统中实现了时间反转。

培训llms以自我氧化语言

Training LLMs to self-detoxify their language

MIT-IBM WATSON AI实验室的一种新方法可帮助大型语言模型转向他们对更安全,更符合价值的输出的反应。

通过传输激活来控制语言和扩散模型

Controlling Language and Diffusion Models by Transporting Activations

大型生成模型变得越来越有能力,并且更广泛地部署到电力生产应用程序中,但是让这些模型确切地产生所需的东西仍然具有挑战性。对这些模型的输出的细粒度控制对于满足用户的期望和减轻潜在的滥用非常重要,从而确保了模型的可靠性和安全性。为了解决这些问题,Apple Machine Learning研究人员开发了一种新技术,该技术具有模态性敏捷性,并通过可忽略的计算开销对模型的行为进行了精细的控制,而…

英国服务和综合PMI经济学家

UK services and composite PMIs underwhelm economists

英国服务部门在3月看到了“适度的扩张”,但经济学家高估了S&P Global的采购经理指数(PMI)本月的读数。标准普尔全球最新的综合PMI阅读,该月份的平均生产和服务输出为51.5。该图指出英国输出的略有扩展[...]

AI是否可以预测未来疾病将如何传播? 可以由AI设计下一个Triple-A游戏吗? 专家反应:塔斯马尼亚州超过150个假杀手鲸的质量搁浅 澳大利亚的道路安全即将到来? semaglutide使用与眼睛状况相关的使用,但风险可能低于我们认为的 '雾收集'可以从世界上最干燥地区的稀薄空气中拉出水 不要吃面包屑 - 使电子设备改为

Is AI the answer to predicting how future diseases will spread?

国际科学家,包括澳大利亚人,称人工智能(AI)有可能改变传染病流行病学,这是对疾病如何传播的研究。专家概述了AI的最新进展如何帮助回答关键问题,并讨论可用于常规收集的传染病监测数据的现有AI方法。他们还考虑使用AI进行流行病学的社会背景,包括解释性,安全性,问责制和道德等问题。最后,他们确定了当前AI的一些解决流行病学的局限性,包括无法解释推理,大多数现有模型仅限于文本或语音输出的事实,以及大型科技公司的所有权,这些公司花费了巨额资金来培训AIS。并选择何时以及如何发布新的迭代。作者总结说,等待新的AI部署来微调它们以回答流行病学问题可能不是可持续或公平的。

DialogGPT 正在开辟一条 AI 理解的新道路

DialogGPT Is Forging A New Path In AI Understanding

传统的聊天机器人建立在僵化的决策树和基本的自然语言处理 (NLP) 之上,通常难以应对现实世界中复杂的对话,例如多部分查询、突然的话题转换或客户的不同措辞。这些限制浪费了宝贵的时间、资源和收入。Dialog GPT 是一种生成式 AI 解决方案,它改变了 AI 代理与客户互动的方式。借助此功能,您的代理将变得适应性强、对上下文敏感且具有意识,从而提高客户满意度、简化运营并推动业务增长。AI 代理通过自动执行具有可变输入和输出的复杂任务而脱颖而出,而这些挑战在历史上一直难以有效解决。在本文中,我们将探讨 Dialog GPT 如何解决传统系统的局限性。我们还将探讨它为何能够改变客户服务、运营效率

人类大脑的运作速度惊人地缓慢

The Human Brain Operates at a Stunningly Slow Pace

大脑有时被称为已知宇宙中最复杂的机器。但它输出的思维速度只有每秒 10 比特,与对话速度一样慢

新研讨会:“研究与人工智能:使用人工智能工具的原则与实践”

New Workshop: "Research & AI: Principles and Practices for Using AI Tools"

研究与人工智能:使用人工智能工具的原则和实践 Reed Hepler 主持的图书馆 2.0“人工智能深度探索”研讨会概述:这个 90 分钟的研讨会探讨了人工智能在学术研究和数字信息素养方面的变革潜力。我们将讨论人工智能工具的优势和局限性,重点关注信息收集、批判性分析和负责任的使用等方面。我们将研究 ChatGPT、Semantic Sc​​holar 和 Perplexity 等工具,以简化研究过程,包括进行文献综述、优化搜索查询和组织信息源。本次会议还探讨了人工智能的已知缺陷,例如“幻觉”、偏见和程序化融洽关系,这些缺陷可能会无意中影响人们对人工智能能力的看法。通过了解人工智能的内部工作原理

无监督 LLM 评估

Unsupervised LLM Evaluations

从业者判断大型语言模型输出的指南评估人工智能生成的输出对于构建大型语言模型的稳健应用程序至关重要,因为它允许将复杂的人工智能应用程序拆分为具有内置错误控制的简​​单阶段。在监督模式下评估生成输出相对简单,其中“正确答案”可以由人类评估者计算或提示。同时,在许多实际的 LLM 应用中,监督方法过于严格,需要能够解决开放式问题的评估。构建无监督评估器的最简单方法是要求 LLM 自我评估。然而,生成模型检测自身输出错误的能力尚不清楚。我们证明,通过迭代自我反思可以提高自我评估的质量。与“思想链”技术类似,该方法以推理时的计算量换取最终结果的稳健性。带有示例的 Google Colab 笔记本链接:h

最小可行 MLE

Minimum Viable MLE

构建最小的可用于生产的情绪分析模型照片由 Stephen Dawson 在 Unsplash 上拍摄什么是可用于生产的模型?我们听到了很多关于生产化机器学习的消息,但拥有一个可以在实际应用中蓬勃发展的模型到底意味着什么?有很多因素会影响机器学习模型在生产中的有效性。为了本文的目的,我们将重点介绍其中的五个。可重复性监控测试自动化版本控制服务推理构建可用于生产的机器学习模型的最重要部分是能够访问它。为此,我们构建了一个提供情绪分析响应的 fastapi 客户端。我们利用 pydantic 来确保输入和输出的结构。我们使用的模型是 huggingface 的 transformers 库中的基础情

发现 Llama 模型中每个神经元的作用

Discover What Every Neuron in the Llama Model Does

Transluce 的新工具正在改变 AI 透明度的游戏规则——一个测试用例和一些值得思考的内容作者提供的图片——正在使用新工具!Transluce 是一家新成立的非营利研究实验室,肩负着鼓舞人心的使命,刚刚发布(23.10.24)一款引人入胜的工具,可深入了解 LLM 中的神经元行为。或者用他们自己的话说:当 AI 系统表现异常时,我们希望了解解释行为发生原因的“思维过程”。这使我们能够预测和修复 AI 模型的问题,发现隐藏的知识,并发现习得的偏见和虚假相关性。为了完成他们的使命,他们推出了一个可观察性界面,您可以在其中输入自己的提示,接收响应并查看哪些神经元被激活。然后,您可以探索激活的神

Google DeepMind 正在开源其 AI 文本水印

Google DeepMind is making its AI text watermark open source

Google DeepMind 开发了一种用于识别人工智能生成文本的工具,并将其开源。该工具名为 SynthID,是用于生成人工智能输出的大型水印工具系列的一部分。该公司去年推出了一种用于图像的水印,此后又推出了一种用于人工智能生成的视频的水印。今年 5 月,……

欧盟人工智能法规 (2/4) - 高风险人工智能系统

EUのAI規則(2/4)-高リスクAIシステム

■概要 《欧盟人工智能法规》(以下简称《法规》)于2024年6月13日在《欧盟公报》上正式发布,并于同年8月1日生效。本文是该规则评论系列四篇文章中的第二篇。欧盟协调法(欧盟内部标准化产品安全标准等的法规)中列出的产品及其安全装置的人工智能系统,以及影响该法规中列出的人员的权利和安全的人工智能系统被称为高人工智能系统。风险人工智能系统并受到特殊法规的约束。 高风险人工智能系统必须满足的要求包括(1)建立风险管理系统,(2)数据治理,(3)创建技术文档并保存记录,(4)创建使用说明,以及(5)人类(6) 准确性和稳健性。本条例对各项具体措施作出了规定。 它还规定了高风险人工智能系统的供应商、进口

物理学强化学习:ODE 和超参数调整

Reinforcement Learning for Physics: ODEs and Hyperparameter Tuning

使用 gymnasium 控制微分方程并优化算法超参数照片由 Brice Cooper 在 Unsplash 上拍摄如前所述,强化学习 (RL) 提供了一种强大的新工具来应对控制非线性物理系统的挑战。非线性物理系统的特点是行为复杂,输入的微小变化可能导致输出的剧烈变化,或者只有微小的输出变化可能来自大输入。解决方案可以分裂,相同条件可以产生不同的输出,甚至以路径依赖的形式具有“记忆”。我们介绍了两种将 RL 应用于非线性物理系统的不同方法:传统的基于神经网络的软演员评论家 (SAC) 和不常见的基于遗传算法的遗传编程 (GP) 方法。简而言之,SAC 使用两个神经网络,一个用于学习环境的行为方

欧盟人工智能法规 (1/4) - 概述、定义、禁止的人工智能行为

EUのAI規則(1/4)-総論、定義、禁止されるAIの行為

■概要 2024年6月13日,《欧盟人工智能条例》(以下简称《条例》)在《欧盟期刊》(相当于日本官方公报)上发布,并于同年8月1日生效。从现在开始,我想用四部分的系列来解释这些规则。这些人工智能法规的两个主要目标是确保人们的权利和安全以及支持创新。第一篇文章介绍了这些法规的适用范围、定义和禁止的人工智能行为。 适用范围主要是在欧盟境内将人工智能系统推向市场或提供服务的提供商,以及在欧盟境内将人工智能系统用于商业目的的部署者。这些企业将被施加一定的义务,特别是那些引入和使用高风险人工智能系统的企业,这将在第二份报告中讨论。 定义中重要的是AI系统本身。这些规则有详细定义。概括来说,它是一个根据输

研究评估文化的人力成本

The Human Costs of the Research-Assessment Culture

Rachel Brazil,《自然》 “REF-able” 一词现在在英国大学中很常见。 “每个人都在不断地从‘REF-able’输出的角度来思考研究,从‘REF-able’的角度来思考研究......

制冷系统上的恒温膨胀阀是什么

What is Thermostatic Expansion Valve on a Refrigeration System

1:什么是恒温膨胀阀 热或恒温膨胀阀用于制冷和空调系统。它起节流机构的作用,根据蒸发器输出的温度和压力条件控制制冷剂流入系统蒸发器的流量。恒温膨胀阀是 […]The post What is the Thermostatic Expansion Valve on a Refrigeration System appeared first on Merchant Navy Decoded.