New Workshop: "Research & AI: Principles and Practices for Using AI Tools"
研究与人工智能:使用人工智能工具的原则和实践 Reed Hepler 主持的图书馆 2.0“人工智能深度探索”研讨会概述:这个 90 分钟的研讨会探讨了人工智能在学术研究和数字信息素养方面的变革潜力。我们将讨论人工智能工具的优势和局限性,重点关注信息收集、批判性分析和负责任的使用等方面。我们将研究 ChatGPT、Semantic Scholar 和 Perplexity 等工具,以简化研究过程,包括进行文献综述、优化搜索查询和组织信息源。本次会议还探讨了人工智能的已知缺陷,例如“幻觉”、偏见和程序化融洽关系,这些缺陷可能会无意中影响人们对人工智能能力的看法。通过了解人工智能的内部工作原理
从业者判断大型语言模型输出的指南评估人工智能生成的输出对于构建大型语言模型的稳健应用程序至关重要,因为它允许将复杂的人工智能应用程序拆分为具有内置错误控制的简单阶段。在监督模式下评估生成输出相对简单,其中“正确答案”可以由人类评估者计算或提示。同时,在许多实际的 LLM 应用中,监督方法过于严格,需要能够解决开放式问题的评估。构建无监督评估器的最简单方法是要求 LLM 自我评估。然而,生成模型检测自身输出错误的能力尚不清楚。我们证明,通过迭代自我反思可以提高自我评估的质量。与“思想链”技术类似,该方法以推理时的计算量换取最终结果的稳健性。带有示例的 Google Colab 笔记本链接:h
构建最小的可用于生产的情绪分析模型照片由 Stephen Dawson 在 Unsplash 上拍摄什么是可用于生产的模型?我们听到了很多关于生产化机器学习的消息,但拥有一个可以在实际应用中蓬勃发展的模型到底意味着什么?有很多因素会影响机器学习模型在生产中的有效性。为了本文的目的,我们将重点介绍其中的五个。可重复性监控测试自动化版本控制服务推理构建可用于生产的机器学习模型的最重要部分是能够访问它。为此,我们构建了一个提供情绪分析响应的 fastapi 客户端。我们利用 pydantic 来确保输入和输出的结构。我们使用的模型是 huggingface 的 transformers 库中的基础情
Discover What Every Neuron in the Llama Model Does
Transluce 的新工具正在改变 AI 透明度的游戏规则——一个测试用例和一些值得思考的内容作者提供的图片——正在使用新工具!Transluce 是一家新成立的非营利研究实验室,肩负着鼓舞人心的使命,刚刚发布(23.10.24)一款引人入胜的工具,可深入了解 LLM 中的神经元行为。或者用他们自己的话说:当 AI 系统表现异常时,我们希望了解解释行为发生原因的“思维过程”。这使我们能够预测和修复 AI 模型的问题,发现隐藏的知识,并发现习得的偏见和虚假相关性。为了完成他们的使命,他们推出了一个可观察性界面,您可以在其中输入自己的提示,接收响应并查看哪些神经元被激活。然后,您可以探索激活的神
Google DeepMind is making its AI text watermark open source
Google DeepMind 开发了一种用于识别人工智能生成文本的工具,并将其开源。该工具名为 SynthID,是用于生成人工智能输出的大型水印工具系列的一部分。该公司去年推出了一种用于图像的水印,此后又推出了一种用于人工智能生成的视频的水印。今年 5 月,……
■概要 《欧盟人工智能法规》(以下简称《法规》)于2024年6月13日在《欧盟公报》上正式发布,并于同年8月1日生效。本文是该规则评论系列四篇文章中的第二篇。欧盟协调法(欧盟内部标准化产品安全标准等的法规)中列出的产品及其安全装置的人工智能系统,以及影响该法规中列出的人员的权利和安全的人工智能系统被称为高人工智能系统。风险人工智能系统并受到特殊法规的约束。 高风险人工智能系统必须满足的要求包括(1)建立风险管理系统,(2)数据治理,(3)创建技术文档并保存记录,(4)创建使用说明,以及(5)人类(6) 准确性和稳健性。本条例对各项具体措施作出了规定。 它还规定了高风险人工智能系统的供应商、进口
Reinforcement Learning for Physics: ODEs and Hyperparameter Tuning
使用 gymnasium 控制微分方程并优化算法超参数照片由 Brice Cooper 在 Unsplash 上拍摄如前所述,强化学习 (RL) 提供了一种强大的新工具来应对控制非线性物理系统的挑战。非线性物理系统的特点是行为复杂,输入的微小变化可能导致输出的剧烈变化,或者只有微小的输出变化可能来自大输入。解决方案可以分裂,相同条件可以产生不同的输出,甚至以路径依赖的形式具有“记忆”。我们介绍了两种将 RL 应用于非线性物理系统的不同方法:传统的基于神经网络的软演员评论家 (SAC) 和不常见的基于遗传算法的遗传编程 (GP) 方法。简而言之,SAC 使用两个神经网络,一个用于学习环境的行为方
■概要 2024年6月13日,《欧盟人工智能条例》(以下简称《条例》)在《欧盟期刊》(相当于日本官方公报)上发布,并于同年8月1日生效。从现在开始,我想用四部分的系列来解释这些规则。这些人工智能法规的两个主要目标是确保人们的权利和安全以及支持创新。第一篇文章介绍了这些法规的适用范围、定义和禁止的人工智能行为。 适用范围主要是在欧盟境内将人工智能系统推向市场或提供服务的提供商,以及在欧盟境内将人工智能系统用于商业目的的部署者。这些企业将被施加一定的义务,特别是那些引入和使用高风险人工智能系统的企业,这将在第二份报告中讨论。 定义中重要的是AI系统本身。这些规则有详细定义。概括来说,它是一个根据输
The Human Costs of the Research-Assessment Culture
Rachel Brazil,《自然》 “REF-able” 一词现在在英国大学中很常见。 “每个人都在不断地从‘REF-able’输出的角度来思考研究,从‘REF-able’的角度来思考研究......
What is Thermostatic Expansion Valve on a Refrigeration System
1:什么是恒温膨胀阀 热或恒温膨胀阀用于制冷和空调系统。它起节流机构的作用,根据蒸发器输出的温度和压力条件控制制冷剂流入系统蒸发器的流量。恒温膨胀阀是 […]The post What is the Thermostatic Expansion Valve on a Refrigeration System appeared first on Merchant Navy Decoded.
These Mesmerizing Anemones Have a Glowing Layer of Protection
海洋生物学家发现,一种能增强荧光输出的蛋白质也具有抗氧化特性
David Harvey 报道称,人工智能抓取最终可能会成为修订后的新西兰公平数字新闻谈判法案的一部分。该法案定义了什么是人工智能系统和人工智能服务,并继续将人工智能系统与新闻内容联系起来,以训练人工智能系统。重点在于新闻内容如何用于训练数字平台或人工智能系统。第一个要素是必须使用新闻内容训练人工智能系统。这与法案中新闻内容的定义有关。训练必须产生输出,如果人工智能系统能够或促进输出的生成,就会发生这种情况。他继续讨论技术要素,比如这些定义是否有效等等。更好的潜在问题似乎是为什么有人认为这里有一个需要解决的问题。网站限制抓取很简单。如果有人愿意支付足够的费用来允许,新闻网站授权其内容用于人工智
摘要:本《沿海和水力学工程技术说明》(CHETN)介绍了对位于北卡罗来纳州达克的美国陆军工程研究与发展中心 (ERDC)、沿海和水力学实验室 (CHL)、野外研究设施 (FRF) 的快速部署雷达和相关软件的评估,该雷达和相关软件用于表征浪区波浪、洋流和水深。该项目是应美国海军陆战队 (USMC) 作战实验室的要求进行的。2023 年 7 月至 8 月期间,第 1 版高级战术意识套件-雷达远征 (ATAK-ER V1) 系统部署了 15 次,以观察可能影响雷达处理的一系列波浪、水位和风况。然后将系统的产品与 FRF 的持续运行现场仪器和每月的水深测量进行比较,以量化输出的准确性和可靠性。已确定该
机器学习,特别是深度神经网络,专注于开发能够准确预测结果并量化与这些预测相关的不确定性的模型。这种双重关注在医疗保健、医学成像和自动驾驶等高风险应用中尤其重要,在这些应用中,基于模型输出的决策可能会产生深远的影响。准确的不确定性估计有助于评估 MIT 研究人员提出 IF-COMP:一种可扩展的不确定性估计解决方案,并在分布偏移下改进深度学习中的校准 首先出现在 AI Quantum Intelligence 上。
Applying RLAIF for Code Generation with API-usage in Lightweight LLMs
这篇论文被 ACL 2024 的自然语言推理和结构化解释研讨会接受。人工智能反馈强化学习 (RLAIF) 已在各个领域展现出巨大潜力,包括减轻 LLM 输出的危害、增强文本摘要和数学推理。本文介绍了一个 RLAIF 框架,用于提高轻量级(<1B 个参数)LLM 的代码生成能力。我们特别关注需要编写适当 API 调用的代码生成任务,这很有挑战性,因为众所周知的问题......
Unpacking China’s industrial policy and its implications for Europe
解析中国的产业政策及其对欧洲的影响HectorMon, 05/13/2024 - 10:48中国通常被认为是产业政策的成功应用。中国产业政策的一个重要特点是,它的目标是在战略目标框架内,为国有经济和私营经济提供融资方面的公平竞争环境。这一目标与欧盟等市场经济体无关,只适用于国有企业明显享有特权的市场经济体。尽管进行有效比较存在困难,但我们对中国如何在各个部门实施产业政策的分析表明,在某些领域取得成功,但并非全部。更重要的是,中国的生产率增长已经持续下降了二十年。鉴于中国在产业政策上投入了大量资源,而补贴只是其中的一部分,令人惊讶的是,成功并没有变得更加明显。这与任人唯亲、地方保护主义等因素有关
Teaching with AI with Author Eddie Watson
在这场热烈的对话中,主持人 Mike Palmer 与美国大学协会数字创新副总裁 C. Edward Watson 博士进行了交流。Eddie 分享了他的新书《用人工智能教学:人类学习新时代的实用指南》中的见解,探讨了 ChatGPT 等生成式人工智能工具对高等教育的实际影响。我们深入探讨了人工智能带来的紧迫挑战,从学术诚信问题到培养学生人工智能素养的必要性。Eddie 为教育工作者提供了务实的策略,例如允许延长作业时间以减少作弊诱惑,以及设计强调人类评估和辨别能力而非死记硬背输出的评估。在整个过程中,我们深入探讨了人工智能作为合作伙伴的创造潜力,产生想法和隐喻以增强学习体验。 Eddie 描
How Much Horsepower Does a TPE331 Have?
由霍尼韦尔航空航天公司开发的 TPE331 涡轮螺旋桨发动机因其在各种飞机应用中的强劲性能和多功能性而闻名。用于衡量飞机发动机功率输出的关键指标之一是马力 (HP)。那么,TPE331 有多少马力?TPE331 的马力输出 […]The post TPE331 有多少马力?首先出现在 CD 航空服务上。