从业者判断大型语言模型输出的指南评估人工智能生成的输出对于构建大型语言模型的稳健应用程序至关重要,因为它允许将复杂的人工智能应用程序拆分为具有内置错误控制的简单阶段。在监督模式下评估生成输出相对简单,其中“正确答案”可以由人类评估者计算或提示。同时,在许多实际的 LLM 应用中,监督方法过于严格,需要能够解决开放式问题的评估。构建无监督评估器的最简单方法是要求 LLM 自我评估。然而,生成模型检测自身输出错误的能力尚不清楚。我们证明,通过迭代自我反思可以提高自我评估的质量。与“思想链”技术类似,该方法以推理时的计算量换取最终结果的稳健性。带有示例的 Google Colab 笔记本链接:h
Resources for AFLCMC Families: An Overview of the Exceptional Family Member Program (EFMP) (PODCAST)
特殊家庭成员计划从业者讨论家庭援助计划的运作方式以及服务成员如何在 AFLCMC 设施中访问其资源。
Top 10 Human Psychology Books: Key Insights and Revelations
十大人类心理学书籍,加深您对思维和行为的理解了解人类心理学对于自我意识、改善人际关系和在日益复杂的世界中建立适应力至关重要。以下是十大人类心理学书籍的列表,这些书籍探讨了人类思维、行为、情感和社会动态的各个方面。这些书籍从基础经典到当代见解,全面深入地展现了心理学的深度。人类心理学为什么理解人类行为如此重要?了解人类行为对于处理人际关系、做出更好的决策和培养同理心至关重要。它帮助我们理解人们行为的原因,无论是受个人信仰、情感还是环境影响。通过认识这些潜在因素,我们会更加了解自己的行为、偏见和动机,这对个人成长和自我反省至关重要。这种洞察力还使我们能够预测和解释他人的行为,从而改善我们在个人、专
Understanding K-Fold Target Encoding to Handle High Cardinality
平衡复杂性和性能:深入了解 K 折目标编码照片由 Mika Baumeister 在 Unsplash 上拍摄简介数据科学从业者在处理不同项目中的不同数据类型时会遇到许多挑战,每个项目都需要独特的处理方法。一个常见的障碍是使用传统机器学习模型难以有效处理的数据格式,导致模型性能不佳。由于大多数机器学习算法都针对数值数据进行了优化,因此将分类数据转换为数值形式至关重要。然而,这通常会过度简化复杂的分类关系,尤其是当特征具有高基数(即大量唯一值)时,这会使处理复杂化并妨碍模型准确性。高基数是指特征中唯一元素的数量,具体解决机器学习环境中分类标签的不同计数。当一个特征有许多唯一的分类标签时,它具有高
Community Benefits Agreements: A Tool for Creating Good Jobs (Event Recording)
此次活动由 JMA 和阿斯彭研究所经济机会计划 (EOP) 联合主办。它是 EOP 工作质量实践网络研讨会系列的一部分,该系列探讨了从业者用来提高工作质量和扩大经济机会的策略和方法。社区福利协议:创造良好工作的工具(活动记录)一文首次出现在阿斯彭研究所。
Beyond Vulnerability: A Guidance Note on Youth, Climate, Peace and Security
本指导说明连接了气候、和平与安全 (CPS) 和青年、和平与安全 (YPS) 议程。它基于来自不同背景的现实世界案例,强调了年轻人如何站在解决气候相关安全风险的最前沿。它还为制定青年、气候、和平与安全综合议程提供了指导,旨在为建设和平和发展从业者、政策制定者和研究人员提供帮助。
Megastudy testing 25 treatments to reduce antidemocratic attitudes and partisan animosity | Science
学者警告说,大众的党派分歧威胁着美国民主的健康。我们进行了一项大型研究(n = 32,059 名参与者),测试了由学者和从业者设计的 25 种治疗方法,以减少美国人的党派仇恨……
3 Reasons Conceptual Understanding is Critical to Learning
教育专家、研究人员和从业者设计了 DreamBox Math,以评估掌握程度并根据对概念的了解衡量学生的进步。以下是概念理解对学生的学习之旅至关重要的 3 个主要原因,以及 DreamBox Math 如何支持这些原因。 1. 数学学习是情境化的 学生必须知道的不仅仅是孤立的 […] 文章概念理解对学习至关重要的 3 个原因首先出现在 Discovery Education 博客上。
Exercise empowers lung cancer patients to take active role in treatment
咳嗽、胸痛和呼吸急促——这些都是令人痛苦的肺癌症状。因此,虽然运动对肺癌患者来说似乎是一种违反直觉的活动,但新的研究表明并非如此。通过研究运动对各种肺癌相关健康结果的影响,研究人员现在已经为患者和健康从业者制定了建议,以支持在肺癌治疗前、治疗期间和治疗后进行运动。
What's up with all the ads for law firms?
律师广告几乎是一种艺术形式。法律界的从业者会想尽一切办法吸引你的注意,从令人印象深刻的越野摩托车特技表演到半裸奔跑。当你遇到麻烦时,你不用费力就能记住他们的名字。你现在很可能就能说出一两个。五十年前,法律广告的世界并不存在。当时,律师不允许做广告。法律不允许,而是由决定谁能成为律师的专属组织:州律师协会。在今天的节目中,我们来看看这种情况是如何改变的。一对律师在当地报纸上刊登广告,导致了我们今天所知道的不可避免的律师事务所广告世界。以及,广告权是如何与我们拥有的一些最重要的基本权利相提并论的。本期节目由 Nick Fountain 和 Jeff Guo 主持。由 Sam Yellowhorse
*平等贡献者为了在设备上部署机器学习模型,从业者使用压缩算法来缩小和加速模型,同时保持其高质量的输出。实践中压缩的一个关键方面是模型比较,包括跟踪许多压缩实验、识别模型行为的细微变化以及协商复杂的准确性-效率权衡。然而,现有的压缩工具对比较的支持很差,导致在不相交的工具中进行繁琐且有时不完整的分析。为了支持现实世界的比较工作流程,我们...
9 月 26 日星期四,北约秘书长延斯·斯托尔滕贝格参加了在纽约外交关系委员会 (CFR) 举行的对话和问答会议。此次活动由 CFR 董事会成员兼 MSNBC 主持人 Ayman Mohyeldin 主持,聚集了政策专家、政府官员、学者、商界领袖、媒体从业者和非政府组织。
简介 在讨论大型语言模型 (LLM) 时,一个核心问题是它们记忆训练数据的程度与它们如何推广到新任务和设置。大多数从业者似乎(至少非正式地)认为 LLM 在某种程度上两者都做到了:它们清楚地记住了部分训练数据——例如,它们通常能够逐字重现大量训练数据 [Carlini 等人,2023]——但它们似乎也从这些数据中学习,从而使它们能够推广到新设置。它们做这一件事或另一件事的确切程度对此类模型的实践和法律方面具有重大影响 [Cooper 等人,2023]。LLM 真的会产生新内容吗,还是只是重新混合了训练数据?对受版权保护的数据进行训练的行为应该被视为对数据的不公平使用,还是应该根据模型记忆的某种
Strengthening minds: U.S. Navy, Royal Australian Navy collaborates for mental health initiatives
美国海军心理学家与海军陆战队轮换部队 - 达尔文 24.3 与澳大利亚皇家海军心理健康从业者合作,于 9 月 2 日在澳大利亚北领地 Larrakeyah 国防区提供作战压力反应和干预培训。
Strengthening minds: U.S. Navy, Royal Australian Navy collaborates for mental health initiatives
9 月 2 日,美国海军陆战队轮换部队 - 达尔文 24.3 的心理学家与澳大利亚皇家海军心理健康从业者合作,在澳大利亚北领地 Larrakeyah 国防区提供作战压力反应和干预方面的培训。
摘要:心理学、生理学、医学和社会科学学科一致认为,主动和被动接触大自然可以增进人类福祉。自然基础设施 (NI) 包括自然元素,它们可以在服务于基础设施相关目的的同时提供这些辅助福祉益处,因此,为包括美国陆军工程兵团在内的机构提供了巨大的希望,可以作为增强土木工程项目经济、环境和社会效益的一种手段。然而,到目前为止,NI 通常被视为传统基础设施的替代品,但在项目选择方面很少具有竞争力,因为没有标准化的方法来证明其价值或证明其成本合理。随后选定的基础设施项目可能无法最大限度地提高社会福祉或公平分配利益。需要一个框架来捕捉 NI 的多样化和整体利益。作为正在进行的研究的一部分,本文描述了构建福祉利益
Market Basket Analysis Using High Utility Itemset Mining
在交易中寻找高价值模式在这篇文章中,我将提供一种替代流行的市场篮子分析技术的方法,它可以帮助从业者找到高价值模式,而不仅仅是最常见的模式。我们将对不同的模式挖掘问题有一些直观的了解,并看一个真实的例子。完整的代码可以在这里找到。所有图像均由作者创建。简介我已经写了一篇关于模式挖掘的更入门的文章;如果你不熟悉这里提到的一些概念,请先阅读那篇文章。简而言之,模式挖掘试图在数据中寻找模式(呃)。大多数时候,这些数据以(多)集或序列的形式出现。例如,在我的上一篇文章中,我研究了用户在网站上执行的操作序列。在这种情况下,我们会关心项目的顺序。在其他情况下,比如我们将在下面讨论的情况,我们不关心项目的顺序
Market Basket Analysis Using High Utility Itemset Mining | by Laurin Brechter | Sep, 2024
在交易中寻找高价值模式 在这篇文章中,我将提供一种替代市场篮子分析中流行技术的替代方案,该技术可以帮助从业者找到高价值模式,而不仅仅是最常见的模式。我们将对不同的模式挖掘问题有一些直观的了解,并看一个真实的例子。完整的代码可以是使用高效用项集挖掘进行市场篮子分析的帖子 | 作者 Laurin Brechter | 2024 年 9 月首次出现在 AI Quantum Intelligence 上。