Linguistic bias in ChatGPT: Language models reinforce dialect discrimination
示例语言模型响应不同类型的英语和母语人士的反应。ChatGPT 在用英语与人交流方面表现出色。但谁的英语?只有 15% 的 ChatGPT 用户来自美国,而...
深度学习 Indaba 参与者,2024 年 9 月 1 日至 7 日在塞内加尔达喀尔。深度学习 Indaba 2024 对我们来说不仅仅是另一场活动——这是一次重聚。对于 AfriClimate AI 来说,Indaba 代表着我们的出生地。正是在加纳阿克拉举行的 2023 年 Indaba 会议上,一场关键对话引发了一场运动,并促成了 AfriClimate 的成立 […]
欢迎阅读我们的月度文摘,在这里您可以了解您可能错过的任何 AIhub 故事、阅读最新消息、回顾最近发生的事件等等。本月,我们将了解一个评估数据集多样性的框架,了解银行如何从战略上降低实时支付系统中的欺诈风险,以及 […]
US Global AI Research Agenda report released
图片由 Alan Warburton / © BBC / Better Images of AI / Nature / 获得 CC-BY 4.0 许可 本周,美国政府发布了两份免费报告:《全球人工智能研究议程》和《全球发展中的人工智能手册》。这些文件旨在指导未来对人工智能的研究 […]
Summary of the #IJCAI2024 doctoral consortium
职业小组会议。我们于 8 月 5 日成功举办了博士生联盟活动,随后于 8 月 6 日在韩国济州岛举行的国际人工智能联合会议 (IJCAI 2024) 上举办了海报会议。我们收到了来自六大洲参与者的一百多份提交。在符合条件的提交中,录取率 […]
简介 在讨论大型语言模型 (LLM) 时,一个核心问题是它们记忆训练数据的程度与它们如何推广到新任务和设置。大多数从业者似乎(至少非正式地)认为 LLM 在某种程度上两者都做到了:它们清楚地记住了部分训练数据——例如,它们通常能够逐字重现大量训练数据 [Carlini 等人,2023]——但它们似乎也从这些数据中学习,从而使它们能够推广到新设置。它们做这一件事或另一件事的确切程度对此类模型的实践和法律方面具有重大影响 [Cooper 等人,2023]。LLM 真的会产生新内容吗,还是只是重新混合了训练数据?对受版权保护的数据进行训练的行为应该被视为对数据的不公平使用,还是应该根据模型记忆的某种
Diffusion model approach tackles aspect ratio problem in generative AI images
左侧图片由标准方法生成,而右侧图片由 ElasticDiffusion 生成。两张图片的提示都是“一只运动猫在新闻发布会上向记者解释其最新丑闻的照片。”(图片由 Moayed Haji Ali/莱斯大学提供。)作者:John Bogna 生成式人工智能 […]
在他们的论文《实时支付中的欺诈风险缓解:基于代理的战略分析》中,Katherine Mayo、Nicholas Grabill 和 Michael Wellman 考虑了实时支付,并采用基于代理的模型来研究银行面对欺诈的潜在策略。我们向 Katherine 询问了这项工作,为什么它是一个重要的主题,以及团队如何 […]
Using deep learning to help distinguish dark matter from cosmic noise
模拟从早期宇宙到今天的暗物质结构形成的静态图像。引力使暗物质聚集成致密的光晕,以明亮的斑块表示,星系就是在这些光晕中形成的。在这个模拟中,形成了一个类似银河系的光晕和一个类似大麦哲伦星云的较小光晕 […]
Interview with Jerone Andrews: a framework towards evaluating diversity in datasets
Jerone Andrews、Dora Zhao、Orestis Papakyriakopoulos 和 Alice Xiang 凭借其立场论文《测量数据集多样性。不要只是宣称它》在国际机器学习会议 (ICML) 上获得了最佳论文奖。我们与 Jerone 讨论了该团队的方法论,以及他们如何开发一个框架来概念化、操作化和评估机器学习的多样性 […]
The Good Robot podcast: the EU AI Act part 1, with Caterina and Daniel from Access Now
由 Eleanor Drage 和 Kerry Mackereth 主持的《The Good Robot》是一个播客节目,探讨了性别、女权主义和技术之间的许多复杂交集。在这一集中,Daniel Leufer 和 Caterina Rodelli 谈论了欧盟人工智能法案。 《欧盟人工智能法案》第 1 部分,由 Access Now 的 Caterina Rodelli 和 Daniel Leufer 撰写 […]
Geometric deep learning for protein sequence design
使用 CARBonAra 进行序列预测的示意图。几何变换器对 β-内酰胺酶 TEM-1 酶(灰色)的序列空间进行采样,该酶与天然底物(青色)复合,以产生新的折叠良好且活性高的酶。图片来源:Alexandra Banbanaste (EPFL)。作者:Nik Papageorgiou 设计能够执行特定功能的蛋白质涉及理解和操纵其序列 […]
How to evaluate jailbreak methods: a case study with the StrongREJECT benchmark
当我们开始研究越狱评估时,我们发现了一篇有趣的论文,声称只需将禁止的提示翻译成晦涩难懂的语言,就可以越狱前沿 LLM。这一结果让我们兴奋不已,我们尝试重现……
8 月 28 日,CLAIRE(欧洲人工智能研究实验室联合会)所有问题解答 (AQuA) 系列继续举办,其中一小时的会议重点关注面向公民的人工智能。本次会议与欧洲卓越网络和 ICT-48 项目 VISION 联合举办。本次网络研讨会探讨了应用和行动的具体示例 […]
Developing a system for real-time sensing of flooded roads
作者:安德鲁·贝尔 道路相关事故是全国范围内洪水死亡的主要原因,但有限的洪水报告工具使得实时评估道路状况变得困难。现有工具——交通摄像头、水位传感器甚至社交媒体数据——可以提供洪水观测数据,但它们通常不是主要用于感知洪水的[…]
Forthcoming machine learning and AI seminars: September 2024 edition
这篇文章列出了计划于 2024 年 9 月 2 日至 10 月 31 日举行的人工智能相关研讨会。此处详述的所有活动均免费,任何人都可以虚拟参加。 2024 年 9 月 2 日维也纳数字人文主义宣言——最初五年小组成员:Veronica Kaup-Hasler、Jens Schneider、Noshir Contractor、[…]
Causal inference under incentives: an annotated reading list
因果推理是确定原因是否以及如何导致结果的过程,通常使用统计方法来区分相关性和因果关系。从数据中学习因果关系是一项重要任务,涉及从医疗保健和药物开发到在线广告和电子商务等各种领域。因此,经济学、统计学、计算机科学和公共政策方面的文献中有大量关于设计因果推理算法和方法的研究。虽然大部分重点都集中在统计性质的问题上,但在对有偏好的战略个人进行因果推理时,还必须考虑博弈论激励因素。例如,当研究中的参与者不遵守规定(即参与者不遵守分配给他们的治疗)时,可能很难在随机对照试验中推断因果关系。更一般地说,当个人可以自由选择自己的治疗方法并且具有不同偏好的个体之间存在足够的异质性时,因果学习可能会很困难。即使
AIhub monthly digest: August 2024 – IJCAI, neural operators, and sequential decision making
欢迎阅读我们的月度文摘,在这里您可以了解您可能错过的任何 AIhub 故事,浏览最新消息,回顾最近发生的事件等等。本月,我们将了解神经算子,虚拟参观 IJCAI,并尝试弥合用户期望与 AI 能力之间的差距。采访[…]