1引言作为可解释的AI(XAI)的领域已经成熟,反对解释(CES)已成为解释AI模型的主要事后方法之一(例如,请参见,例如,参见,例如[Karimi等。,2022]用于概述)。ces通常被提倡作为为受到机器学习模型决定影响的个人提供追索权的一种手段。特别是,给定对M模型M的输入X,CE基本上向用户展示了一个新的,稍微修改的输入X',这表明如果将所做的更改应用于X,则如何实现不同的结果。为了插图,将虚构的贷款申请与功能收入£50 K,贷款期限为35个月,贷款金额£10 K被模型拒绝。在此示例中,CE可以证明将收入提高到55英镑将导致申请被接受。鉴于部署了CE的许多情况的批判性质,例如在财务或医疗环境中,他们提供的追索权是最重要的,即它给出了预期的结果变化,从而给予了信任。然而,最近的工作表明,在鲁棒性方面,获得CES的最新方法是获得主要缺点,即在不断变化的条件下,它们产生的CE的有效性。,特别是[Pawelczyk等。,2022年]表明,生成CE的流行方法可能会返回与对抗性例子没有区别的解释。广泛地说,这意味着CES
最近,出现了神经网络(NN)在不确定性量化领域中的使用,因为人们经常对解决方案的统计数据感兴趣,而不仅仅是对点估计值。尤其是,贝叶斯在反问题中的方法引起了极大的兴趣。在本文中,我们有兴趣通过提出的有条件生成NNS在贝叶斯反问题中学习整个后验分布,例如(Adler&Öktem,2018; Ardizzone et al。,2019; Batzolis et al。,2021; Hagemann等,Hagemann等,202222)解决后验度量而不是端到端重建具有多个优点,如图1.更准确地说,如果我们将高斯混合模型视为先验分布和具有加性高斯噪声的线性正向操作员,则可以明确计算后密度(红色)。显然,这些曲线相对于观察y,即我们观察到后验的连续行为也相对于零接近零的观测。特别是(样本)后验可用于提供
通讯作者:私下生物统计学系印第安纳大学医学院和理查德·M·费尔班克斯公共卫生学院410 W 10th St.,Suite 3000印第安纳波利斯,印第安纳州印第安纳州,46202电子邮件:xioochun@iu.edu.edu.edu.edu电话:317-274-2696
创建一条关于我即将在卡内基梅隆大学(CMU,匹兹堡)发表的演讲的热门推文,标题为“大型语言模型的水印”。主题包括水印、检测人工智能生成的文本、保护模型的版权。尽量让它风趣幽默。
摘要 — 深度学习的最新进展可以归因于硬件处理器和人工智能 (AI) 加速器性能的持续改进。除了基于冯诺依曼架构的传统 CMOS 加速器外,硅光子学、忆阻器和单片 3D (M3D) 集成等新兴技术也正在被探索作为后摩尔定律的替代方案。然而,由于制造工艺变化、热串扰和老化导致的故障可能会对新兴 AI 加速器的能源效率和性能造成灾难性影响。在本文中,我们分析了几种新兴 AI 加速器在不同不确定性下的性能,并提出了低成本的方法来评估故障的重要性并减轻其影响。我们表明,在所有技术中,不确定性对性能的影响可能会根据故障类型和受影响组件的参数而有很大差异。因此,本文提出的故障关键性评估技术对于提高产量是必要的。
随着人工智能生成的文本越来越像人类书写的内容,检测机器生成文本的能力变得至关重要。为了应对这一挑战,我们提出了 GPTWatermark,这是一种强大而高质量的解决方案,旨在确定一段文本是否源自特定模型。我们的方法扩展了现有的水印策略,并采用固定组设计来增强对编辑和释义攻击的鲁棒性。我们表明,我们的带水印的语言模型在生成质量、检测正确性和针对规避攻击的安全性方面享有强有力的可证明保证。在各种大型语言模型 (LLM) 和不同数据集上的实验结果表明,我们的方法实现了卓越的检测准确率和可比的复杂度生成质量,从而促进了 LLM 的负责任使用。代码可在 https://github. com/XuandongZhao/GPTWatermark 获得。
摘要:药物发现的一个核心问题是确定类药物化合物与蛋白质靶标之间的相互作用。在过去的几十年中,已经开发了各种定量结构-活性关系 (QSAR) 和蛋白质化学计量 (PCM) 方法来建模和预测这些相互作用。虽然 QSAR 方法仅利用药物化合物的表示,但 PCM 方法结合了蛋白质靶标和药物化合物的表示,使它们能够对以前未见过的蛋白质靶标实现高于偶然性的预测准确度。QSAR 和 PCM 方法最近都通过机器学习和深度神经网络得到了改进,从而允许从测量数据开发药物-靶标相互作用预测模型。然而,深度神经网络通常需要大量的训练数据,并且无法稳健地适应新任务,例如在推理时预测未见过的蛋白质靶标的相互作用。在这项工作中,我们建议使用超网络在推理过程中有效地在任务之间传输信息,从而准确预测药物-靶标对未见过的蛋白质靶标的相互作用。与之前的方法相比,我们的 HyperPCM 方法在多个知名基准(包括 Davis、DUD-E 和 ChEMBL 衍生的数据集)上达到了最先进的性能,并且在涉及看不见的蛋白质靶标的零样本推理方面尤其出色。 我们的方法以及可重复的数据准备可在 https://github.com/ml-jku/hyper-dti 上获得。■ 简介药物 - 靶标相互作用 1 的建模是药物发现的一个基本步骤,意味着学习小的类药物化合物(在此称为药物化合物(术语药物化合物在本文中表示配体,即分子化合物,被视为潜在药物但最终可能不适合作为最终候选药物))与已确定的疾病蛋白质靶标之间相互作用的结合特性。2 随着新疾病的出现,迫切需要快速准确地预测大量药物 - 靶标相互作用。 3 药物-靶标相互作用的计算机建模受益于更强大的计算能力 4 ,而使用其他领域的最先进深度学习方法则有助于进一步发展。 5、6 到目前为止,该领域的研究主要集中在药物化合物和蛋白质靶标的表示上。 传统的定量结构-活性关系 (QSAR) 模型 7 仅基于药物化合物结构的表示来学习药物-靶标相互作用的特性。 通常,首先将结构编码为数值向量,即嵌入。 手工嵌入可以从化学和生物数据 8-10 或通过位向量(例如摩根指纹)构建。 11
关键词:可编程光子集成电路、相位恢复、稳健表征 摘要:光子集成电路 (PIC) 提供超宽光学带宽,可为信号处理应用提供前所未有的数据吞吐量。动态可重构性可以补偿制造缺陷和波动的外部环境,调整自适应均衡和训练光学神经网络。PIC 重构的初始步骤需要测量其动态性能,通常由其频率响应描述。虽然测量幅度响应很简单,例如使用可调激光器和光功率计,但由于各种因素(包括测试连接中的相位变化和仪器限制),测量相位响应存在挑战。为了应对这些挑战,提出了一种通用且稳健的表征技术,该技术使用耦合到信号处理核心 (SPC) 的片上参考路径,其延迟大于或小于信号处理路径上的总延迟。芯片功率响应的傅里叶变换揭示了 SPC 的脉冲响应。该方法对低参考路径功率和不精确的延迟更具鲁棒性。使用有限脉冲响应 (FIR) 结构的实验证明了快速 SPC 训练,克服了热串扰和设备缺陷。这种方法为 PIC 特性提供了一种有前途的解决方案,有助于加快物理参数训练,以用于通信和光学神经网络中的高级应用。
Isight 于十多年前在劳斯莱斯推出,目前已在整个公司内使用。该软件的拖放功能可用于创建模拟流程(劳斯莱斯内部称为“工作流”),让工程师能够链接并自动化特定设计流程中的所有步骤,从而同时集成多学科模拟(如空气动力学、应力、重量和成本)。可以自动执行使用 DOE 或蒙特卡罗方法或各种强大的优化技术(如遗传、基于梯度或确定性算法)的设计探索,然后将其链接回正在进行的工作流中。工作流中可以包含任意数量的设计参数和分析类型,并且可以通过材料权衡研究、公差审查和可制造性评估进一步优化设计。