由于现实世界中的噪音和人为增强的扰动,达到深度神经网络(DNNS)的信任度是一项艰巨的任务。因此,为这些非线性和复杂的参数化模型做出的决策提供解释至关重要。归因方法对于这个目标有希望,但其性能可以进一步提高。在本文中,我们首次提出了归因的决策边界探索方法与可转移的对抗攻击的过程一致。具体而言,可转移的对抗性攻击来自源模型的一般对抗性,这与可以跨越属性中多个决策边界的副本样本的生成一致。UTI-liz liz of the Enstancions,我们通过模型Pa-Rameter探索引入了一种新颖的归因方法。此外,灵感来自研究模型参数的频率能力,我们通过基于频率信息来探索不同模型的决策范围的输入功能来为DNN提供增强的解释。大规模实验表明,使用模型参数e x ploration(attexplore)进行电子i xplanation的方法优于其他最先进的可解释性方法。此外,通过采用其他可转移攻击技术,Attexplore可以探索归因结果的潜在变化。我们的代码可在以下网址提供:https://github.com/lmbtough/attexplore。
在演讲中,我将介绍我的实验室在人工智能、应用机器学习和数据挖掘方面的最新进展,以打击网络和社交媒体平台上的恶意行为者(傀儡、逃避禁令者等)和危险内容(错误信息、仇恨等)。我的愿景是为每个人创建一个值得信赖的在线生态系统,并创建下一代促进健康、公平和安全的社会意识方法。总的来说,在我的研究中,我创建了新颖的图形、内容(NLP、多模态)和对抗性机器学习方法,利用 TB 级数据来检测、预测和缓解在线威胁。我的跨学科研究创新了社会技术解决方案,这些解决方案是我通过将计算机科学与社会科学理论相结合而实现的。我也热衷于将我的研究付诸实践——我实验室的模型已经部署在 Flipkart 上,影响了 Twitter 的 Birdwatch,现在正在部署在维基百科上。我的研究开启了范式转变,从当前缓慢而被动的应对网络危害的方法转向敏捷、主动和全社会的解决方案。我的演讲将概述我研究的四个重点:(1)跨平台、语言和模式检测有害内容和恶意行为者:我的研究超越了研究“推特上的英文文本”的标准实践,旨在解决解决跨平台(Micallef 等人,2022 年)、语言(Verma 等人,2022b 年)和模式(Verma 等人,2022b、c)(图像、视频、文本)根深蒂固的基本问题的巨大挑战。 (2) 通过预测未来的恶意活动,增强检测模型对敌对行为者的鲁棒性:我的工作是通过开发第一种对抗性学习技术来突破界限,以主动预测对手行为来欺骗检测模型。接下来,我们提高模型对操纵的鲁棒性。我的实验室调查了部署在一些最大平台上的模型的漏洞:Facebook 的 TIES 坏人检测器(He、Ahamad 和 Kumar 2021)、Twitter 的 Birdwatch 错误信息检测器(Mujumdar 和 Kumar 2021)和维基百科的禁令逃避(Niverthi、Verma 和 Kumar 2022)。(3) 归因于有害内容的影响和推荐系统的作用:我的实验室创建了数据驱动的技术来确定网络危害对
CSIS 报告:战略失败?毫无希望的空谈?战术成功?花钱不建设(然后停止花钱)?,A. Cordesman 著,2011 年(https://csis-website-prod.s3.amazonaws.com/s3fs-public/legacy_files/files/publication/111115_Afghanistan_at_End_201 1.pdf)。
作者:Y Shany · 2020 · 被引用 11 次 — Hersch Lauterpacht 国际公法主席兼网络法主任。希伯来大学 Federmann 网络安全研究中心项目;...
ACM 门诊联合管理 ACO 责任医疗组织 ACO REACH 责任医疗组织实现公平、可及性和社区健康 ADI 区域贫困指数 AHEAD 推进全额付款人健康公平方法和发展 AHRQ 医疗保健研究与质量机构 BAL 受益人证明清单 CC 病情类别 CCA 协作护理安排 CCM 慢性病管理 CCN CMS 认证编号 CG-CAHPS 临床医生和团体消费者对医疗保健提供者和系统的评估® CI 持续改进 CMS 医疗保险和医疗补助服务中心 CPT 现行程序术语 CQM 临床质量测量 DXG 诊断组 E&M 评估和管理 eCQM 电子临床质量测量 ED 急诊科 EDU 急诊科利用率 ESP 增强服务付款 ESRD 终末期肾病 FFS 按服务收费 FQHC 联邦合格医疗中心 GAF 地理调整因素 HCC 分层病情类别 HCPCS 医疗保健通用程序编码系统 HEDIS 医疗保健有效性数据和信息集 HIPAA 健康保险流通与责任法案 HPSA 卫生专业人员短缺领域 IPC 跨专业咨询 IT 信息技术 ITU 印第安人健康服务、部落和城市印第安人提供者 LIS 低收入补贴 MCP 使护理成为初级 MEC MCP 电子咨询 MIPS 择优激励支付系统 NCQA 国家质量保证委员会 NPI 国家提供者标识符 PA 参与协议 PBPM 每位受益人每月 PCF 初级保健优先 PCPCM 以人为本的初级保健措施
1。它可以为多阶段培训管道(例如,基础模型和持续学习)提供TDA分析。2。它可以将算法选择纳入分析中(例如SGD与Adam)。3。即使隐式分化假设失败(例如,非构成参数),它也保持与反事实预测的密切联系。•与以前的展开方法不同,来源可以实现这些好处,同时仅需要少量的模型检查点C(例如,C = 5),而不是存储整个训练轨迹。
近年来,随着各种局部特征归因方法的提出,后续工作提出了几种评估策略。为了评估不同归因技术的归因质量,图像域中最受欢迎的评估策略是使用像素扰动。然而,最近的进展发现,不同的评估策略会产生相互冲突的归因方法排名,并且计算成本可能过高。在这项工作中,我们对基于像素扰动的评估策略进行了信息论分析。我们的研究结果表明,结果受到通过移除像素的形状而不是实际值泄露的信息的强烈影响。利用我们的理论见解,我们提出了一种称为 Remove and Debias (ROAD) 的新型评估框架,它提供了两个贡献:首先,它减轻了混杂因素的影响,这需要评估策略之间的更高一致性。其次,ROAD 不需要计算成本高昂的再训练步骤,与最先进的技术相比,可节省高达 99% 的计算成本。我们在 https://github.com/tleemann/road_evaluation 发布了我们的源代码。