于 2022 年 8 月。作为 OpenAI 的竞争对手,谷歌提出了两种可以生成逼真图像的文本转图像模型:基于扩散的模型 Imagen [Saharia et al。,2022a] 和 Pathways 自回归文本转图像模型 (Parti) [Yu et al。,2022]。除了文本转图像任务外,扩散模型还广泛用于图像转图像 [Saharia et al。,2022b;Whang et al。,2022] 和文本转视频模型,例如 Runway [Runway,2022]、Make-A-Video [Singer et al。,2022]、Imagen Video [Ho et al。,2022] 和 Phenaki [Villegas et al。,2022]。稳定扩散已适用于各种应用,从医学成像 [Chambon 等人,2022] 到音乐生成 [Agostinelli 等人,2023]。除了图像和视频生成之外,文本生成还极大地影响了人类的生活,从创作一篇文章或整篇文章到协助工程师编写代码。
在演讲中,我将介绍我的实验室在人工智能、应用机器学习和数据挖掘方面的最新进展,以打击网络和社交媒体平台上的恶意行为者(傀儡、逃避禁令者等)和危险内容(错误信息、仇恨等)。我的愿景是为每个人创建一个值得信赖的在线生态系统,并创建下一代促进健康、公平和安全的社会意识方法。总的来说,在我的研究中,我创建了新颖的图形、内容(NLP、多模态)和对抗性机器学习方法,利用 TB 级数据来检测、预测和缓解在线威胁。我的跨学科研究创新了社会技术解决方案,这些解决方案是我通过将计算机科学与社会科学理论相结合而实现的。我也热衷于将我的研究付诸实践——我实验室的模型已经部署在 Flipkart 上,影响了 Twitter 的 Birdwatch,现在正在部署在维基百科上。我的研究开启了范式转变,从当前缓慢而被动的应对网络危害的方法转向敏捷、主动和全社会的解决方案。我的演讲将概述我研究的四个重点:(1)跨平台、语言和模式检测有害内容和恶意行为者:我的研究超越了研究“推特上的英文文本”的标准实践,旨在解决解决跨平台(Micallef 等人,2022 年)、语言(Verma 等人,2022b 年)和模式(Verma 等人,2022b、c)(图像、视频、文本)根深蒂固的基本问题的巨大挑战。 (2) 通过预测未来的恶意活动,增强检测模型对敌对行为者的鲁棒性:我的工作是通过开发第一种对抗性学习技术来突破界限,以主动预测对手行为来欺骗检测模型。接下来,我们提高模型对操纵的鲁棒性。我的实验室调查了部署在一些最大平台上的模型的漏洞:Facebook 的 TIES 坏人检测器(He、Ahamad 和 Kumar 2021)、Twitter 的 Birdwatch 错误信息检测器(Mujumdar 和 Kumar 2021)和维基百科的禁令逃避(Niverthi、Verma 和 Kumar 2022)。(3) 归因于有害内容的影响和推荐系统的作用:我的实验室创建了数据驱动的技术来确定网络危害对
扩散模型从噪声中创建数据(Song等,2020)。他们经过训练,可以将数据的向前路径逆转到随机噪声,因此,可以使用神经网络的近似和泛化特性,可用于生成训练数据中不存在的新数据点,但遵循训练数据的分布(Sohl-Dickstein等人。,2015年; Song&Eron,2020)。这种生成建模技术已被证明非常有效地对高维,感知数据(例如图像)进行建模(Ho等人,2020)。近年来,扩散模型已成为产生具有令人印象深刻概括能力的自然语言输入的高分辨率图像和视频的事实方法(Saharia等人,2022b; Ramesh等。,2022; Rombach等。,2022; Podell等。,2023; Dai等。,2023; Esser等。,2023; Blattmann等。,2023b; Betker等。,2023; Blattmann等。,2023a; Singer等。,2022)。由于其迭代性质和相关的计算成本以及推理期间的较长采样时间,对这些模型进行更多有效训练的制剂的研究和/或更快的采样速度有所增加(Karras等人,2023;刘等。,2022)。
物种。随着DNA测序信息的可用性来指导系统发育分析,从2000年代中期开始重新检查主要定义在形态特征的属中的物种,从而进行了修订,包括将某些物种分配到两个新属中(Hoffmann 2010; Hoffmann 2010; Hoffmann 2010; Hoffmann等; Hoffmann等;2007)。 虽然目前DNA测序是推断该属中新物种的主要方法,而粘膜属中的许多物种对于支持物种划界仍然有用,例如在吸毒物种中,菌落色素化和无性孢子孢子学(Urquhart&Idnurm 20211)。 有50多种吸毒物,其中一半在过去五年中被发现,尤其是来自亚洲国家(HTET等人 2024; Hurdeal等。 2023; Lim等。 2024; Zhao等。 2022a; Zhao等。 2023; Zhao等。 2022b; Zong等。 2021)和巴西(Cordeiro等人 2020; De Freitas等。 2022; Leitão等。 2021)。 这还包括来自澳大利亚的调查,探索了从维多利亚州分离出的吸收菌株的多样性,从而发现了新物种sprapidia healeyae(urquhart&idnurm 2021)。 在这里,作为2023年新型粘膜瘤物种的筛查的一部分,发现了新的抽吸。2007)。虽然目前DNA测序是推断该属中新物种的主要方法,而粘膜属中的许多物种对于支持物种划界仍然有用,例如在吸毒物种中,菌落色素化和无性孢子孢子学(Urquhart&Idnurm 20211)。有50多种吸毒物,其中一半在过去五年中被发现,尤其是来自亚洲国家(HTET等人2024; Hurdeal等。2023; Lim等。2024; Zhao等。2022a; Zhao等。2023; Zhao等。2022b; Zong等。2021)和巴西(Cordeiro等人2020; De Freitas等。2022; Leitão等。2021)。这还包括来自澳大利亚的调查,探索了从维多利亚州分离出的吸收菌株的多样性,从而发现了新物种sprapidia healeyae(urquhart&idnurm 2021)。在这里,作为2023年新型粘膜瘤物种的筛查的一部分,发现了新的抽吸。最近发现更多的吸毒物种表明,在意识到该属内的全部多样性之前,还有一定的距离,更不用说开始了解他们的生态偏好和分布了。奇怪的是,该物种的另外三种菌株(或近亲)先前在2018年被隔离,但当时分配给了不同的吸气物种,因此新物种被隐藏在明显的视线中。
由于个人电脑、智能手机和网络服务器等多种技术平台的出现,以及通过互联网或云轻松访问和分发,软件在医疗保健领域变得越来越重要和普及。许多类型的临床软件,包括决策支持干预 (DSI) 软件、临床风险建模和计算机辅助检测 (CAD),已越来越多地为医疗服务提供者所用。这些技术通常对诊断图像(尤其是 MRI 和计算机断层扫描 (CT) 扫描)进行数据分析。此外,一些软件产品还结合了人工智能 (AI),它使用算法或模型来执行任务并表现出学习、决策和预测等行为。人工智能的一个子集称为机器学习 (ML),它使用计算机算法通过数据学习来执行任务,而无需明确编程;这种类型的人工智能已成为越来越多医疗设备的重要组成部分(食品和药物管理局 2022a)。虽然其中许多技术都是新技术,但某些类型的临床软件,尤其是 CAD,几十年来一直被用来辅助或增强临床决策(医疗保险和医疗补助服务中心 2022b)。
命名实体识别是自然语言处理中的一项基本任务,旨在对文本中的命名实体进行定位和分类。由于大规模且经过良好注释的数据集,基于深度学习的方法(Li et al.,2022b;Devlin et al.,2019)取得了巨大成功。然而,在具有 112 个细粒度命名实体标签的真实数据集(如 Ling 和 Weld(2012))中,大量的实体类别可能会导致不可避免的注释缺失。此外,在实际场景中,为了获得大型 NER 数据集,远程监督方法(Ren et al.,2015;Fries et al.,2017)可能会使这个问题更加严重,因为实体词典无法覆盖所有实体。前人的研究(Li et al.,2021;Shang et al.,2018)发现这个问题严重阻碍了NER模型的性能,并将这个问题命名为无标记实体问题。如图1所示,未标记的第二个“NBA”可能会混淆模型并引入不必要的噪音。为了解决这个问题,人们从不同的角度提出了几种尝试。受到启发
水库区域通常容易出现地质灾难,因为水文地质环境发生了重大变化(Zhou等,2022a)。例如,中国的三个峡谷水库地区已经报道了5,000多个地质灾难。极端气候和人类工程活动加剧了该水库地区地质灾难的发生,对当地居民和船只构成威胁。地质灾难的定量风险分析可以有效地支持管理人员制定预防灾难和缓解策略。由于变形和故障机制的复杂性,在各种时空量表上,定量分析和储层地质灾害的定量分析和预测中仍然存在许多未解决的问题。最近,随着新技术的开发和应用,例如岩土测试,遥感,机器学习和数值模拟,储层地质灾难的定量风险分析方法取得了巨大进步(Tang等,2019; Zhou等,2022b; Wang等,2022)。关于“水库地区地质灾难的定量风险分析的进步”的研究主题在滑坡风险分析领域已有七项贡献,包括使用高级技术,风险预测工具和实验室测试在滑坡易于区域的地形测试。
1 联合国 2021 年,《我们的共同议程——秘书长报告》。2 Brandt 等人,2022 年。3 其中包括由诺贝尔奖获得者 Joseph Stiglitz 和 Amartya Sen 以及 Jean-Paul Fitoussi 领导的“萨科齐”经济绩效和社会进步衡量委员会的工作(参见 Stiglitz, Sen & Fitoussi, 2009 年)。它还包括 OECD 为衡量多维福祉和生活质量所做的相关努力(Stiglitz, Fitoussi & Durand 2018a,b),包括 OECD 福祉和进步衡量框架和 OECD 美好生活指数。国际社会进步小组(例如 Fleurbaey 等人,2018 年)的工作以及参与多维贫困同行网络(MPPN,2022 年)的国家所做的努力为 G7 提供了更多宝贵资源。后者与联合国发展计划署 (UNDP) 等联合国机构制定的人类发展指标(人类发展指数,HDI)和多维贫困指标(全球多维贫困指数,MPI)密切相关(见下图)。同样,欧盟国家官方的多维贫困或社会排斥风险(AROPE)指标(也针对可持续发展目标进行了报告)也可以作为借鉴(EUROSTAT,2021 年)。4 例如,到目前为止,超过一半的 OECD 国家已经制定了福祉框架(Brandt 等人,2022 年)。加拿大提出了一个以广泛措施为重点的生活质量框架(加拿大财政部,2021 年),德国正计划向“社会生态”经济转型(Bundesministerium für Wirtschaft und Klimaschutz,2022 年)。这些都是朝着正确方向迈出的步伐。然而,福祉框架的建立和存在并不能保证其将得到永久采用,更重要的是,它不能对政策制定并最终对人们的生活质量产生切实影响。此外,这些努力尚未在各国协调一致,在国际层面上很难进行比较。5 Lima de Miranda 和 Snower,2020 年和 2021 年 6 世卫组织,2021 年;Dirksen,2022 年;MPPN,2022b。7 Ura 等人,2012 年;MPPN,2022b;联合国经济和社会事务部,2022 年;联合国开发计划署和 OPHI,2021 年。另见下图。8 Dirksen,2021 年。9 有关更多详细信息,请参阅本 T7 公民主导繁荣指数工作组中的相关政策摘要。10 联合国,2021 年。11 联邦政府,2021 年。
随着世界人口不断增长的含量,包含转基因(GM)特征的农产品为农民提供了一种可持续且安全的方式,以满足不断增长的全球粮食和饲料需求。在过去的二十年中,转基因特征一直是农民改善可持续性,实施最佳管理实践以及做出直接提高产出(食品/饲料)和运营效率的选择的关键工具(Brookes 2022a,Brookes,Brookes 2022b)。种子包含通过常规育种(进一步称为堆叠性状产品)结合的多种GM特征的种子是使农民能够应对整个生长季节遇到的几个挑战的重要手段。随着转基因特征可用性的进步,农民的偏好是在单一种子产品中使用多个性状类别,包括那些可以通过不同的作用方式来保护不同虫害的损害的种子。此外,单一种子产品中的一堆GM特征使农民能够更有效地管理杂草。II。 科学理由II。科学理由
近年来,由于新兴配送系统的发展,作为供应和分销链中最后一个阶段的最后一英里配送带来了重大挑战(Aghakhani 等人,2022 年)。公司在运输货物的方式上越来越创新,并且由于即时管理,配送服务正在增加(Beigi,Haque 等人,2022 年;Beigi,Khoueiry 等人,2022 年)。无人机 (UAV) 是一种飞行机器人,可以自主或遥测操作以执行特殊任务。由于微处理器和人工智能 (AI) 的不断进步,无人机的成本和其扩大的机动性现在可以显着改善,从而引起了用户和研究人员对其在一系列应用中的潜力的兴趣(Adnan 等人,2019 年;Moeinifard 等人,2022 年)。值得注意的是,这些设备有许多军事和民用用途,包括送货服务、扫雷、农业相关应用(例如,喷洒农药或进行田间土壤分析)、无线覆盖和监测(Famili 等人,2022a、2022b、2022c;Razzaghi 和 Assadian,2015 年)。为了最大限度地利用无人机,一些跨国公司正在大力投资提高无人机性能,以增强其效用。
