在演讲中,我将介绍我的实验室在人工智能、应用机器学习和数据挖掘方面的最新进展,以打击网络和社交媒体平台上的恶意行为者(傀儡、逃避禁令者等)和危险内容(错误信息、仇恨等)。我的愿景是为每个人创建一个值得信赖的在线生态系统,并创建下一代促进健康、公平和安全的社会意识方法。总的来说,在我的研究中,我创建了新颖的图形、内容(NLP、多模态)和对抗性机器学习方法,利用 TB 级数据来检测、预测和缓解在线威胁。我的跨学科研究创新了社会技术解决方案,这些解决方案是我通过将计算机科学与社会科学理论相结合而实现的。我也热衷于将我的研究付诸实践——我实验室的模型已经部署在 Flipkart 上,影响了 Twitter 的 Birdwatch,现在正在部署在维基百科上。我的研究开启了范式转变,从当前缓慢而被动的应对网络危害的方法转向敏捷、主动和全社会的解决方案。我的演讲将概述我研究的四个重点:(1)跨平台、语言和模式检测有害内容和恶意行为者:我的研究超越了研究“推特上的英文文本”的标准实践,旨在解决解决跨平台(Micallef 等人,2022 年)、语言(Verma 等人,2022b 年)和模式(Verma 等人,2022b、c)(图像、视频、文本)根深蒂固的基本问题的巨大挑战。 (2) 通过预测未来的恶意活动,增强检测模型对敌对行为者的鲁棒性:我的工作是通过开发第一种对抗性学习技术来突破界限,以主动预测对手行为来欺骗检测模型。接下来,我们提高模型对操纵的鲁棒性。我的实验室调查了部署在一些最大平台上的模型的漏洞:Facebook 的 TIES 坏人检测器(He、Ahamad 和 Kumar 2021)、Twitter 的 Birdwatch 错误信息检测器(Mujumdar 和 Kumar 2021)和维基百科的禁令逃避(Niverthi、Verma 和 Kumar 2022)。(3) 归因于有害内容的影响和推荐系统的作用:我的实验室创建了数据驱动的技术来确定网络危害对
根据 Google Trends 的数据,“ChatGPT”在过去 12 个月的“上升查询”指标中排名第二。这种关注度的飙升支持了这样一种观点,即 ChatGPT 和其他人工智能 (AI) 语言模型是革命性的技术,将颠覆我们日常生活的许多方面,包括学生的学习方式和教师的教学方式。根据你问的对象,这种颠覆可能被视为一种承诺、一种威胁或介于两者之间的某种东西。事实上,人们对人工智能的关注度不断提高,催生了大量关于教育系统应该(或不应该)如何适应它们的意见,以及来自 K12 学校部门和其他机构的明确政策声明。虽然人工智能确实可能彻底改变教育格局,但它也可以被视为一系列变革性技术进步中的最新成员。在整个 21 世纪,许多硬件设备(如手机、笔记本电脑和平板电脑)和软件应用程序(包括 Zoom、维基百科和谷歌)已经显著改变了教学、学习和学校运营。
摘要 — 人工智能物联网 (AIoT) 领域的大规模知识迫切需要有效的模型来理解人类语言并自动回答问题。预训练语言模型 (PLM) 在某些问答 (QA) 数据集上取得了最佳性能,但很少有模型能够回答有关 AIoT 领域知识的问题。目前,AIoT 领域缺乏足够的 QA 数据集和大规模预训练语料库。我们提出了 RoBERTa AIoT 来解决缺乏高质量大规模标记的 AIoT QA 数据集的问题。我们构建了一个 AIoT 语料库来进一步预训练 RoBERTa 和 BERT。RoBERTa AIoT 和 BERT AIoT 利用由面向 AIoT 的维基百科网页组成的大型语料库进行无监督预训练,以学习更多特定领域的上下文并提高 AIoT QA 任务的性能。为了微调和评估模型,我们基于社区问答网站构建了 3 个 AIoT 问答数据集。我们在这些数据集上评估了我们的方法,实验结果证明了我们的方法有显著的改进。
研究中采用了两种数据中毒方法:分视图数据中毒和前端数据中毒。分视图数据中毒基于这样的理解:虽然训练数据集的索引无法更改,但数据集中 URL 的内容可以更改,这使得“能够对数据集索引的 Web 资源施加持续控制的对手能够毒害最终用户收集的结果数据集”。38 当对手能够在很短的时间内更改 Web 内容且无法检测到修改时,就会发生前端数据中毒。如果恶意行为者能够准确预测何时访问此类 Web 内容以获取数据集快照,则有可能实现这一点。以广泛用于 AI 数据集的 Wikipedia 为例,研究人员发现他们可以“精确到分钟”地预测捕获数据快照的时间。39 这使得他们能够在拍摄数据快照之前的几分钟内插入不准确的数据,在此期间维基百科没有足够的时间修改不准确的数据。结果,错误的数据被捕获并输入到 AI 训练数据集中。
• 一台可以上网并安装 Adobe Acrobat Reader(免费)的电脑 • 免费的 PDF 教科书《神经科学基础》和《开放神经科学计划》 • iClicker 学生应用程序(免费)和便携式设备(手机、平板电脑或笔记本电脑) • 一个三孔活页夹(我们要用老式的!) 关于材料:自猫视频以来,神经科学是互联网上最热门的话题!YouTube、维基百科和其他地方有大量有用的资源,我鼓励您查找、使用和分享这些资源。例如,此处是免费神经科学教科书的 PDF 版本。本网站涵盖了许多我们更深入讨论的相同主题(包括视频和自测),本网站是学习和复习神经解剖学的好方法。此处还有一个很棒的 3D 大脑模型。我敢打赌你能找到更多!你就是资源:我们将有一个 Canvas 讨论板,我希望你能充分利用它来分享你发现的对课堂有帮助的有用资源。与同学提问和回答问题将有助于你学习。发明和分享有趣的助记符也是如此。
100GE 100 GBit/s 以太网 16CIF 16 倍通用中间格式(图片格式) 16QAM 16 状态正交幅度调制 1GFC 1 千兆波特光纤通道(2、4、8、10、20GFC) 1GL 第一代语言(Maschinencode) 1TBS 单真括号样式(C) 1TR6(ISDN-Protokoll D-Kanal,国家) 247 24/7:每天 24 小时,每周 7 天 2D 二维 2FA 双因子认证 2GL 第二代语言(汇编程序) 2L8 太晚(俚语) 2MS 结构单极 2 Mbit/s 3D 三维 3GIO 第三代 I/O(总线、接口) 3GL 第三代语言(C/C++、Fortran、Cobol) 3GPP 第三代合作伙伴计划 3LH 第三级层次结构 3PCC 第三方呼叫控制 3R 重定时、重塑、重新放大 3RR 三重还原规则(维基百科) 3T 3 刻度(CD/DVD) 4CIF 4 次通用中间格式(图片格式) 4GL 第四代语言(SQL、Labview、ABAP) 4LH 第四级层次结构 4MV 4 运动矢量 4U For You 5G 第五代(移动电话)
约翰·麦卡锡(John McCarthy,1927 年 9 月 4 日 - 2011 年 10 月 24 日)是美国计算机科学家和认知科学家。“人工智能”一词由他创造(维基百科,2020 年)。萨蒂什·加贾瓦达(Satish Gajawada,1988 年 3 月 12 日 - 至今)是印度独立发明家和科学家。他在本文中创造了“人工满足”一词(Gajawada,S. 和 Hassan Mustafa,2019a)。本文介绍了一个名为“人工满足”的新领域。本文发表后,“人工满足”将被称为“人工智能之兄”。本文设计并实现了一种名为“人工满意度算法(ASA)”的新算法。为了简单起见,粒子群优化(PSO)算法用人工满意度概念进行了修改,以创建“人工满意度算法(ASA)”。 PSO 和 ASA 算法应用于五个基准函数。对获得的结果进行了比较。本文的重点更多地在于定义和向世界介绍“人工满意度领域”,而不是从头开始实现复杂的算法。
航空是一种复杂的运输系统,安全至关重要,因为飞机故障往往会造成人员伤亡。预防显然是航空运输安全的最佳策略。从过去的事故数据中学习以防止潜在事故发生已被证明是一种成功的方法。为了防止潜在的安全隐患并制定有效的预防计划,航空安全专家从事故报告中确定主要因素和促成因素。然而,如今安全专家的审查过程已经变得非常昂贵。由于信息技术的加速发展以及商业和私人航空运输业的增长,事故报告的数量正在迅速增加。因此,应应用先进的文本挖掘算法来帮助航空安全专家促进事故数据提取过程。本文重点介绍如何构建基于深度学习的模型来识别事故报告中的因果因素。首先,我们使用来自航空安全报告系统 (ASRS) 的大约 200,000 份合格事故报告准备用于训练、验证和测试的数据集。十、我们采用开源自然语言模型作为基线,该模型经过大量维基百科文本训练,并使用事件报告中的文本对其进行微调,以使其更适合我们特定的研究任务。最后,我们构建并训练基于注意力机制的 lo
文本:阿维塞纳,又名伊本西纳,被认为是伊斯兰黄金时代最重要的医生、天文学家、思想家和作家之一,出生于公元 980 年左右,在布哈拉(今乌兹别克斯坦)附近的一个村庄阿夫沙纳。十岁时,他学习并记住了整本《古兰经》。十几岁时,他被亚里士多德的《形而上学》深深困扰,直到他读了法拉比对这部作品的评论后才明白。在接下来的一年半里,他学习了哲学。十六岁时,他转向医学。他不仅学习了医学理论,还发现了新的治疗方法。他很快取得了巨大的进步,成为一名优秀的医生,并开始使用经过批准的疗法治疗患者。他治疗了许多患者,却不收取任何费用。他最著名的作品是《医书》,一部哲学和科学百科全书,以及《医典》,一部医学百科全书,成为许多中世纪大学的标准医学教材,并一直沿用到 1650 年。1973 年,阿维森纳的《医典》在纽约重印。伊本西那于 1037 年 6 月 21 日去世。改编自维基百科,免费百科全书任务一:A/ 我阅读文本,然后完成下表。(02 分)
航空是一种复杂的运输系统,安全至关重要,因为飞机故障往往会造成人员伤亡。预防显然是航空运输安全的最佳策略。从过去的事故数据中学习以防止潜在事故发生已被证明是一种成功的方法。为了防止潜在的安全隐患并制定有效的预防计划,航空安全专家从事故报告中确定主要因素和促成因素。然而,如今安全专家的审查过程已经变得非常昂贵。由于信息技术的加速发展以及商业和私人航空运输业的增长,事故报告的数量正在迅速增加。因此,应应用先进的文本挖掘算法来帮助航空安全专家促进事故数据提取过程。本文重点介绍如何构建基于深度学习的模型来识别事故报告中的因果因素。首先,我们使用来自航空安全报告系统 (ASRS) 的大约 200,000 份合格事故报告准备用于训练、验证和测试的数据集。十、我们采用开源自然语言模型作为基线,该模型经过大量维基百科文本训练,并使用事件报告中的文本对其进行微调,以使其更适合我们特定的研究任务。最后,我们构建并训练基于注意力机制的 lo