今年我们成果颇丰,同时进行了数次教职搜索和教职聘用。我们很高兴欢迎四位出色的新同事加入我们的部门,他们是 Jonathan Nelson 博士、Benjamin Lin 博士、Kathryn Gunn 博士和 Lina Carlini 博士。Nelson 博士的实验室致力于阐明监测基因组传递保真度的分子机制,Lin 博士的实验室致力于研究在复杂 3D 环境中控制细胞形状和运动的分子机制,Gunn 博士的实验室使用生化和结构方法探索代谢酶的时空调节,Carlini 博士的实验室致力于研究细胞内动力学,特别关注真核细胞的分裂。今年秋季和冬季也同样令人兴奋,因为我们已启动了两项助理教授级别的教职搜索。
AI系统经过经常被模型记忆的数据培训(Carlini等,2021)。机器学习模型的行为就像训练数据的有损压缩机一样,这些模型基于深度学习的性能进一步归因于这种行为(Schelter,2020; Tishby&Zaslavsky,2015年)。换句话说,机器学习模型是培训数据的压缩版本。此外,AI模型还容易受到会员推理攻击的影响,这些攻击有助于评估有关某人的数据是否在培训数据集中(Shokri等,2017)。因此,实施擦除和纠正的权利需要通过模型逆转个人数据的记忆。这涉及删除(1)用作培训输入的个人数据,以及(2)训练有素的模型中特定数据点的影响。
© 欧洲大学学院 2021 内容和各个章节 © Roberta Carlini 和 Konrad Bleyer-Simon,2021 本作品由欧洲大学学院罗伯特舒曼高等研究中心出版。 本文本仅可出于个人研究目的下载。 如需以其他目的进行额外复制,无论是硬拷贝还是电子版,均需征得作者同意。 如果引用或引述,应注明作者、编辑的全名、标题、年份和出版商。 请求应发送至 cmpf@eui.eu 。 本出版物中表达的观点反映的是个人作者的意见,而不是欧洲大学学院的意见。媒体多元化与媒体自由中心罗伯特舒曼高等研究中心研究项目报告 RSCAS/媒体多元化与媒体自由中心,2021/2021 年 4 月 1 日欧洲大学学院 Badia Fiesolana I – 50014 San Domenico di Fiesole (FI) www.eui.eu/RSCAS/Publications/cadmus.eui.eu
Adrian Gottschlich#1,2,3,Moritz Thomas#4,5,RuthGrünmeier#1,Stefanie Lesch 1,Lisa Rohrbacher 3,6,Veronika IGL 1,Daria Briukhovetska 1 XU 9,Dario Dhoqina 1,FlorianMärkl1,Sophie Robinson 10,11,Andrea Sendelhofert 12,Heiko Schulz 12,Öyküumut1,Vladyslav Kavaka 13,14 ,索菲亚股票1,3,15, PhilippJieMüller1,JaninaDörr1,Matthias Seifert 1,Bruno L. Cadilha 1,Ruben Brabenec 1,4,NatalieRöder1,FelicitaS Rataj 1,ManuelNüesch1,Franziska Siska Modemann 16,17,Jasmin Wellbrock 16,Walbrock 16,Walbrock 16,walbrock偏见Herold 3,15,Dominik Paquet 10,11,Irmela Jeremias 7,8,15,Louisa Von Baumgarten 15,19,Stefan Endres 1,15,20,Marion Subklewe 3,6,15,Carsten Marr 3,§
大型语言模型(LLMS)功能的最新进展(Devlin等人,2019年;布朗等人。,2020年; Zhao等。,2023年),导致了他们广泛的收养,作为工业和学术NLP各种任务的基础(Bom- Masani等人。,2021)。在数十亿和数十亿的参数计数中,这些模型需要大量的数据才能进行训练和微调(Hoffmann等人。,2022)。同时,这种过度分析能够记忆和潜在的LLMS训练数据的泄漏或提取(Biderman等人,2023; Carlini等。,2023; Hartmann等。,2023)。综上所述,LLMS所需的培训数据和记忆能力提出了实质性问题(Li等人,2023)。这种风险更加复杂,因为LLM与所有监督学习者一样,在具有与培训数据相似的分布的测试集上表现最好。因此,寻求部署实际上有效的LLM的组织必须使用反映其部署分布的数据,并使用特定的,敏感的数据(例如医疗记录或通话记录),导致绩效提高,但相应地
AE 对抗性示例 AI 人工智能 API 应用程序接口 BDP 边界差分隐私 BIM 基本迭代方法 CIFAR 加拿大高级研究院 CNN 卷积神经网络 CW Carlini 和 Wagner(攻击) DNN 深度神经网络 DP-SGD 差分隐私随机梯度下降 FGSM 快速梯度符号法 GNN 图形神经网络 IP 知识产权 JPEG 联合图像专家组 JSMA 基于雅可比矩阵的显著性图 KNHT 键控非参数假设检验 L-BFGS 有限内存 Broyden-Fletcher-Goldfarb-Shanno(算法) MNIST 改良的国家标准与技术研究所 MNTD 元神经木马检测 PATE 教师集合的私有聚合 PCA 主成分分析 PGD 项目梯度下降 PRADA 防止 DNN 模型窃取攻击 ReLU 整流线性单元 RNN 循环神经网络 RONI 拒绝负面影响 SAI 保护人工智能 SAT 可满足性 SGD 随机梯度下降 SMT 可满足性 模理论 STRIP STRong 有意扰动 TRIM 基于修剪的算法 ULP 通用试金石
一些研究表明,这种植物是由非洲奴隶带到巴西的,直到上个世纪初,它在这里和许多其他国家都被用作医学。从1920年代开始,大麻使用妖魔化,在1924年在日内瓦举行的II国际鸦片会议上被错误地认为是被禁止的物质。然而,卡林尼博士在1970年代在巴西发现的大麻sativa的重要抗惊厥作用侧重于植物作为药物的有用性。记录中,大约三分之一的癫痫患者对常规药理治疗有抵抗力,并继续癫痫发作。这些数据激发了对大麻素治疗的需求。在巴西尚未监管大麻的药用使用,这使人们寻找基于植物油的替代途径来获取药物。根据生病人士及其家人的倡议,生产和销售Sativa Oil的协会和慈善实体,已经出现了以外的癫痫病,有几个