Loading...
机构名称:
¥ 2.0

生成式人工智能 (genAI) 系统已经问世,并将持续存在,支持个人和企业用户大规模快速地生成音频、代码、图像、文本和视频内容。在 genAI 工具广泛用于公众的短时间内,我们见证了世界各地个人和组织的广泛采用。OpenAI 的 ChatGPT 现在每周拥有超过 2 亿活跃用户,1 微软的 Github Copilot 拥有超过一百万付费用户,2 根据麦肯锡技术委员会 2024 年的一项研究,65% 的全球组织已在至少一个业务功能中采用了 genAI 系统。3 一般而言,genAI 系统依赖于通用人工智能 (AI) 模型(也称为基础模型 4),这些模型通常使用大量数据进行训练以实现各种目的。例如,大型语言模型使用来自多种来源的数十亿字节文本数据进行训练,例如来自网络的公开数据(其中可能包括个人数据)、许可数据以及学术和行业数据集。 5 从这些庞大而多样化的数据集中,genAI 模型经过训练,能够识别单词与其他数据(如图像、视频和音频)之间的统计关系,以响应各种用户提示,并做出概率预测,从而生成有用的输出。 6 此外,genAI 模型可以进一步“微调”和个性化,使用专门策划的数据,以便更好地完成特定目的。例如,genAI 模型可以使用医疗数据进行微调,以协助医生和医护人员做笔记和临床记录。 7 模型还可以个性化,以在客户参与或个性化辅导环境中回答新问题。 GenAI 系统要求用户输入提示以获得生成的输出,输入和输出有时可能包括个人甚至敏感信息。 8 在部署期间,genAI 模型可能会泄露或披露来自训练数据集的个人数据,并生成与个人相关的不准确数据(也称为“幻觉”),恶意行为者可以使用各种方法绕过为避免泄露 genAI 模型中的个人数据而设置的保护栏。因此,数据保护机构、其他监管机构以及研究人员越来越多地讨论数据保护法是否以及如何适用于 genAI 工具,这些系统可能给数据保护带来哪些新的风险,以及如何解决某些数据保护原则与 genAI 之间的潜在紧张关系。本讨论文件考虑了以下关键的隐私和数据保护概念,并探讨了如何将它们有效地应用于 genAI 模型和系统的开发和部署:

将数据保护原则应用于生成人工智能

将数据保护原则应用于生成人工智能PDF文件第1页

将数据保护原则应用于生成人工智能PDF文件第2页

将数据保护原则应用于生成人工智能PDF文件第3页

将数据保护原则应用于生成人工智能PDF文件第4页

将数据保护原则应用于生成人工智能PDF文件第5页