1 生成式人工智能通常被定义为“一种经过训练以创建新数据而不是对特定数据集进行预测的机器学习模型。生成式人工智能系统会学习生成更多与其训练数据相似的对象。” Adam Zewe,《解释:生成式人工智能》(麻省理工学院新闻,2023 年 11 月 19 日),https://news.mit.edu/2023/explained-generative-ai-1109,2024 年 8 月 8 日访问。生成式人工智能是人工智能的一个子集,广泛指自动化人类感知和决策的技术。
13 Toews,“AI 芯片的地缘政治将决定 AI 的未来”。14 Tarasov,“苹果芯片实验室内部,这是该公司几十年来最“深刻变革”的发生地”;路透社,“彭博新闻报道,苹果计划以专注于 AI 的 M4 芯片彻底改造 Mac 产品线”。15 Satoh,“AMD 将考虑与台积电合作的“其他”代工厂:首席执行官 - 日经亚洲”。16 路透社,“Nvidia 在 AI 芯片领域的主导地位阻碍了对竞争对手初创企业的投资”。17 高通,“高通在 2023 年骁龙峰会上为设备带来破纪录的生成式 AI | 高通”。18 Michelle Cheng,“Nvidia 最大的客户也是这家 AI 芯片制造商的最大威胁”。19 Michelle Cheng。 20 Bratton,“谷歌的新芯片有望挑战 Nvidia、微软和亚马逊”。21 Bratton。22 Desineni 和 Tuv,“英特尔半导体制造环境中的高价值 AI。英特尔白皮书。”;Wheatley,“英特尔在先进芯片制造工艺方面取得进展,力争在 AI 领域占据一席之地 - SiliconANGLE”。23 路透社,“Nvidia 在 AI 芯片领域的主导地位阻碍了对竞争对手初创企业的投资”。24 Patil 等人,“半导体设计领导地位面临的日益严峻的挑战”。25 Zewe,“麻省理工学院制定战略,帮助美国重新获得半导体超级大国地位”。26 Lin,“在 AI 芯片竞赛中,谷歌 DeepMind 使用 AI 设计专用半导体”。
综合数据的发展和适应性的增长引起了人们对数据缺乏逻辑持续性的关键关注。在研究合成数据的一些核心承诺时,该对话论文旨在揭示进一步去政治化合成数据的潜在危害。借助合成数据,引入了技术机会,这些机会有望解决对培训AI模型所需数据的不断增长的需求。此外,对合成数据训练的模型被称赞为更精确和有效,同时带来比收集的数据便宜的模型(ZEWE 2022)。使用此对话论文,我旨在细微差别综合数据使针对AI驱动技术的批评复杂化的方式。我建立了关于综合数据承诺和危险辩论的两个要素的论点。第一个是数据稀缺性的概念 - 通常利用来主张实施和进一步开发合成数据来训练定制模型。第二,我讨论了数据污染和合成数据污染的关注点。通过这些入口点,我认为合成数据重新点燃了先前由学者在关键数据和监视研究领域提出的问题。因此,本对话论文的目的是呼吁对合成数据作为生存信息的批判性理解,就像收集的数据一样,并在模拟环境的背景下考虑合成数据及其发电的条件。
