综合数据的发展和适应性的增长引起了人们对数据缺乏逻辑持续性的关键关注。在研究合成数据的一些核心承诺时,该对话论文旨在揭示进一步去政治化合成数据的潜在危害。借助合成数据,引入了技术机会,这些机会有望解决对培训AI模型所需数据的不断增长的需求。此外,对合成数据训练的模型被称赞为更精确和有效,同时带来比收集的数据便宜的模型(ZEWE 2022)。使用此对话论文,我旨在细微差别综合数据使针对AI驱动技术的批评复杂化的方式。我建立了关于综合数据承诺和危险辩论的两个要素的论点。第一个是数据稀缺性的概念 - 通常利用来主张实施和进一步开发合成数据来训练定制模型。第二,我讨论了数据污染和合成数据污染的关注点。通过这些入口点,我认为合成数据重新点燃了先前由学者在关键数据和监视研究领域提出的问题。因此,本对话论文的目的是呼吁对合成数据作为生存信息的批判性理解,就像收集的数据一样,并在模拟环境的背景下考虑合成数据及其发电的条件。
主要关键词