ChatGPT，《堂吉诃德》的作者 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

ChatGPT，《堂吉诃德》的作者

2024年3月26日 10:26 33 Comments

TL;DR LLM 和其他 GenAI 模型可以重现大量训练数据。特定提示似乎可以“解锁”训练数据。我们面临许多当前和未来的版权挑战：训练可能不会侵犯版权，但合法并不意味着合法——我们考虑 MegaFace 的类比，例如，监控模型已经接受了未成年人照片的训练，[...]

来源:O'Reilly Media _AI & ML

TL;DR

LLM 和其他 GenAI 模型可以重现大量的训练数据。特定提示似乎可以“解锁”训练数据。我们面临许多当前和未来的版权挑战：训练可能不会侵犯版权，但合法并不意味着合法——我们考虑 MegaFace 的类比，例如，在没有知情同意的情况下，监控模型已经根据未成年人的照片进行了训练。版权旨在激励文化生产：在生成 AI 时代，版权是不够的。

LLM 和其他 GenAI 模型可以重现大量的训练数据。

特定提示似乎可以“解锁”训练数据。

我们目前和未来都面临着许多版权挑战：训练可能不会侵犯版权，但合法并不意味着合法——我们考虑了 MegaFace 的类比，例如，在没有知情同意的情况下，监控模型已经接受了未成年人照片的训练。

版权旨在激励文化生产：在生成式人工智能时代，版权还不够。

在博尔赫斯的寓言“堂吉诃德的作者皮埃尔梅纳德”中，同名的梅纳德先生计划坐下来写塞万提斯的堂吉诃德的一部分。不是抄写，而是逐字重写史诗小说：

堂吉诃德

他的目标从来不是机械地转录原作；他无意复制它。他令人钦佩的抱负是写出与米格尔·德·塞万提斯一字不差、一行一行完全一致的作品。学得更快。挖掘得更深。看得更远。

他的目标从来不是机械地抄写原作；他无意抄袭。他令人钦佩的抱负是写出与米格尔·德·塞万提斯一字不差、一行一行完全一致的作品。

抄袭

学得更快。挖掘得更深。看得更远。

堂吉诃德

生成式人工智能存在抄袭问题

生成式人工智能存在抄袭问题 记住敏锐地指出 星球大战 或

一行存在问题梅纳德学得堂吉诃德训练合法塞万提斯人工智能版权生成式原作抄袭