详细内容或原文请订阅后点击阅览
ChatGPT,《堂吉诃德》的作者
TL;DR LLM 和其他 GenAI 模型可以重现大量训练数据。特定提示似乎可以“解锁”训练数据。我们面临许多当前和未来的版权挑战:训练可能不会侵犯版权,但合法并不意味着合法——我们考虑 MegaFace 的类比,例如,监控模型已经接受了未成年人照片的训练,[...]
来源:O'Reilly Media _AI & MLTL;DR
- LLM 和其他 GenAI 模型可以重现大量的训练数据。特定提示似乎可以“解锁”训练数据。我们面临许多当前和未来的版权挑战:训练可能不会侵犯版权,但合法并不意味着合法——我们考虑 MegaFace 的类比,例如,在没有知情同意的情况下,监控模型已经根据未成年人的照片进行了训练。版权旨在激励文化生产:在生成 AI 时代,版权是不够的。
在博尔赫斯的寓言“堂吉诃德的作者皮埃尔梅纳德”中,同名的梅纳德先生计划坐下来写塞万提斯的堂吉诃德的一部分。不是抄写,而是逐字重写史诗小说:
堂吉诃德他的目标从来不是机械地转录原作;他无意复制它。他令人钦佩的抱负是写出与米格尔·德·塞万提斯一字不差、一行一行完全一致的作品。学得更快。挖掘得更深。看得更远。
他的目标从来不是机械地抄写原作;他无意抄袭。他令人钦佩的抱负是写出与米格尔·德·塞万提斯一字不差、一行一行完全一致的作品。
抄袭学得更快。挖掘得更深。看得更远。