ChatGPT,《堂吉诃德》的作者

TL;DR LLM 和其他 GenAI 模型可以重现大量训练数据。特定提示似乎可以“解锁”训练数据。我们面临许多当前和未来的版权挑战:训练可能不会侵犯版权,但合法并不意味着合法——我们考虑 MegaFace 的类比,例如,监控模型已经接受了未成年人照片的训练,[...]

来源:O'Reilly Media _AI & ML

TL;DR

    LLM 和其他 GenAI 模型可以重现大量的训练数据。特定提示似乎可以“解锁”训练数据。我们面临许多当前和未来的版权挑战:训练可能不会侵犯版权,但合法并不意味着合法——我们考虑 MegaFace 的类比,例如,在没有知情同意的情况下,监控模型已经根据未成年人的照片进行了训练。版权旨在激励文化生产:在生成 AI 时代,版权是不够的。
  • LLM 和其他 GenAI 模型可以重现大量的训练数据。
  • 特定提示似乎可以“解锁”训练数据。
  • 我们目前和未来都面临着许多版权挑战:训练可能不会侵犯版权,但合法并不意味着合法——我们考虑了 MegaFace 的类比,例如,在没有知情同意的情况下,监控模型已经接受了未成年人照片的训练。
  • 版权旨在激励文化生产:在生成式人工智能时代,版权还不够。
  • 在博尔赫斯的寓言“堂吉诃德的作者皮埃尔梅纳德”中,同名的梅纳德先生计划坐下来写塞万提斯的堂吉诃德的一部分。不是抄写,而是逐字重写史诗小说:

    堂吉诃德
    他的目标从来不是机械地转录原作;他无意复制它。他令人钦佩的抱负是写出与米格尔·德·塞万提斯一字不差、一行一行完全一致的作品。学得更快。挖掘得更深。看得更远。

    他的目标从来不是机械地抄写原作;他无意抄袭。他令人钦佩的抱负是写出与米格尔·德·塞万提斯一字不差、一行一行完全一致的作品。

    抄袭

    学得更快。挖掘得更深。看得更远。

    学得更快。挖掘得更深。看得更远。

    堂吉诃德

    生成式人工智能存在抄袭问题

    生成式人工智能存在抄袭问题 记住 敏锐地指出 星球大战