LLM 在一个过程中逐字生成较长的文本。为了生成每个单词,LLM 根据前面的上下文为英语词汇表中的每个单词分配一个概率。上下文最初是我给系统的提示,然后通过添加 LLM 到那个时间点生成的每个单词来扩展。该模型不是取最有可能的单词,而是根据其可能性随机“采样”下一个单词。图中单词的颜色表明模型认为它在前面的上下文中出现的可能性有多大。“accomplished” 一词被涂成红色,因为模型认为它是低概率的延续,在前面的上下文中可能性小于 1%。以下是它可以选择的其他更高概率的单词,而不是输出“accomplished”:
通过删除计算机生成作品的版权,市场将显然区分人类创建和AI生成的内容。人为创造的作品将保留版权保护,并保持其在许可市场中的重要价值。这可能导致对真实,人为创作的作品的需求更高,使艺术家和代表他们的机构受益。这还将阐明AI工作的法律和商业环境,使艺术家和机构能够保护和促进自己的工作,而不是与潜在的侵犯AI内容竞争。
法院在许多案件中都支持类似的使用,包括涉及 Google 的图书搜索工具和抄袭检测软件 Turnitin 的流行判决。在 Turnitin 案中,美国法院裁定扫描学生论文(受版权保护)以检测潜在抄袭属于合理使用。同样,在 Google 的案件中,法院裁定扫描书籍并向网络搜索者提供摘录属于合理使用,因为 Google 这样做只是为了让书籍更易于搜索,而不是泄露其表达内容。
摘要 全球范围内,新闻业和其他机构在自动新闻生成、算法分发和内容所有权方面发生冲突。人工智能政策是建立和组织这些机构层级结构的主要机制。然而,很少有研究探讨人工智能在新闻业政策制定中的规范维度,尤其是在西方以外的国家。本案例研究考察了版权法在未经审查的中国背景下对新闻编辑室人工智能创新的影响。本研究运用新制度理论和政策网络理论,调查了中国《版权法》第三修正案、有关自动新闻版权纠纷的典型法庭案件(如腾讯诉英迅和电影诉百度)和其他支持文件。研究结果显示了中国的版权法律框架如何将作者身份和所有权分开;定义人机协作中的“原创性”和“创造力”;以及优先考虑科技公司同时破坏新闻自主权。我们认为,法律对人工智能的积极支持可能会让科技公司比那些不一定有采用人工智能战略的新闻机构更具优势。此外,它更青睐国有、资源丰富的官方媒体,而不是私营部门。这种权力动态的转变意味着私营新闻媒体可能会被边缘化,从而导致国家对媒体制作和信息流的控制更加严格。
在这个技术先进的时代,人工智能系统在生产中的应用是意料之中的事。然而,人们深切担心人工智能技术会失控。有了先进的技术,这些系统开始在没有人为干预的情况下产生惊人的发明只是时间问题。这引发了有关知识产权的问题,因为它不仅扰乱了版权的概念,而且还引发了与版权法的相关性相关的问题,然而,版权法被认为在应对人工智能的发展方面滞后了。通过概念方法,使用规范、教义法律研究方法和比较研究,以及使用定性分析技术,本文认为需要概念化和重新定义与版权相关的法规和法律框架,并提供社会和法律工具来控制人工智能系统的功能和结果。本文建议,政府应该意识到迫切需要为程序员和人工智能所有者提供激励措施,以刺激未来对人工智能的发展和投资。为了适应人工智能创作的作品,政府需要重新设计《印度尼西亚版权法》,以适应版权问题、道德和经济权利以及人工智能创作作品的保护期;并考虑采用雇佣作品的概念。
生成式人工智能工具,尤其是人工智能图像生成器,通常会被提示输出“具有”特定艺术家风格的作品,从而产生旨在与该艺术家的作品直接竞争的作品。25 在这里,第四个因素可以成为第一个因素的宝贵平衡。具体而言,“即使法院发现人工智能生成的图像出于‘变革性’目的使用了艺术家的原创作品,也可以得出结论,总的来说,对艺术家许可市场的负面影响与合理使用相抵触。” 26 生成式人工智能的出现可能会导致人们对未来涉及该技术及其产出的合理使用案件中的市场竞争和市场影响重新产生兴趣,并可能将焦点转移到人工智能生成的内容是否替代和与原始作品竞争。27
《版权法》第30-4条(法案号1970年的48年)(无目的无目的享受在作品中表达的思想或情感),在以下任何情况下,以任何方式,以任何方式利用一项作品,或者在任何其他情况下,或者在任何其他情况下都不是一个人的目的,以使某人的目的享受或让另一个人享受或使其他人享受这项工作表达的思想或观点;但是,前提是,如果该诉讼会根据工作的性质或目的或其剥削情况不合理地损害版权所有者的利益:i。如果它用于测试,以开发或投入到与作品或其他此类剥削的声音或视觉效果相关的实际使用技术; ii。如果将其用于数据分析(意味着从大量作品或大量其他此类数据中的构成语言,声音,图像或其他元素数据的提取,比较,分类或其他统计分析;在第47-5条第47-5条,第(1)段中,该数据相同,项目II II); iii。如果它在计算机数据处理过程中被利用或以其他方式不涉及人类感官所感知的作品所表达的内容(对于计算机编程的作品,则这些利用不包括在计算机上执行工作),而不是前面两个项目中所设置的。
<关于AI开发相关的著作权作品的学习> 人们担心,经过多年精心创作的独特作品可能会被机器学习并轻易创作出类似的作品。 - 人工智能本身对社会来说是必要的,学习人工智能不应该被全面禁止。对于学习阶段的抄袭,需要明确日本的版权法是否真的比其他国家宽松。至少它的制度比美国更严格。海外对《AI天堂》的一些批评存在误解,有必要作出正确解释。 * 我想知道我们的版权材料是否真的正在被研究。事实上,其中一些甚至没有网上的数字数据。此外,主要的人工智能公司都在海外。 ※有些作品除非将数字数据本身发布到网上,否则无法公开。我想了解防止机器学习的技术和方法。如果在技术和服务方面也有措施确保这一点,那就令人放心了。对于受版权保护的作品,如果它们作为学习数据集出售,我们认为未经许可复制此类数据集本身是不允许的。 * 人们担心网上发布的盗版版本会受到研究。 - 商业人工智能开发者未经许可研究受版权保护的作品,且不向版权所有者支付任何补偿,这是不公平的。 - 海外也有通过集中管理运营商等综合许可的方式发放许可,并获得报酬的情况。从每家人工智能相关企业获得许可会比较困难,但有人可能会说,如果某个组织或其他实体颁发了综合许可证,就不会施加权利限制。 〇我希望可以选择退出基于人工智能的学习。 我们应该尊重版权持有者的意愿,而人工智能出现偏见也是不可避免的。我们呼吁审查当前的权利限制,使其与人工智能技术的发展相协调,同时不妨碍创作者的权利。有人说,要阻止人工智能,哪怕意味着停止科学、停止技术、停止文明。 - 看起来像是现存作者的作品,以表达对现存作者的尊重。创意世界通过这些所谓作者身份的传承而发展起来。因此,他认为学习是一件积极的事情,因为这意味着他的写作风格将会被传承下去。
