像苹果和 Nvidia 这样的价值数十亿美元的公司正在窃取 YouTube 内容来训练他们的人工智能

苹果、Nvidia 等十亿美元大公司正窃取 YouTube 内容来训练他们的人工智能苹果、Nvidia 和 Salesforce 正在使用 YouTube 上的内容来训练他们的人工智能。据 Proof News 和 Wired 报道,尽管 YouTube 有禁止收集信息的规定,但这些公司仍使用来自 48,000 个 YouTube 频道的 173,536 个 YouTube 视频的字幕作为训练数据。该数据集 (称为 YouTube 字幕) 包括可汗学院、麻省理工学院和哈佛大学等教育频道以及《华尔街日报》、NPR 和 BBC 等媒体的抄本。报告称,《深夜秀》、《上周今夜秀》和《吉米·坎摩尔秀》等深夜秀也被使用。此外,Proof News 发现,MrBeast、Marques Brownlee、Jacksepticeye 和 PewDiePie 等受欢迎的 YouTuber 的视频也被收录其中。 《大卫·帕克曼秀》的主持人大卫·帕克曼评论道:“没有人来找我说,‘我们想用这个。’”该节目拥有超过 200 万订阅者和超过 20 亿的观看次数。“这是我的生计,我投入了时间、资源、金钱和员工时间来创作这些内容。工作真的不缺,”他补充道,并认为如果人工智能公司获得报酬,那么他应该为他的数据获得补偿。Nebula 的首席执行官戴夫·威斯库斯直言不讳:“这是盗窃。这会被用来剥削和伤害艺术家吗?是的,绝对会。”这些数据是“The Pile”的一部分,这是一份发布的数据汇编,其中包括来自 YouTube、欧洲议会的内容

来源:Zero Hedge

Apple、Nvidia 和 Salesforce 正在使用 YouTube 上的内容来训练他们的人工智能。

据 Proof News 和 Wired 报道,尽管 YouTube 有禁止收集信息的规定,但这些公司仍使用来自 48,000 个 YouTube 频道的 173,536 个 YouTube 视频的字幕作为训练数据。

据 Proof News 和 Wired 报道

该数据集(称为 YouTube 字幕)包括可汗学院、麻省理工学院和哈佛大学等教育频道以及《华尔街日报》、NPR 和 BBC 等媒体的成绩单。

报告称,深夜秀、上周今夜秀和吉米·坎摩尔秀等深夜秀也被使用。

此外,Proof News 发现,像 MrBeast、Marques Brownlee、Jacksepticeye 和 PewDiePie 这样的热门 YouTuber 的视频也被收录其中。

拥有超过 200 万订阅者和超过 20 亿观看次数的《大卫·帕克曼秀》主持人大卫·帕克曼评论道:“没有人来找我说‘我们想用这个’。”

“这是我的生计,我投入了时间、资源、金钱和员工时间来创作这些内容。真的不缺工作,”他补充道,并认为如果人工智能公司获得报酬,他就应该为他的数据获得补偿。

Nebula 的首席执行官戴夫·威斯库斯直言不讳:“这是盗窃。这会被用来剥削和伤害艺术家吗?是的,绝对会。”

直言不讳

这些数据是“The Pile”的一部分,这是一份发布的数据汇编,其中包括来自 YouTube、欧洲议会、英文维基百科和公司电子邮件的内容。

Apple 在为其产品添加新的 AI 功能之前,曾将 Pile 用于 OpenELM。据彭博社和 Databricks 的报道,它们也利用了 Pile。据 Wired 报道,由亚马逊 40 亿美元投资支持的 AI 公司 Anthropic 证实,其 AI 助手 Claude 使用了 Pile,同时强调遵守 YouTube 的条款。

写道

在此处阅读 Wired 的完整故事。

此处

正在加载...