Nvidia 使用大量 YouTube 视频来训练其 AI

根据 404 Media 获得的泄露的内部通讯,Nvidia 已经刮了 80 年了。 NVIDIA 最近因涉嫌未经许可从 YouTube 和 Netflix 等平台抓取视频而受到审查。据说这种做法是他们为人工智能项目编译训练数据的努力的一部分。这家估值约 2.4 万亿美元的公司 […] Nvidia 使用大量 YouTube 视频训练其人工智能的帖子首次出现在人工智能新闻上。

来源:AI新闻
    nvidia从YouTube和其他来源收集了培训AI模型的视频。 YouTube.nvidia使用20-30台虚拟机每天下载80年的视频。避免负面注意力。
  • nvidia从YouTube和其他来源收集了培训AI模型的视频。
  • 公司捍卫其实践与《版权法》兼容。
  • 内部讨论表明,员工担心使用数据集的法律问题。
  • 该项目称为Cosmos,旨在为各种Nvidia产品创建高级视频模型。
  • 员工使用YT-DLP和虚拟机来避免YouTube的阻塞。
  • nvidia使用20-30台虚拟机每天下载80年的视频。
  • 尽管有法律风险,该公司计划使用Netflix和其他来源的视频。
  • nvidia声称他们对数据的使用受“合理使用”的保护。
  • Google和Netflix未经许可反对NVIDIA的数据收集。
  • 内部讨论表明,NVIDIA不打算发布研究结果,以避免负面注意力。
  • 根据404个媒体获得的内部通信,NVIDIA刮擦了80年。

    404媒体

    NVIDIA使用YouTube下载器YT DLP在20至30台虚拟机上使用,这些机器更新了其IP地址以避免阻塞。

    表面DLP