reddit阻止了互联网存档抓取数据 - 这就是为什么

社交媒体平台正在打击后门数据收集。

来源:ZDNet | 机器人新闻
Andriy Onufriyenko/Getty Images

ZDNET的钥匙外卖

    Internet存档现在只能抓取Reddit的主页。REDDIT的目标是阻止AI公司刮擦Reddit用户数据。发布者(以及其他)正在起诉AI公司以侵犯版权。
  • 互联网存档现在只能抓取Reddit的首页。
  • Reddit的目标是阻止AI公司刮擦Reddit用户数据。
  • 出版商(和其他)正在起诉AI公司侵犯版权。
  • Reddit正在为AI公司辩护其隐私,这些公司正在采用回旋处的方法来刮擦其内容。

    根据The Verge的一份周一报告,社交媒体平台可以匿名发布并找到有关任何主题的信息,将阻止Internet Archive的Wayback Machine索引其在线数据。此举是为了回应以下发现:由于平台的高度策略,AI公司无法直接从Reddit刮擦数据,而是正在从Internet存档上的索引内容中检索其数据并使用它来培训模型。

    Wayback Machine 报告 根据The Verge的说法,Wayback Machine现在只能从Reddit的主页上刮擦数据,而访问用户个人资料,注释和发布详细信息页面将被阻止。 于1996年启动,Internet Archive是一个非营利组织,它运营着巨大的Web内容数据库。该档案是通过Wayback Machine维护的,Wayback Machine是一件网络爬行软件,该软件收集网页并保留它们在收集时出现的情况,例如Amber中的Digital Flies。这是研究在线文化和执法方面的数字法医证据的发展的研究人员。 Reddit的移动是什么意思 增长张力 提起拟人化 OpenAi (披露:ZDNET的母公司齐夫·戴维斯(Ziff Davis)于2025年4月提起针对OpenAI的诉讼,指控它侵犯了Ziff Davis的培训和操作AI系统的Ziff Davis版权。)) Wayback Machine

    报告

    根据The Verge的说法,Wayback Machine现在只能从Reddit的主页上刮擦数据,而访问用户个人资料,注释和发布详细信息页面将被阻止。

    于1996年启动,Internet Archive是一个非营利组织,它运营着巨大的Web内容数据库。该档案是通过Wayback Machine维护的,Wayback Machine是一件网络爬行软件,该软件收集网页并保留它们在收集时出现的情况,例如Amber中的Digital Flies。这是研究在线文化和执法方面的数字法医证据的发展的研究人员。

    Reddit的移动是什么意思

    增长张力 提起拟人化

    OpenAi

    (披露:ZDNET的母公司齐夫·戴维斯(Ziff Davis)于2025年4月提起针对OpenAI的诉讼,指控它侵犯了Ziff Davis的培训和操作AI系统的Ziff Davis版权。)合理使用