每周回顾 2024 年 8 月

上周我在推特上发布的一些有趣链接(我也在 Mastodon、Threads、Newsmast 和 Bluesky 上发布了这些链接):这应该不足为奇。如果你将垃圾放入训练数据中,那么模型就是垃圾。由于目前的人工智能输出了很多垃圾,因此在这些输出上训练的模型不会更好:https://www.popsci.com/technology/ai-trained-on-ai-gibberish/另一家不加区别地抓取数据的人工智能公司:https://www.theverge.com/2024/7/25/24205943/anthropic-ai-web-crawler-claudebot-ifixit-scraping-training-data从事数据科学和人工智能工作需要具备的五项技能:https://www.kdnuggets.com/5-tools-every-data-scientist-needs-in-their-toolbox-in-2024用于测试人工智能模型风险的开放工具:https://techcrunch.com/2024/07/27/nist-releases-a-tool-for-testing-ai-model-risk/人工智能如何帮助提高学生成绩 - 以及这样做的缺点: https://www.datasciencecentral.com/can-machine-learning-predict-student-outcomes/AI 网络搜索工具会让网站产生幻觉吗?https://www.stuff.co.nz/world-news/350356832/openai-testing-web-search-features-chatgpt-challenging-google 有关如何在其他 AI 的输出上训练 AI 导致模型损坏的更多信息:https://www.windowscentral.com/software-apps/study-ai-incest-may-cause-model-collapse-for-tools-like-chatgpt-microsoft-copilot 我认为 AI 公司肯定已经耗尽了训练数据,这就是为什么他们厚颜无耻地抓取他们能抓取到的每个网站的原因:https://www.datanami.com/2024/07/26/are-we-running

来源:计算智能

发推文

在上周(我也将其发布到

mastodon

线程 newsmast

Bluesky

):

  • 这不足为奇。如果将垃圾放入培训数据中,则该模型是垃圾。由于当前的AI输出很多垃圾,因此对这些输出进行培训的模型不会更好:https://www.popsci.com/technology/ai-traind-on-on-on-ai-gibberish/
  • https://www.popsci.com/technology/ai-trained-on-ai-gibberish/ 另一家AI公司不加区别地刮擦数据:https://www.theverge.com/2024/25/25/24205943/anththropic-aib-ai-web-crawler-claude-claudebot-ifixit-scraping-scraping-training-data-data-data-data > data
  • https://www.popsci.com/technology/ai-trained-on-ai-gibberish/
  • 另一家AI公司不加区别地刮擦数据:https://www.theverge.com/2024/25/25/24205943/anththropic-aib-ai-web-crawler-claude-claudebot-ifixit-scraping-scraping-training-data-data-data-data
  • https://www.theverge.com/2024/7/25/24205943/anthropic-ai-web-crawler-claudebot-ifixit-scraping-scraping-training-data
  • 您需要在数据科学和AI中工作需要五种技能:https://www.kdnuggets.com/5-tools-every-data-scientist-needs-needs-in-their-their-their-their-toolbox-in-2024
  • https://www.kdnuggets.com/5-tools-every-data-scientist-needs-their-their-their-toolbox-in-2024
  • 一种用于测试AI模型风险的开放工具:https://techcrunch.com/2024/07/27/nist-releases-a-tool-for-testing-testing-testing-ai-model-risk/
  • https://techcrunch.com/2024/07/27/nist-reales-a-tool-for-testing-testing-ai-model-risk/
  • AI如何帮助改善学生的成就和这样做的不利影响:https://www.datasciencecencectral.com/can-machine-learning-predict-student-comes/
  • https://www.datasciencecentral.com/can-machine-learning-predict-student-utcomes/ AI Web搜索工具会幻觉网站吗? https://www.stuff.co.nz/world-news/350356832/openai-testing-web-search-features-chatgpt-challenging-google https://www.stuff.co.nz/world-news/350356832/openai-testing-web-search-features-chatgpt-challenging-google-google 更多地介绍AI如何在其他AI的输出中导致模型破裂:https://www.windowscentral.com/software-apps/study-aibai-incest-may-cause-may-cause-model-collapse-collapse-for-for-tool---------------------- https://www.windowscentral.com/software-apps/study-ai-incest-may-cause-cause-model-collapse-for-for-tools-tools-chatgpt--chatgpt-microsoft-copilot
  • https://www.datasciencecentral.com/can-machine-learning-predict-student-utcomes/
  • AI Web搜索工具会幻觉网站吗? https://www.stuff.co.nz/world-news/350356832/openai-testing-web-search-features-chatgpt-challenging-google
  • https://www.stuff.co.nz/world-news/350356832/openai-testing-web-search-features-chatgpt-challenging-google-google更多地介绍AI如何在其他AI的输出中导致模型破裂:https://www.windowscentral.com/software-apps/study-aibai-incest-may-cause-may-cause-model-collapse-collapse-for-for-tool----------------------https://www.windowscentral.com/software-apps/study-ai-incest-may-cause-cause-model-collapse-for-for-tools-tools-chatgpt--chatgpt-microsoft-copilot