详细内容或原文请订阅后点击阅览
每周回顾 2024 年 8 月
上周我在推特上发布的一些有趣链接(我也在 Mastodon、Threads、Newsmast 和 Bluesky 上发布了这些链接):这应该不足为奇。如果你将垃圾放入训练数据中,那么模型就是垃圾。由于目前的人工智能输出了很多垃圾,因此在这些输出上训练的模型不会更好:https://www.popsci.com/technology/ai-trained-on-ai-gibberish/另一家不加区别地抓取数据的人工智能公司:https://www.theverge.com/2024/7/25/24205943/anthropic-ai-web-crawler-claudebot-ifixit-scraping-training-data从事数据科学和人工智能工作需要具备的五项技能:https://www.kdnuggets.com/5-tools-every-data-scientist-needs-in-their-toolbox-in-2024用于测试人工智能模型风险的开放工具:https://techcrunch.com/2024/07/27/nist-releases-a-tool-for-testing-ai-model-risk/人工智能如何帮助提高学生成绩 - 以及这样做的缺点: https://www.datasciencecentral.com/can-machine-learning-predict-student-outcomes/AI 网络搜索工具会让网站产生幻觉吗?https://www.stuff.co.nz/world-news/350356832/openai-testing-web-search-features-chatgpt-challenging-google 有关如何在其他 AI 的输出上训练 AI 导致模型损坏的更多信息:https://www.windowscentral.com/software-apps/study-ai-incest-may-cause-model-collapse-for-tools-like-chatgpt-microsoft-copilot 我认为 AI 公司肯定已经耗尽了训练数据,这就是为什么他们厚颜无耻地抓取他们能抓取到的每个网站的原因:https://www.datanami.com/2024/07/26/are-we-running
来源:计算智能我
发推文在上周(我也将其发布到
mastodon,
线程 newsmast和
Bluesky):