详细内容或原文请订阅后点击阅览
预计人工智能将在十年内耗尽数据——然后呢?
新南威尔士大学一位领先的计算机科学家表示,一种被吹捧为解决生成式人工智能大问题的解决方案更适合其他形式的人工智能。新南威尔士大学计算机科学教授 Claude Sammut 表示,ChatGPT 和 Google Gemini 等人工智能聊天机器人的数据已经耗尽。生成式人工智能模型已经吞噬了大部分数据 […]
来源:宇宙杂志新南威尔士大学一位领先的计算机科学家表示,一种被吹捧为解决生成式人工智能大问题的解决方案更适合其他形式的人工智能。
新南威尔士大学计算机科学教授 Claude Sammut 表示,像 ChatGPT 和 Google Gemini 这样的人工智能聊天机器人正在耗尽可供“食用”的数据。
Claude Sammut生成式人工智能模型已经吞噬了它们被合法允许处理的大部分数据,这些数据质量足以改善其功能。
已经吞噬了大部分数据聊天机器人可能只能使用到 2032 年,直到优质数据耗尽。
即使是低质量的数据(取自不太可靠的来源,例如网页而不是出版的书籍)也最多会在几十年后耗尽。人工智能公司正在研究他们还能使用什么来避免在提供最佳人工智能助手的激烈竞争中停滞不前。行业领导者指出“合成数据”是一种潜在的解决方案。合成数据有两种。一种是人工智能基于现实世界信息生成的数据。给聊天机器人一个填满数字的电子表格,并要求它用不同的数字制作另一个类似的电子表格。这就是合成数据。
它也可以表示可能已被人类编辑或操纵的信息,但稍后会详细介绍。
ChatGPT 创建者 OpenAI 的首席执行官 Sam Altman 表示,聊天机器人有一天会足够聪明,可以纯粹基于合成数据进行自我训练。
“只要你能跨越事件视界,让模型足够聪明,能够制作出好的合成数据,我认为就没问题,”他在去年的一次采访中说道。
他在去年的一次采访中说道新南威尔士大学计算机科学教授 Claude Sammut 不同意。
Claude Sammut模式和逻辑
模式和逻辑AI 模型的学习方式是查看许多真实人类标记为某些事物的内容。