ai和翻译的未来:人类合作的新时代

当前机器学习研究中的一种常见观点是,机器学习本身可用于提高AI数据集注释的质量,尤其是旨在用于视觉模型(VLMS)的图像标题。这种思维方式是由人类注释的高成本驱动的,并且监督注释者的增加负担[…]帖子“下载更多标签!” AI研究中的幻觉首先出现在Unite.ai上。

来源:Unite.AI

当前机器学习研究中的一种常见观点是,机器学习本身可用于提高AI数据集注释的质量,尤其是旨在用于视觉模型(VLMS)的图像标题。这种思维方式是由人类注释的高成本以及监督注释绩效的额外负担所驱动的。

用于改进 高成本 监督

可以说,这是2000年代初“下载更多RAM”模因的AI,它讽刺了这样的观念,即可以通过基于软件的修复程序可以解决硬件限制。

‘下载更多ram'模因

这也是一个不受欢迎的问题;尽管新的AI模型在公共和商业领域都引起了广泛的关注,但注释通常是机器学习管道中的一个微不足道的细节,被围绕更广泛框架的兴奋所掩盖。

实际上,机器学习系统识别和复制模式的能力(几乎所有AI系统的中心用例)取决于现实世界注释的质量和一致性 - 现实中的人创建或裁定的标签和短语,通常是由真实的人创建或裁定的,通常在非理想情况下对单个数据点做出主观判断。

依赖 非理想情况

不可避免地,试图观察和重现注释剂行为中的模式的系统(从而取代了人类注释并促进按大规模进行准确的标记)不能希望在人类观察者示例中未包含的数据上表现良好。 “类似”没有什么是相同的,而且跨域等效性仍然是计算机视觉中的问题。

不是 有问题的追求

“上游数据雄鹿”必须停止某个地方,在这种情况下,这正是它停止的地方 - 人类小脑对某种主观的区别进行某种主观区别,以便为人工系统编纂数据。

抹布贸易

结束 幻觉 基于抹布的代理

repope

错误 明显可见 基于轮询的对象探测评估 是/否 f1