Loading...
机构名称:
¥ 1.0

由于高级AI系统(例如生成基础模型)表现出越来越丰富的行为,因此,对AI对齐和安全性研究的挑战是系统地以一种帮助我们理解和开发更安全的模型的方式来系统地表征这些行为。在实现这一目标的道路上的一个关键问题是,AI系统在概念上是否以人类的方式理解世界。一个经典的任务家族,用于探究人类和非人类动物的概念理解是相同的/不同的任务,它测试了对不同刺激中“相同”和“差异”的抽象概念的理解。从这些对人类和非人类动物的概念学习的研究中汲取灵感,我们提出了实验结果,以研究文本对图像(T2I)模型对相同/不同概念的理解。我们表明,尽管T2i模型对相同/不同概念的理解有所了解,但这种理解在相同性和差异的不同属性(例如纹理,颜色,旋转和大小)之间差异很大。我们讨论揭示这种行为差异的方式如何帮助我们设计更强大的模型培训和评估协议。最后,我们解释了人类,非人类动物和模型的概念学习行为分析之间的类比如何帮助我们更好地理解模型表现出的越来越多样化且通常是不可预测的行为。

在生成多模型中研究相同不同的概念理解

在生成多模型中研究相同不同的概念理解PDF文件第1页

在生成多模型中研究相同不同的概念理解PDF文件第2页

在生成多模型中研究相同不同的概念理解PDF文件第3页

在生成多模型中研究相同不同的概念理解PDF文件第4页

在生成多模型中研究相同不同的概念理解PDF文件第5页

相关文件推荐

2025 年
¥6.0
2024 年
¥3.0
2023 年
¥1.0
2022 年
¥15.0