音频深度伪造对我们日常交流中的信任构成了日益严重的威胁。为此,研究界开发了各种各样的检测技术,旨在防止此类攻击欺骗用户。不幸的是,这些防御措施的创建通常忽略了系统中最重要的元素——用户自己。因此,尚不清楚当前的机制是增强、阻碍还是仅仅与人类对深度伪造的分类相矛盾。在本文中,我们进行了首次大规模的深度伪造检测用户研究。我们招募了 1,200 多名用户,并向他们展示了来自三个被引用最多的深度伪造数据集的样本。然后,我们定量比较性能并定性进行主题分析,以激发和理解用户决策背后的原因以及与机器分类的差异。我们的结果表明,用户正确分类人类音频的比率明显高于机器学习模型,并且在进行分类时依赖语言特征和直觉。然而,用户也经常被对生成音频能力的先入之见所误导(例如,口音和背景声音代表人类)。最后,机器学习模型的缺陷在于
其余四个指标——信贷增长、股票市场、公司债券利差和消费者信心——反映了其他可能推动估值的因素:信贷条件和情绪。大多数商业房地产交易都以债务的形式进行融资,通常是为了利用利率和收益率之间的差异来提高回报。信贷条件涵盖了债务的供需趋势,因此会影响交易量。这可以通过经济信贷增长数据明确体现,也可以通过股票市场和公司债券与美国国债的利差隐含体现(这两个变量均滞后 12 个月,将代表贷方提供信贷的意愿)。后两个指标还反映了投资者对风险较高资产的偏好趋势,除了消费者信心之外,它们还反映了更广泛的基于情绪的估值驱动因素。请参阅下页的图表。