SafetyPairs: Isolating Safety Critical Image Features with Counterfactual Image Generation
本文被 ICLR 2026 的可信人工智能原理设计 — 可解释性、稳健性和跨模态安全性研讨会接受。到底是什么导致特定图像不安全?系统地区分良性图像和有问题的图像是一个具有挑战性的问题,因为图像的细微变化(例如侮辱性手势或符号)可能会极大地改变其安全含义。然而,现有的图像安全数据集粗糙且模糊,仅提供广泛的安全标签,而没有隔离导致这些差异的特定特征。我们介绍...
Furious young Americans declare Trump job market a 'scam'
据《纽约时报》报道,当被问及今天的就业市场报告时,美国年轻人表现出了愤怒和沮丧。《纽约时报》调查的一位参与者承认,“我大学毕业已经快两年了,感觉与现在相比真的很不一样”。《纽约时报》调查的一位参与者承认,“粗糙”,25 岁的缅因州研究生“珀西”这样描述市场。“一场骗局,”28 岁的佐治亚州卫生保健工作者“托普”说。新泽西州的客户服务员工,27 岁。在其焦点小组中,Times Opinion 采访了 12 位 Z 世代白领求职者,不仅谈论了就业市场,还谈论了人工智能,以及理想的工作环境实际上是什么样子,以及他们对“喧嚣文化”工作兴起的看法,因为他们没有退休、保险或福利。据《泰晤士报》报道,对话中