選挙におけるSNS偽情報対策-EUのDSAにおけるガイドライン
■摘要 本文介绍了根据欧盟数字服务法案(DSA)制定的旨在遏制选举期间虚假信息传播的准则。涵盖的实体包括超大型在线平台 (VLOP) 和超大型在线搜索引擎 (VLOSE)。 VLOP 和 VLOSE 在下文中统称为 VLOP 等。 VLOP 和其他组织必须开展的基本活动包括:(1)收集选举信息,包括来自政党的信息;(2)收集和分析特定于举行选举的国家或地区的信息;(3)组建专门打击虚假信息的内部团队;(4)在选举前、选举期间和选举后实施必要的缓解措施。 具体的风险缓解措施包括:a)方便用户获取官方选举信息,b)努力提高用户素养,c)使用事实核查组织,d)努力使推荐系统中的虚假信息不那么显眼,e
LLM Alignment: Reward-Based vs Reward-Free Methods
LLM 对齐的优化方法上下文语言模型已经展示了根据用户提供的提示生成各种引人注目的文本的非凡能力。然而,定义什么是“好”文本具有挑战性,因为它通常取决于个人偏好和具体背景。例如,在讲故事时,创造力是关键;在制作信息内容时,准确性和可靠性至关重要;而在生成代码时,确保它正确运行至关重要。因此出现了“LLM 对齐问题”,它指的是确保大型语言模型 (LLM) 的行为方式符合人类价值观、意图和偏好的挑战。设计一个损失函数来捕捉我们在文本中重视的各种品质——比如创造力、准确性或可执行性——是非常复杂且通常不切实际的。像这样的概念是不可区分的,因此不能反向传播,也不能用简单的下一个标记生成来训练。想象一下
Reporting an R-Squared Measure for Count Data Models
这篇文章的灵感来自于我前段时间收到的一封电子邮件,该邮件来自一位博客读者。我认为,更“广泛”的回应可能会引起其他读者的兴趣......尽管存在许多局限性,但在报告最小二乘回归结果时,包括判定系数 (R2) 或其“调整后”的值是标准做法。就我个人而言,我认为 R2 是我们结果中包含的最不重要的统计数据之一,但我们都这样做。(请参阅上一篇文章。)如果所讨论的回归模型是线性的(在参数中)并且包含截距,并且如果参数由普通最小二乘法 (OLS) 估计,则 R2 具有许多众所周知的属性。这些包括:0 ≤ R2 ≤ 1。如果我们向模型中添加回归量,R2 的值不会减小。无论我们将这个度量定义为“解释平方和”与