大型语言模型 (LLM) 已显示出作为评估 AI 系统生成的答案质量的自动评估器的前景。然而,基于 LLM 的评估器在用于评估成对比较中的候选答案时表现出位置偏差或不一致性,无论内容如何,都会偏向第一个或第二个答案。为了解决这个限制,我们提出了 P ORTIA,这是一个基于对齐的系统,旨在模仿人类的比较策略,以轻量级但有效的方式校准位置偏差。具体来说,P ORTIA 将答案分成多个部分,同时考虑长度和语义,然后将它们合并回单个提示以供 LLM 评估。对 6 个 LLM 对 11,520 个答案对进行的大量实验表明,P ORTIA 显着提高了所有模型和比较形式的一致性率,平均相对提高 47.46%。它还使 P ORTIA 增强型 GPT-3.5 能够实现与 GPT-4 相当的与人类的一致率,并将 GPT-4 的一致率提高到 98%。后续的人工评估表明,P ORTIA 增强型 GPT-3.5 模型在与人类评估者的一致性方面甚至可以超越独立的 GPT-4,凸显了 P ORTIA 纠正立场偏见、提高 LLM 一致性和提高性能的同时保持成本效率的能力。
大型语言模型 (LLM) 已显示出作为评估 AI 系统生成的答案质量的自动评估器的前景。然而,基于 LLM 的评估器在用于评估成对比较中的候选答案时表现出位置偏差或不一致性,无论内容如何,都会偏向第一个或第二个答案。为了解决这个限制,我们提出了 P ORTIA,这是一个基于对齐的系统,旨在模仿人类的比较策略,以轻量级但有效的方式校准位置偏差。具体来说,P ORTIA 将答案分成多个部分,同时考虑长度和语义,然后将它们合并回单个提示以供 LLM 评估。对 6 个 LLM 对 11,520 个答案对进行的大量实验表明,P ORTIA 显着提高了所有模型和比较形式的一致性率,平均相对提高 47.46%。它还使 P ORTIA 增强型 GPT-3.5 能够实现与 GPT-4 相当的与人类的一致率,并将 GPT-4 的一致率提高到 98%。后续的人工评估表明,P ORTIA 增强型 GPT-3.5 模型在与人类评估者的一致性方面甚至可以超越独立的 GPT-4,凸显了 P ORTIA 纠正立场偏见、提高 LLM 一致性和提高性能的同时保持成本效率的能力。
目前,空间站平台对接装置被动部分已完成定型,需要一种能够利用原位资源在轨组装大型有效载荷的对接机构。本文提出一种紧凑、高精度双组件对接机构的设计,用于大型空间载荷的对接。首先,提出主动侧和被动侧的参数设计,并建立捕获机构的约束方程。接下来,提出一种先粗校正、后精校正的渐进定位方法。分析双组件的校准和定位性能,初步捕获较大的偏差,随后实现电气和液压连接器的高精度对接。单、双组件的静态分析表明,承载能力与直径呈正相关。在原型测试期间,测得的最大位置偏差在X方向为0.12 mm,在Y方向为0.5 mm,在Z方向为0.07 mm。双组件联合操作时最大角度偏差为0.04°。最后,分析了轨道对接轴向和径向条件的影响,验证了载荷要求。本研究为未来大型空间载荷对接机构的研制提供了理论和技术指导。
纯方位估计是目标跟踪中的基本问题之一,也是具有挑战性的问题。与雷达跟踪的情况一样,偏移或位置偏差的存在会加剧纯方位估计的挑战。对各种传感器偏差进行建模并非易事,文献中专门针对纯方位跟踪的研究并不多。本文讨论了纯方位传感器中偏移偏差的建模以及随后的带偏差补偿的多目标跟踪。偏差估计在融合节点处处理,各个传感器以关联测量报告 (AMR) 或纯角度轨迹的形式向该节点报告其本地轨迹。该建模基于多传感器方法,可以有效处理监视区域中随时间变化的目标数量。所提出的算法可得出最大似然偏差估计器。还推导出相应的 Cram´er-Rao 下限,以量化所提出的方法或任何其他算法可以实现的理论精度。最后,给出了不同分布式跟踪场景的模拟结果,以证明所提出方法的能力。为了证明所提出的方法即使在出现误报和漏检的情况下也能发挥作用,还给出了集中式跟踪场景的模拟结果,其中本地传感器发送所有测量值(而不是 AMR 或本地轨道)。
在一个称为统计学习的过程中,人脑从周围环境中提取统计规律性。行为证据表明,发育阅读障碍会影响统计学习。然而,很少有研究评估发育阅读障碍如何影响这种类型的学习的神经加工。我们使用脑电图来探索发育阅读障碍患者的统计学习 - 对过渡概率的敏感性的重要方面的神经相关性。被诊断出患有发育阅读障碍的成年人(n = 17),对照(n = 19)暴露于连续的声音三胞胎流。经常,鉴于三胞胎的前两种声音(“统计偏差”),三胞胎结尾的过渡概率很低。此外,每隔一段时间都会从一个偏差的位置(“声学偏差”)出现三胞胎结尾。我们检查了统计变异者(SMMN)引起的不匹配负性,并通过位置偏差(即声学变化)引起的MMN。声学异常引起对照组中比发育迟钝组大的MMN。统计偏差在对照组中引起了一个小但很重要的SMMN,但在发育阅读障碍组中却没有。但是,两组之间的差异并不显着。我们的发现表明,在发育阅读障碍中,注意力障碍检测和隐性统计听觉学习都受到影响。
DNA 片段化是基于杂交捕获的短读测序中文库制备过程中的一个基本步骤。迄今为止,人们一直使用超声波来制备适当大小的 DNA,但这种方法会导致大量 DNA 样本损失。最近,研究采用了依赖于 DNA 内切酶酶促片段化的文库制备方法来最大限度地减少 DNA 损失,尤其是在纳米量样本中。然而,尽管它们被广泛使用,但酶促片段化对所得序列的影响尚未得到仔细评估。在这里,我们对使用超声波和酶促片段化方法制备的相同肿瘤 DNA 样本的体细胞变异进行了成对比较。我们的分析显示,与通过超声波创建的文库相比,内切酶处理的文库中反复出现的人工 SNV/indel 数量要多得多。这些人工制品以基因组背景下的回文结构、测序读取中的位置偏差和多核苷酸替换为标志。利用这些独特的特性,我们开发了一种过滤算法,可以高特异性和灵敏度地区分真正的体细胞突变和人为噪声。噪声消除恢复了肿瘤样本中突变特征的组成。因此,我们提供了一种信息学算法来解决因内切酶介导的碎片化而产生的测序错误,这是本研究中首次强调的。