认识论又称为科学哲学。它是哲学的一部分,我们研究知识、知识的基础、性质、范围和局限性。方法论是认识论的一个分支,我们研究特定于科学或学科的研究和分析方法。我们经常看到这个术语与方法(用于建立或证明真理,根据确定的原则和按特定顺序应用的步骤引导我们的思想)混淆使用。有时使用“logy”后缀来为我们不应该使用的术语提供科学解释……卡尔波普尔是 20 世纪的主要科学哲学家,他的工作主要集中在科学发现的逻辑上 [1]。他将可重复性提升为研究科学性的主要标准。十年来,我们在许多领域都观察到了可重复性危机,计算机科学就是其中之一。ACM 术语最近在 2020 年进行了更改,以反映计算机科学家的这种认识以及朝着产生可靠结果的正确方向的发展。经典计算机是确定性机器,即使我们运行随机模拟也是如此。当正确使用伪随机数时,我们可以用适当的方法精确地获得按位相同的结果,从而调试正在构建的科学软件,这是至关重要的 [2]。量子机器本质上是随机的,每次运行都可能产生不同的结果,但可重复性(而非可重复性)仍然是检查量子机器质量的主要标准:我们是否获得相同的统计数据和相同的科学结论?在简要回顾量子计算的起源之后,我们将在真实量子处理器上模拟和测试 Grover 算法时回顾正在进行的工作。
在本研究中,我们解释了阿姆斯特丹大学关于人工智能的公平性、责任性、保密性和透明度 (FACT-AI) 的技术研究生课程的设置,该课程通过可重复性的视角教授 FACT-AI 概念。该课程的重点是一个小组项目,该项目基于重现顶级 AI 会议上现有的 FACT-AI 算法并撰写相应的报告。在课程的第一次迭代中,我们创建了一个开源存储库,其中包含来自小组项目的代码实现。在第二次迭代中,我们鼓励学生将他们的小组项目提交给机器学习可重复性挑战赛,结果我们课程的 9 份报告被接受在 ReScience 期刊上发表。我们回顾了两年来教授该课程的经验,其中一年恰逢全球大流行,并提出了在研究生水平的人工智能学习课程中通过可重复性教授 FACT-AI 的指导方针。我们希望这可以成为未来想要开设类似课程的教师的有用资源。
1994 年,美国生物特征识别联盟领导层 1 向自动人机识别(“生物特征识别”)社区提出了一系列问题,这些问题围绕着性能测试中测量的可重复性和再现性问题。尽管我们在理解方面取得了重大进展,但这些问题尚未完全解决。本文在更广泛的科学实验背景和 NIST 数据评估和报告传统中讨论了我们当前对可重复性和再现性的方法。我们讨论了关于测试整体论的 Duhem-Quine 论题、Churchill Eisenhart 的“统计控制”概念、NIST 和 ISO 对实验室测量不确定性的方法、测试结果与系统操作员评估的“性能”之间当前的脱节(缺乏归纳相关性),以及我们当前生物特征识别测试程序中对统计控制和不确定性评估的需求。我们说明了测量不确定性在技术、场景和操作测试中是如何体现的,并主张超越 ISO/IEC“测量不确定性表达指南”中定义的“覆盖”间隔的计算,全面应用不确定性评估的概念。
背景:一种可靠的生物标志物来识别负责产生癫痫发作的皮质组织以指导癫痫的预后和治疗。组合的尖峰波纹事件是癫痫组织的有前途的生物标志物,目前需要专家审查才能准确识别。本专家审查是耗时且主观的,限制了可重复性和高通量应用程序。新方法:为了解决此限制,我们开发了一种用于尖峰纹波检测的完全自动化方法。该方法由一个卷积神经网络组成,该卷积神经网络训练以计算频谱图像包含尖峰纹波的概率。结果:我们在专家标记的数据上验证了所提出的尖峰纹波检测器,并表明该检测器准确地分离了具有低癫痫发作风险的受试者。与现有方法的比较:所提出的方法以及需要手动验证候选尖峰纹波事件的现有方法。引入完全自动化的方法可降低主观性,并增加此癫痫生物标志物的严格性和可重复性。结论:我们介绍并验证了完全自动的尖峰纹波探测器,以支持在临床和翻译工作中使用该Epilepsy Biomarker的利用。
值得注意的是 - 人工智能 (AI) 算法目前被提出用于核医学的许多不同目的。(第 2 页)- 这些算法的报告带来了特殊的挑战,需要适当的透明度和高度的科学严谨性(第 2-3 页)。- 任何涉及基于 AI 的方法的报告都应仔细解决和讨论研究结果的科学有效性、可重复性、有用性和可解释性(第 3 至 7 页)。
4间或实验室内的可重复性定义为在不同实验室或在同一实验室使用特定方案(在可重复条件下)在同一实验室获得的两个单个测试结果之间的绝对差异,预计可预期为95%的概率。(经合组织,2005年)。请注意,TGS可能已在此GD完成后发布。
1994 年,美国生物特征识别联盟领导层 1 向自动人机识别 (“生物特征识别”) 社区提出了一系列问题,这些问题围绕着性能测试中测量的可重复性和再现性问题。尽管我们在理解方面取得了重大进展,但这些问题尚未完全解决。本文在更广泛的科学实验和 NIST 数据评估和报告传统背景下讨论了我们当前对可重复性和再现性的方法。我们讨论了 Duhem-Quine 的测试整体论论题、Churchill Eisenhart 的“统计控制”概念、NIST 和 ISO 对实验室测量不确定性的方法、测试结果与系统操作员评估的“性能”之间当前的脱节(缺乏归纳相关性),以及我们当前生物特征识别测试程序中统计控制和不确定性评估的必要性。我们说明了测量不确定度在技术、场景和操作测试中是如何体现的,并主张超越 ISO/IEC“测量不确定度表示指南”中定义的“覆盖”间隔的计算,全面应用不确定度评估的概念。
进行了一项研究以证明富集过程的可重复性。由于三个地点的挑战,通过将多个骨髓瘤细胞系在健康的供体全血中刺激为3 cd138+水平,基于流式细胞仪(低,中,中等,高度,高度代表<3%,3-15%,> 15%,分别为16位副人)进行了研究,该研究是通过将多发性骨髓瘤细胞系刺到健康的全血中,进行了研究。在低水平和中等水平(高水平的4对4)中研究了更多的面板成员,以在更具挑战性的水平上证明富集。在每个站点的两个位点在三个站点评估了可重复性,而连续8天。三个独立站点中的每个站点中的每个站点都从同一面板成员那里获得了6个等分试样(来自16个面板成员)。每个操作员在每个面板成员上使用三个不同的试剂批次进行了富集。完成富集后,将所有样品均给单个操作员,以执行富集和未增强样品的流式细胞仪,以测量CD138+细胞纯度。每天准备了两个不同的CD138频率人为的样本以富集。
1 型糖尿病是一种无法治愈的自身免疫性疾病,由于可重复性危机,有希望的治疗方法的临床转化受到阻碍。在这里,两个独立的研究中心通过短期施用晚期糖基化终产物受体 (sRAGE) 拮抗剂来预防小鼠糖尿病。用 sRAGE 治疗可增加胰岛、胰腺淋巴结和脾脏内的调节性 T 细胞 (T regs),从而提高胰岛胰岛素的表达和功能。T reg 耗竭可消除糖尿病保护作用,并显示依赖于使用基因敲除小鼠拮抗 RAGE。用 RAGE 配体治疗的人类 T regs 下调了抑制、迁移和 T reg 稳态的基因 (FOXP3、IL7R、TIGIT、JAK1、STAT3、STAT5b、CCR4)。 sRAGE 逆转了抑制功能的丧失,其中 T regs 增加了增殖并抑制了常规 T 细胞分裂,证实了 sRAGE 扩增了功能性人类 T regs。这些结果突出了 sRAGE 是一种预防糖尿病的有吸引力的治疗方法,在多个研究中心和人类 T 细胞中显示出有效性和可重复性。