背景:人工智能中的偏见引起了人们的关注,算法表现不平等在整个刑事司法,教育和福利服务领域都被暴露出来。在医疗保健中,跨人群群体的算法不平等的性能可能会扩大健康不平等。 目的:在这里,我们识别和表征心脏病学算法中的偏见,专门研究用于管理心力衰竭的算法。 方法:第1阶段涉及与心脏机器学习(ML)算法有关的PubMed和Web Science的文献搜索。 评估了建立ML模型以预测心脏病的论文,以评估其对模型性能中人口偏见的关注,并保留了开源数据集以进行调查。 确定了两个开源数据集:(1)加利福尼亚大学尔湾分校心力衰竭数据集和(2)加利福尼亚大学欧文分校冠状动脉疾病数据集。 我们复制了已报告这些数据集的现有算法,对它们进行了对算法性能的性偏见进行了测试,并评估了一系列补救技术,以减少不平等的功效。 由于诊断不足和缺失的治疗机会的临床意义,特别注意假阴性率(FNR)。 结果:在第1阶段,我们的文献搜索返回了127篇论文,有60条符合完整审查的标准,只有3篇论文强调了算法性能的性别差异。 在报告性别的论文中,数据集中女性患者的代表性不足。在医疗保健中,跨人群群体的算法不平等的性能可能会扩大健康不平等。目的:在这里,我们识别和表征心脏病学算法中的偏见,专门研究用于管理心力衰竭的算法。方法:第1阶段涉及与心脏机器学习(ML)算法有关的PubMed和Web Science的文献搜索。评估了建立ML模型以预测心脏病的论文,以评估其对模型性能中人口偏见的关注,并保留了开源数据集以进行调查。确定了两个开源数据集:(1)加利福尼亚大学尔湾分校心力衰竭数据集和(2)加利福尼亚大学欧文分校冠状动脉疾病数据集。我们复制了已报告这些数据集的现有算法,对它们进行了对算法性能的性偏见进行了测试,并评估了一系列补救技术,以减少不平等的功效。由于诊断不足和缺失的治疗机会的临床意义,特别注意假阴性率(FNR)。结果:在第1阶段,我们的文献搜索返回了127篇论文,有60条符合完整审查的标准,只有3篇论文强调了算法性能的性别差异。在报告性别的论文中,数据集中女性患者的代表性不足。没有论文调查种族或种族差异。在第2阶段,我们重现了文献中报道的算法,对于数据集为1和85.72%(随机森林模型)的数据集为1和85.72%(SD 1.75%)的平均精度为84.24%(SD 3.51%)。对于数据集1,在16个实验中,女性患者的FNR明显更高,达到了统计显着性的阈值(–17.81%至–3.37%; p <.05)。 在16个实验中,有13例男性患者(–0.48%至 +9.77%; p <.05)中的男性患者的假阳性差异很小。 我们观察到男性患者疾病的过度预测(较高的假阳性率)和女性患者疾病的预测不足(较高的FNR)。 性质重要性的性别差异表明,特征选择需要根据人口统计学量身定制。 结论:我们的研究暴露了心脏ML研究中的显着差距,强调,女性患者的算法不良表现不佳在已发表的文献中被忽略了。 我们的研究量化了算法性能中的性别差异,并探讨了几种偏见来源。 我们发现,在用于训练算法,确定模型错误率中的性别偏见的数据集中,女性患者的人数不足,并证明了一系列补救技术无法解决存在的不平等现象。对于数据集1,在16个实验中,女性患者的FNR明显更高,达到了统计显着性的阈值(–17.81%至–3.37%; p <.05)。在16个实验中,有13例男性患者(–0.48%至 +9.77%; p <.05)中的男性患者的假阳性差异很小。我们观察到男性患者疾病的过度预测(较高的假阳性率)和女性患者疾病的预测不足(较高的FNR)。性质重要性的性别差异表明,特征选择需要根据人口统计学量身定制。结论:我们的研究暴露了心脏ML研究中的显着差距,强调,女性患者的算法不良表现不佳在已发表的文献中被忽略了。我们的研究量化了算法性能中的性别差异,并探讨了几种偏见来源。我们发现,在用于训练算法,确定模型错误率中的性别偏见的数据集中,女性患者的人数不足,并证明了一系列补救技术无法解决存在的不平等现象。
对于处理没有固定范围的性能指标以及难以知道绩效指标何时进入不良状态的性能指标很有用。例如,今天的组织使用数百个应用程序,并且应用程序中的性能差异很大。离群值检测连续了解每个度量的正常行为,然后在公制不超出正常范围时创建事件。
在已发表的文献中,据我们所知,浮标放置问题(Tx、Rx、TxRx)从未得到直接解决。事实上,人们经常会进行简化,只考虑源和接收器。同样,也没有人研究过不同类型的传感器的异构情况,这会带来一系列问题,特别是由于不同声纳系统的性能差异以及传感器间可能存在的不兼容性(例如高频传感器和低频传感器之间)。最后但并非最不重要的是,海岸线的情况也从未得到明确解决。有关此主题的最新研究,请参阅 [3]、[4]、[5]、[6]。
1。与竞争激烈的128GB 3DS RDIMMS相比2。在记忆密集型工作负载下,DDR5旨在提供1.87倍,这是爆发长度的两倍,银行和银行集团的两倍,而速度高得多,这是由独立组织建立的,该组织为微电脑行业提供了开放标准。3。保修自最初购买日期后的3年有效。4。https://www.eetimes.eu/power-management-facilitating-the-energy-journey/5.在一系列基准测试中进行的比较与显示+/- 10%性能差异的每个解决方案。6。通过闲置和加载延迟与128GB 3DS RDIMMS所消耗的较小功率实现。
1)技术设计属性。这指的是系统设计人员和开发人员直接控制的因素,可以使用传统上应用于机器学习系统的标准评估标准进行衡量,或者将来可以以自动化方式应用。示例包括准确度和相关指标(例如,假阳性和假阴性率、精确度、召回率、F 分数),也包括可以通过将 AI 工具应用于新数据来衡量的统计误差来源(例如,测试集和保留集之间的性能差异)。最后,旨在评估系统性能的实验生成的数据也属于此类别,可能包括因果假设的测试、对抗攻击的鲁棒性评估等。
在我们的系统测试比较中,我们正在使用新的AMD Ryzen AI处理器来查看两个不同的笔记本电脑,一个是薄而光的外形尺寸,另一个具有更大的构建,其中包括离散的GPU。这种比较将使我们能够看到具有不同热设计的笔记本电脑的Ryzen AI零件的性能差异。为了显示这款新的Copilot+ PC系列所带来的世代性能改进,我们包括了基于Hawk Point的Ryzen 7 8840HS笔记本电脑和伦勃朗重新刷新的Ryzen 7 7735U笔记本电脑的结果。最后,要突出显示PC的该段与Apple MacBook系列的比较,我们从15英寸M3 Macbook Air运行最新MacOS红杉更新。
摘要 . 小丑泥鳅(Chromobotia macracanthus (Bleeker,1852))是印度尼西亚的特有物种,是国际市场上需求量很大的淡水观赏鱼之一。对野生和养殖鱼苗的高需求支持了供应的可持续性。然而,天然来源和养殖鱼苗之间的性能差异尚不完全清楚。本研究旨在分析和比较两种来源的小丑泥鳅在饲养 60 天后的性能,包括生长率、存活率和颜色质量。在本研究中,小丑泥鳅鱼苗采用再循环系统饲养。有两种处理:野生和养殖幼鱼,每种重复三次。将长度为 1.5–2 cm 的幼鱼以每升水 3 条鱼的密度放养。结果表明,野生小丑泥鳅比养殖小鱼表现出更好的生长潜力。野生小丑泥鳅的平均生长率达到 3.731±0.087%,明显高于养殖鱼的 2.020±0.082%。两组之间的存活率没有显著差异,野生小丑泥鳅的存活率为 98%,而养殖鱼的存活率为 91%。研究表明,野生小丑泥鳅的生长率、存活率和颜色质量均优于养殖鱼。关键词:小丑泥鳅,鱼苗,性能,循环水,观赏鱼。引言。小丑泥鳅是印度尼西亚加里曼丹和苏门答腊特有的一种淡水观赏鱼(Musthofa 等人 2018 年;Liyana 等人 2019 年)。这种鱼在全球市场上很受欢迎,是观赏水产养殖中最重要的品种之一。为了满足这一需求,必须利用自然资源和养殖幼鱼。尽管产卵方法和受控环境中的生殖管理已经迅速发展(Baras 等人 2012 年;Abinawanto 等人 2018 年),但来自这些来源的幼鱼之间的性能差异仍然是一个重大问题。
水。许多经济部门(例如农业,制药,制造,技术,服装,食品和饮料生产)都在很大程度上取决于淡水。9公司对其业务运营至关重要的公司可能需要证明他们使用这种稀缺的自然资源有效地有效地说明过度开发,污染或其他因素可能会导致限制水的可用性和使用的政府法规。对于具有物质依赖性水的公司,这可能会影响其提供长期财务绩效的能力。BlackRock的分析表明,与水效率低得多的公司相比,使用水有效的公司具有更高的回报,并且在经历水压力的地区的公司之间的性能差异特别明显(和比例)。10
摘要。需要清楚了解人工智能 (AI) 使用风险及其应对方法,这需要适当和充分的企业披露。我们提出了一个人工智能公平性报告的法律框架,公司可以而且应该在遵守或解释的基础上遵守该框架。我们分析了由人工智能模型的不同方面和机器学习系统性能差异引起的不公平现象的来源。我们评估了机器学习文献如何通过使用不同的公平性指标来解决不公平问题。然后,我们提出了一个细致入微且可行的人工智能公平性报告框架,包括:(1) 披露所有机器学习模型的使用情况;(2) 披露所使用的公平性指标及其随后的权衡;(3) 披露所使用的去偏见方法;(d) 发布数据集供公众检查或第三方审计。然后,我们将这个报告框架应用于两个案例研究。
摘要:像狙击手或混合模型之类的工具是生物地理血统的法医科学中最先进的方法。但是,它们尚未系统地与其他学科中广泛使用的分类器进行比较。注意到遗传数据具有表格形式,本研究通过对TABPFN进行基准分类分类器来解决这一差距,TABPFN是一种用于表格数据的尖端,通用机器学习分类器。比较使用指标(例如准确性(正确分类的比例)和ROC AUC)评估性能。我们根据已发表的培训和测试数据集研究了在全核和大陆级别的个人的分类任务。我们的结果揭示了方法之间的性能差异很大,而TABPFN始终达到了整个数据集的最高精度和ROC AUC。根据这些发现,我们建议在法医学中采用TABPFN进行人群分类。