某些形式的歧视是可见的,并且男女都能直接感知到,例如,由于“博士”头衔与男性有关,算法拒绝女性进入健身房的女储物柜。9 其他形式则是不可见的,例如,算法在完全自动化的申请程序中对简历进行排序,不会因为性别而选择女性或男性。10 其他行为不一定跨越欧盟法律规定的反歧视行为门槛,但显然在性别偏见、刻板印象 11 和性别平等政策目标方面构成问题。因此,它不仅对总体性别平等构成威胁,而且具体为未来的性别歧视铺平了道路。除了用于训练算法的数据集中包含的偏见和刻板印象 12 以及在算法的设计和编程中有意或无意地引入偏见之外,13 还有另一个可能导致性别不平等的潜在问题:自早期以来,“人工智能社区的性别构成” 14 极大地影响了算法的形成方式,从而影响了算法的工作方式,导致潜在的歧视性结果。
摘要。随着近年来网络犯罪的增加,数字取证已成为获取高质量证据的重要研究课题。法医调查人员在数据收集和分析以重建事件方面面临困难。由于人类每天的大量互动,机器学习使调查人员能够使用各种算法进行更有效、更高效的调查。机器学习是人工智能领域的一个子集。它是一门科学学科,专注于开发无需编程即可执行特定任务的计算机模型和算法,例如数据集训练和测试,以及协助调查的潜力。本文回顾了在调查过程中检查和分析数字证据的各种机器学习技术。每种机器学习算法都基于特征在数字取证的特定领域工作,它克服了复杂性、数据量、时间序列、相关性、一致性等问题。此外,本研究根据标准对机器学习算法进行了比较。
摘要 量子退火是一种计算方法,其中优化和机器学习问题被映射到受量子涨落影响的物理实现的能量景观中,允许利用这些涨落来帮助找到世界上一些最具挑战性的计算问题的解决方案。最近,由于构建了基于通量量子比特的大规模量子退火设备,该领域引起了广泛关注。这些设备已经实现了一种称为反向退火的技术,允许在本地搜索解决方案空间,并且已经测试了基于这些技术的算法。在本文中,我开发了一种量子退火器算法设计的形式化,我称之为“推理原语”形式化。这种形式化自然适合于表达结构上类似于遗传算法的算法,但退火处理器执行组合交叉/变异步骤。我演示了如何使用这些方法来理解已经实现的算法,以及这些控制与当前为提高量子退火器性能而进行的各种其他努力的兼容性。
量子计算和量子信息吸引了对从物理学到化学和工程学以及从计算机科学到数学和统计数据的科学领域的多个边界的考虑。数据科学结合了统计方法,计算算法和领域科学信息,以从大数据中提取知识和见解,并解决复杂的现实世界问题。虽然众所周知,量子计算具有革新数据科学的潜力,但关于数据科学推进量子计算的潜力的说法却少了。,由于量子物理学的随机性会导致量子计算随机计算,因此数据科学在量子计算和量子信息的开发中可以发挥重要作用。本文概述了量子计算,并促进了量子科学与数据科学之间的相互作用。总体而言,它主张开发量子数据科学来推进量子计算和量子信息。关键词:量子计算,量子信息,数据科学,统计,量子加速,量子至上。
摘要 量子计算机、相干伊辛机和数字退火机等新型计算设备的出现为硬件加速混合优化算法提供了新的机会。不幸的是,利用新型硬件平台展示无可置疑的性能提升面临着重大障碍。一个关键挑战是理解区分此类设备与现有优化方法的算法特性。通过精心设计人为的优化任务,这项工作为量子退火的计算特性提供了新的见解,并表明该模型有可能快速识别高质量解决方案的结构。与涵盖完整搜索和局部搜索的各种算法进行细致的比较表明,量子退火在所提出的优化任务上的表现是不同的。这一结果为时间尺度和优化问题类型提供了新的见解,在这些优化问题中,量子退火有可能比现有的优化算法提供显着的性能提升,并建议开发结合量子退火的最佳特性和最先进的经典方法的混合算法。
摘要。量子计算可以在未来的研究和行业中实现各种突破。与最知名的古典算法相比,已经存在一些量子算法,这些量子算法显示了理论上的速度,但这些算法的实现和执行都带来了一些挑战。例如,输入数据确定,例如,Quantum算法所需的量子数和门数。量子算法实现还取决于限制可用量子计算机集的使用的软件开发套件。由于当前量子计算机的功能有限,因此选择适当的量子计算机来执行给定输入的某些实施,这是一个困难的挑战,需要有关实施的量子算法以及有关使用的软件开发工具包的技术知识的巨大数学知识。在本文中,我们提出了一个概念,用于对量子算法的实现和适当的量子计算机的实现进行自动分析和选择,该计算机可以使用某些输入数据执行所选的实现。通过我们称为NISQ Analyzer的工具的原型实施来证明该概念的实际可行性。
摘要 — 检测分布外 (OoD) 数据是医学领域中安全且稳健地部署机器学习算法的最大挑战之一。当算法遇到偏离训练数据分布的案例时,它们通常会产生不正确且过于自信的预测。OoD 检测算法旨在通过分析数据分布和检测潜在的失败实例来提前捕获错误预测。此外,标记 OoD 案例可能有助于人类读者识别偶然发现。由于人们对 OoD 算法的兴趣日益浓厚,最近已经为不同领域建立了基准。在医学成像领域,可靠的预测通常至关重要,因此一直缺少一个开放的基准。我们推出医学分布外分析挑战赛 (MOOD) 作为医学成像领域 OoD 方法的开放、公平、公正的基准。对所提交算法的分析表明,性能与感知难度呈很强的正相关性,并且所有算法对于不同的异常都表现出很大的差异,因此很难推荐
有两种方法可以分析有关人的数据,如果您愿意的话,有两种“文化”(Breiman,2001; Snow,1959)。一个人是心理学文化 - 现在已经超过一个世纪了,完全熟悉。对于行为科学家来说,1个数据是一种结束的手段,用于改善我们关于人类思想的理论。数据可用于测试竞争理论并开发新的理论。最终,数据都是为了让我们了解理论是正确和重要的。另一种文化(将其称为机器学习文化)是新的,但迅速增长。这种文化就是要使用大量的行为数据来预测人们会做什么。这种文化所产生的算法现在在社会的范围内广泛运作,包括在社交媒体上为人们策划内容,推荐产品(书籍,电影等)。),并自动化专家决策。机器学习文化与心理文化形成鲜明对比。它是成功的算法,在不利用心理学的理论见解的情况下成功地预测行为。
摘要 - 类型2糖尿病(T2DM)是一个日益增长的全球健康问题,可显着影响患者的生活质量和寿命。早期检测T2DM对于防止或延迟其相关并发症的发作至关重要。本研究旨在评估机器学习算法的使用,以便早期检测到T2DM。使用诊断为T2DM和健康对照组的患者数据集开发了一个分类模型,并结合了特征选择技术。该模型将经过机器学习算法的训练和测试,例如逻辑回归,k-nearest邻居,决策树,随机森林和支持向量机。结果表明,随机森林算法在检测T2DM方面的准确性最高,精度为98%。这种高精度率强调了机器学习算法在早期T2DM检测中的潜力,以及将这种方法纳入临床决策过程的重要性。这项研究的结果将有助于开发T2DM的更有效的精确医学筛查过程,这可以帮助医疗保健提供者在其最早的阶段检测到该疾病,从而改善患者的结果。
为了推进基于学习的融化算法的研究,已经开发了各种合成雾数据集。但是,现有的数据集使用大气散射模型(ASM)或十个实时渲染引擎而努力产生光真实的雾图像,以准确模仿实际的成像过程。这种限制阻碍了模型从合成到真实数据的有效概括。在本文中,我们引入了旨在生成照片现实的雾图图像的端到端模拟管道。该管道全面构建了整个基于物理的雾化场景成像,与现实世界图像捕获的方法紧密相位。基于此管道,我们提出了一个名为Synfog的新合成雾数据集,该数据集具有天空和主动照明条件以及三个级别的雾气状态。实验结果表明,与其他人相比,在与其他模型中相比,与其他人相比,在synfog上训练的模型在视觉感知和检测准确性方面表现出了较高的性能。