分类是一项经过大量研究的数据驱动的机器学习任务,驱动了许多涉及诸如贷款批准和刑事风险评估等关键决策的预测系统。但是,分类器经常表现出歧视性行为,尤其是在呈现有偏见的数据时。因此,分类中的公平性已经成为一个高优先研究领域。数据管理研究表明,对与数据和算法公平性有关的主题(包括公平分类的话题)的存在和兴趣越来越大。公平分类中的跨学科工作,机器学习研究具有最大的存在,导致了许多公平的概念和广泛的方法,这些方法尚未系统地评估和比较。在本文中,我们对13种公平分类方法和其他变体进行了广泛的分析,以使用各种指标和现实世界数据集对基本ML模型,数据效率和稳定性的敏感性,对基本ML模型的敏感性,对数据误差的敏感性,对数据误差的敏感性,对数据误差的敏感性,对数据误差的敏感性进行广泛分析。我们的分析强调了有关不同指标和高级方法特征对性能不同方面的影响的新颖见解。我们还讨论了选择适合不同实际环境的方法的一般原则,并确定以数据管理解决方案可能产生最大影响的领域。
•计算边界的变化 - 组织的结构性变化 - 新公司,合并和公司清算的包含。••在RafineriaGdańska和Grupa Lotos S.A.的随附的排放量中,与出售RafineriaGdańska的30%股份有关 - 承认70%的公司排放(根据RafineriaGdańska的首都的股份),以及有关Rafineriagdańska的股份),以及该案例的关系。 Gdańsk的炼油厂。 •检测计算错误 - 数据误差,报告单位的错误,计算错误。 •关于纳入排放贸易系统覆盖的排放以及价值转换为单个温室气体的方法的方法。•在RafineriaGdańska和Grupa Lotos S.A.的随附的排放量中,与出售RafineriaGdańska的30%股份有关 - 承认70%的公司排放(根据RafineriaGdańska的首都的股份),以及有关Rafineriagdańska的股份),以及该案例的关系。 Gdańsk的炼油厂。•检测计算错误 - 数据误差,报告单位的错误,计算错误。•关于纳入排放贸易系统覆盖的排放以及价值转换为单个温室气体的方法的方法。
对于每个数据点,计算表面的高斯曲率和平均曲率。针对数学生成的标准 3D 对象和从光学表面扫描仪获得的 3D 数据,评估了三种计算这些曲率的算法的性能。利用这些曲率的符号,将面分为八种“基本表面类型” - 每种类型都有直观的感知意义。确定所得表面类型描述对数据误差的鲁棒性及其可重复性。
携带电流或信号。此干扰可能会导致通过电缆传输的电信号被诱导或耦合到相邻的电缆中,这可能会导致对原始信号的扭曲并影响系统性能。串扰可能发生在电气接线系统中,例如网络电缆,电源电缆和信号电缆,尤其是当它们并行运行或太近时。由于电场和磁场相互影响的能力,可能会产生电磁干扰,尤其是当电缆未正确屏蔽或绝缘时。串扰的效果可以包括发射信号质量的降低,通信系统中的数据误差,电力传输系统中的功率损失,甚至敏感电子设备的故障。
自闭症谱系障碍 (ASD) 是一种异质性神经发育障碍,其特征是沟通障碍和社交互动有限。目前的临床方法完全基于对症状的行为观察,对自闭症背后的神经机制了解甚少,因此有必要确定新的生物标记,以帮助研究大脑的发育和功能,并可以准确和早期地检测出自闭症。在本文中,我们开发了一种名为 ASD-SAENet 的深度学习模型,用于使用 fMRI 数据将自闭症患者与典型的对照受试者进行分类。我们设计并实施了一个稀疏自动编码器 (SAE),以优化可用于分类的特征提取。然后将这些特征输入到深度神经网络 (DNN) 中,从而对更容易患自闭症的 fMRI 脑部扫描进行更好的分类。我们提出的模型经过训练,可以优化分类器,同时根据重建数据误差和分类器误差改进提取的特征。我们使用从 17 个不同研究中心收集的公开的自闭症脑成像数据交换 (ABIDE) 数据集评估了我们提出的深度学习模型,该数据集包括 1,035 多名受试者。我们广泛的实验表明,与其他方法相比,ASD-SAENet 对整个数据集表现出相当的准确度 (70.8%) 和更高的特异性 (79.1%)。此外,我们的实验在 17 个成像中心中的 12 个中心表现出比其他最先进的方法更好的结果,在不同的数据采集站点和协议中表现出更高的通用性。实施的代码可在我们实验室的 GitHub 门户上找到:https://github.com/pcdslab/ASD-SAENet。