❚❤✐S♣♣❛❛✐❛✐ t❤❡❡❝♦♥♦♠✐❝ ♦❢S♦♥T❡R❛❝T✐♦♥♥S✳❙❡❝♦♥❞✱✐T❡①❛♠✐♥♥t❤❡❝♦♥❞✐T✐♦♥S❢♦R♥❣♥❣♥ ❡✣❝✐❡♥❝②❛♥❞❡q✉✐t②✐♥s✉❝❤❛❜r♦❛❞✏S♦♦♦♥♦♥♦♠②♠♦♥❞❝♥♠♦取批次♦♠ ❡✣❝✐❡♥聚♥♥t❤❡st❛♥❞❛♥♥♥❡R❛❧❡Q✉✐❧✐❜R✐✉Q✉✐❧✐❜r✐✉♠♠♦♦♦♦♥T❤❡❡❝♦♥♥♦♥♦♥♠■ s♦♠♦❢T❤❡♠♦StS✐❣♥✐✜❝❛♥T♦ST♦♠♠R❣❡❞❢R❣❡❞❢R♦♠T❤❡❞✐S❝✐S❝✐S❝✐♥❧✐♥❡♦♦♥♦♥♦♥♦?♥wimsst ❢✉♥❞❛♥T❛❧T❤❡♦r❡♠S♦♦♥♦♥♦♠✐❝S✮✱S✮✱T❤❡R♦❧❡♦❢♦❢❛❛♥✐♥❝♦♦♦♦r❞✐♥♥❛♥❛♥♥♥♦♥♦♥♦♥♦♠♠t✐✈✐t✐✈✐t✐✈✐t✐✈✐t✐✈✐t✐✈✐t✐✈✐t✐✈✐t✐✈✐t✐✈✐t✐✈✐ t❤❡r❡❧❛t✐♦♥❜❡♥♥❡✣❝✐❡♥❝②❛♥❞❡×t②✱t❤❡✇❡❧❢❛r❡❡✛❡❝ts♦❢♣R♦✜T✲T✲♠❛①✐♠♠♦♥♥❛♥❛♥❞♥❞♥T❡R❡Str❡st❡T❡t❡t❡t❡t❡t❡t❡t❡t✐❧✐t✐❧✐t✐❧✐t✐❧✐t✐❧✐t✐❧✐t✐❧✐t✐❧✐t✐❧✐t✐❧✐t✐❧✐t✐❧✐t✐❧✐t✐❧✐t✐❧✐t✐❧✐t✐❧✐t✐❧✐t✐❧✐T✐❧✐T✐❧✐T✐❧✐T✐❧✐T✐❧✐T✐❧✐T✐❧✐T✐❧✐T✐❧✐T✐❧✐T✐❧✐T✐❧✐T✐❧✐T✐❧✐② ♦❢r❡❞✐str✐❜✉t✐♦♥✱T❤❡S♦✉R❝❡S♦❢♠❛r❦❡t❞✐S❝S❝S❝S❝S❝S❝S❝M✐♥❛♦♥♥✱❛♥❞♥❞♥❞T❤❡❡①♦♦✐T❛t❛t❛t❛t❛♦♥♥♦♥♦❢ ❢R♦♠Tr❛❞❡✳❚❤❡S❡✐S❡✐S❡✐S❡✐S❡✐T✐♦♥S❝♦♥ST✐T✉T❡❛T❡❛♥✐♥✐♥RT❛♥T♥T♠♦T✐✈❛T✐♦♥♥R♦R♦R♦r♦r♦✉RS♦✉
©作者2024。Open Access本文是根据Creative Commons Attribution 4.0 International许可获得许可的,该许可允许以任何媒介或格式使用,共享,适应,分发和复制,只要您对原始作者和来源提供适当的信誉,请提供与创意共享许可证的链接,并指出是否进行了更改。本文中的图像或其他第三方材料包含在文章的创意共享许可中,除非在信用额度中另有说明。如果本文的创意共享许可中未包含材料,并且您的预期用途不受法定法规的允许或超过允许的用途,则您需要直接从版权所有者那里获得许可。要查看此许可证的副本,请访问http:// creativecommons.org/licenses/4.0/。
微生物组研究是生命科学中增长的数据驱动的领域。存在共享微生物组序列数据并使用标准化元数据方案的策略,但研究人员之间的依从性各不相同。为了促进微生物组研究界的开放研究数据最佳实践,我们(1)提出了两个分层的徽章系统来评估数据/元数据共享依从性,(2)展示了一种自动化评估工具,以确定与Amplicon和Metagenome序列数据出版物中数据报告的依从性。在跨越人类肠道微生物组研究的出版物(n〜3000)的系统评估中,我们发现近一半的出版物不符合序列数据可用性的最低标准。此外,元数据的标准化差为统一和跨研究比较创造了很高的障碍。使用此徽章系统和评估工具,我们的概念验证工作暴露了(i)序列数据可用性语句的无效性,以及(ii)缺乏用于注释微生物数据的一致的元数据标准。从这个角度来看,我们强调了改进实践和基础设施的需求,以减少数据提交的障碍并最大程度地提高微生物组研究中的可重复性。我们预计我们的分层徽章框架将促进有关数据共享实践的对话,并促进微生物组的数据再利用,支持使微生物组数据公平的最佳实践。
公平,多样性和包容性(EDI)差距一直存在于科学,技术,工程和数学(STEM)领域,如歧视,刻板印象和不平等现象所表明的那样,历史上和持久边缘化群体面临的不平等现象。认识到这一差距,导致一个跨学科团队开发了基础电子学习模块,标题为“具有包容性和尊重的互动(FIRE)的基金会,以在不列颠哥伦比亚大学的Okananagan校园内在STEM本科课程中交付的EDI能力。火由通过学习管理系统Canvas提供的在线,异步,自学模块组成。试点测试的反馈消防模块表明STEM学生发现这些模块是相关和有益的。在整个火灾的开发过程中,我们了解了将课程与机构价值观保持一致的重要性,在跨学科团队中工作并进行迭代修改。消防模块的开发和初步可行性的文档旨在帮助正在开发自己的EDI教学材料的其他机构或组织。
在数据密集型科学中,电子基础结构和软件工具链被大量用于帮助科学家管理,分析和共享越来越多的复杂数据[1]。数据处理任务(例如数据清理,归一化和知识提取)需要逐步自动化,以促进性能,标准化和可重复使用。越来越复杂的数据计算和参数驱动的模拟需要可靠的E基础结构和一致的报告,以实现对替代设置的系统比较[2,3]。作为对这些需求的响应,使用工作流执行计算过程的实践已在不同领域(例如生命科学[4,5,6],生物多样性[7],天文学[8],Geosciences [9]和社会科学[10] [10]。工作流程还支持采用新颖的计算方法,尤其是机器学习方法[11],因为可以交换或更新处理管道中的单个组件。
hal是一个多学科的开放访问档案,用于存款和传播科学研究文件,无论它们是否已发表。这些文件可能来自法国或国外的教学和研究机构,也可能来自公共或私人研究中心。
统计歧视(例如,参见Baldus和Cole,1980年):根据群体级统计平均值而不是其个体特征,对个人进行了不同的对待。它们不是源于偏见或偏见,而是由于依赖不完美信息并将小组成员身份作为单个特征的代理而产生的。某些形式的歧视被认为是不可接受的(Hellman,2008)。Fisher(1936):根据测量特征将观测值分开或分类为不同的组。在这种情况下,歧视纯粹是一个统计操作,没有社会偏见或不平等的含义。但是,统计歧视可能导致:
算法在我们的私人和公共生活中扮演着许多重要角色。他们产生搜索引擎结果,在社交媒体上组织新闻源,并确定有希望的浪漫伴侣。他们为司法,贷款,社会福利和大学录取决定提供了信息。他们还提出了紧迫和烦恼的道德挑战。例如,美国刑事司法系统中使用的一些算法预测个人是否会累进。著名的是,已经发现这种算法表现出明显的种族和性别偏见,例如将黑人非累犯者评级为比白人非养育者更喜欢重新审判(Angwin等人(Angwin等),2016a,b)。在某种程度上对这种发现的反应中,算法公平的研究在计算机科学,哲学和其他领域中扮演着重要的作用。从这些研究中得出的理论上有趣且在道德上显着发现的是,实施明智的公平概念可以兑现,以付出代价(Corbett-Davies et al。,2017年; Menon和Williamson,2018年; Kearns and Roth,2019年)。
机器学习技术越来越多地用于高风险决策,例如大学录取,贷款归因或累犯预测。因此,至关重要的是,确保人类用户可以审核或理解所学的模型,不要创建或再现歧视或偏见,并且不会泄露有关其培训数据的敏感信息。的确,可解释性,公平性和隐私是负责任的机器学习开发的关键要求,在过去的十年中,这三者进行了广泛的研究。但是,它们主要被孤立地考虑,而在实践中,它们相互相互作用,无论是积极还是负面的。在本次调查文件中,我们回顾了有关这三个Desiderata之间相互作用的文献。更确切地说,对于每种成对相互作用,我们总结了认同的协同作用和紧张局势。这些发现突出了几种基本的理论和经验性冲突,同时还指出,当一个人旨在保留高水平时,共同考虑这些不同的要求是具有挑战性的。为了解决这个问题,我们还讨论了可能的调解机制,表明仔细的设计可以成功处理实践中这些不同的问题。