摘要:气候模型代表热带风暴轨迹的能力对于提供有用的预测至关重要。在先前的工作中,发现北半球的热带风暴轨迹的表示已从耦合模型比较项目(CMIP)的第5阶段改善。在这里,我们通过将仅大气模拟(AMIP6)与历史库型模拟(CMIP6)进行了对比,从而研究了CMIP第6阶段模型中的剩余和持久偏差。对AMIP6和CMIP6模拟的比较表明,冬季跨北部Paci -fean的耦合模拟中海面温度(SST)的偏见改变了大气温度梯度,这与风暴轨迹的赤道偏置有关。在北大西洋中,旋风在耦合的模拟中没有足够的杆子传播,该模拟部分是由格陵兰岛南部的冷SST驱动的,从而减少了潜在的热量。在夏季,中亚和藏族高原的过度加热会降低当地的斜压性,导致更少的气旋形成并从中国东部传播到耦合和大气中的模拟物中。当规定SST时,耦合模型中描述的几种偏差大大减少。例如,北极风暴轨迹的赤道偏置显着减少。然而,在CMIP6和AMIP6中,其他偏见都显而易见(例如,夏季东亚的轨道密度密度和循环发生的持续降低)与其他过程有关(例如,土地表面温度)。
实施机器学习 (ML) 和人工智能 (AI) 算法的自动化系统为各种技术和非技术问题提供了有希望的解决方案。尽管行业领导者正在迅速将这些系统应用于从营销到国防行动等各个领域,但这些系统并非没有缺陷。最近,发现许多此类系统继承并传播了不利于少数民族的性别和种族偏见。在本文中,我们分析了 ML 和 AI 算法中的性别偏见领域的学术出版物,从而概述了通过该主题的研究探索的不同主题、缓解和检测方法。通过对 N = 120 篇论文的详细分析,我们绘制了 ML 和 AI 辅助自动化系统中存在的性别特定偏见的当前研究前景。我们进一步指出了 ML/AI 性别偏见研究中较少探索和需要更多关注的方面。我们主要关注该研究领域缺乏用户研究和包容性。我们还阐明了算法设计者所经历的性别偏见问题。总之,在本文中,我们全面介绍了在探索、检测和减轻 ML 和 AI 系统中的性别偏见领域开展的研究广度,以及未来研究的方向,以便为所有用户提供公平且可访问的 ML 和 AI 系统。
在过去的十年中,HCI的研究已经确定了数字界面中黑暗模式的许多情况。这些努力导致了一个良好的类型学,描述了有害策略用户难以宣传的策略[33]。但是,对欺骗,胁迫或操纵用户的基础机械主义的深入理解是缺失的。我们探讨了认知偏见与黑暗模式之间的相互作用,以解决这一差距。为此,我们在心理学和黑暗模式学术方面与专家(𝑁= 15)进行了四个焦点小组,询问他们如何概念化认知偏见与黑暗模式之间的关系。基于我们的恢复,我们构建了“认知偏见和黑暗模式的关系模型”,该模型说明了认知偏见和欺骗性设计模式如何相关联并确定伦理重新审议和用户保护机制的机会时刻。我们的见解通过强调道德设计决策及其在HCI领域的影响,从而有助于当前的论述。
社交媒体平台虽然有影响力的人权行动,言论自由和动员工具,但也承担了公司所有权和商业利益的影响。这个双重字符可能会导致对这些平台运营的利益冲突。这项研究集中在2021年5月在东耶路撒冷举行的Sheikh Jarrah事件,这是以色列 - 帕勒斯坦冲突中引起了全球关注的焦点。在此期间,巴勒斯坦激进主义者及其盟友观察并遇到了自动化内容审核动作的显着增加,例如阴影禁令和删除内容。我们调查了201个面临内容适度的用户,并与政治影响者进行了12次访谈,以评估这些实践对行动主义的影响。我们的分析集中在自动内容审核和透明度上,研究用户和活动家如何看待社交媒体平台使用的内容审核系统及其不透明度。的发现表明,由于不透明和混淆含量降级的技术机制,亲帕勒斯坦激进主义者的审查制度,使损害证明和缺乏补救机制变得复杂。在自动化内容审核的领域中,我们将这种困难视为算法危害的一部分。这种动态对行动主义的未来具有深远的影响,并提出了有关数字空间中权力集中化的问题。
早期发现帕金森氏病(PD)可以使早期获得护理,从而改善患者的预后。 我们研究了使用从Web应用程序记录的数据来测量结构化鼠标和按键数据的数据,通过评估手指和手动运动模式来预测PD。 我们评估了与设备类型和惯性相关的人口偏见和偏见的影响,这与我们的应用特别相关。 我们收集了251名参与者(99 PD,152个非PD)的数据。 使用随机森林模型,我们观察到了84%的F1得分,86%的灵敏度和92%的特异性。 在仅检查各组之间的F1得分差异时,没有出现明显的偏见。 然而,使用算法公平度量指标进行更深入的分析,发现了关于积极预测和错误率的偏见。 特别是,我们发现性别和种族对接受PD预测没有统计学上的显着影响。 但是,我们在接受PD诊断方面观察到有关设备类型和主导手的偏见,这是由不同的影响和均衡的赔率公平度量指标所证明的。 这项工作表明,使用台式机或笔记本电脑等消费设备的远程数字健康诊断可能会在算法公平性(例如设备类型和触手需性)中表现出非传统但很大的偏见。早期发现帕金森氏病(PD)可以使早期获得护理,从而改善患者的预后。我们研究了使用从Web应用程序记录的数据来测量结构化鼠标和按键数据的数据,通过评估手指和手动运动模式来预测PD。我们评估了与设备类型和惯性相关的人口偏见和偏见的影响,这与我们的应用特别相关。我们收集了251名参与者(99 PD,152个非PD)的数据。使用随机森林模型,我们观察到了84%的F1得分,86%的灵敏度和92%的特异性。在仅检查各组之间的F1得分差异时,没有出现明显的偏见。然而,使用算法公平度量指标进行更深入的分析,发现了关于积极预测和错误率的偏见。特别是,我们发现性别和种族对接受PD预测没有统计学上的显着影响。但是,我们在接受PD诊断方面观察到有关设备类型和主导手的偏见,这是由不同的影响和均衡的赔率公平度量指标所证明的。这项工作表明,使用台式机或笔记本电脑等消费设备的远程数字健康诊断可能会在算法公平性(例如设备类型和触手需性)中表现出非传统但很大的偏见。
抽象背景:CRISPR-CAS9辍学屏幕是用于研究以前所未有的精度和规模研究生物学的强大工具。但是,数据的偏见会导致对解释和损害总体质量的潜在混杂影响。CAS9的活性受到目标位点的结构特征的影响,包括拷贝数放大(CN偏置)。更令人担忧的是,近端靶向基因座倾向于产生与CRISPR-CAS9靶向(接近度偏差)的基因无关的反应,这可能是由于CAS9引起的整个染色体臂截断或其他基因组结构特征和不同的染色质访问性水平。结果:我们对八种计算方法进行了基准测试,严格评估了它们在迄今为止两个最大的公开可用的CRISPR-CAS9屏幕中减少CN和接近性偏置的能力。我们还通过评估处理后的数据允许准确检测真正的阳性基本基因的程度,确定的肿瘤遗传成瘾以及已知的癌症依赖性生物标志物,来评估每种方法保持数据质量和异质性的能力。我们的分析阐明了每种方法在不同情况下纠正偏见的能力。当共同处理具有可用CN信息的模型的多个模型屏幕时,AC-CHRONOS的校正CN和CORXIM偏差的其他方法都超过了其他方法,而CRISPRCHEANR是单个屏幕的最佳性能方法,或者是CN信息的最佳性能。此外,计时和AC-CHRONOS产生的最终数据集能够更好地概括已知的必需基因和非必需基因。结论:总的来说,我们的调查根据其优势,劣势和实验环境,为选择最合适的偏见方法的选择提供了指导。
人工智能系统是计算机程序,允许计算机以使其看起来具有智能的方式运行。英国数学家艾伦·图灵(1950 年)是现代计算机科学和人工智能的先驱之一 [ 4 ]。他认为计算机的智能行为有能力在认知活动中表现出人类水平的表现,后来被称为“图灵测试” [ 5 , 6 ]。图灵测试是人工智能和认知科学中最具争议的问题之一,因为有些机器可能无法通过他的测试,但它仍然可能是智能的。艾伦·图灵在他 1950 年的《心灵》文章《计算机器和智能》(图灵,1950 年)中提出了图灵测试(TT),取代了“机器能思考吗?”的问题。[ 7 ] 图灵工作的目标是提供一种机制来确定计算机是否可以思考。他的论文被视为人工智能(AI)的“起点”,而 TT 则被视为其最终目标。他进一步提出了模仿游戏,为这个想法赋予了具体形式 [8, 9, 10, 8]。
摘要:参与耦合模型比较项目(CMIP)的模型表现出北极海冰气候的巨大偏见,这似乎与季节性大气和海洋循环中的偏见有关。使用1979年至2014年的34个CMIP6模型的历史运行,我们研究了9月的气候海冰浓度(SIC)偏见与大气和海洋模型气候之间的联系。9月SIC的主要模型传播由两个领先的EOF很好地描述,共同解释了。其65%的差异。第一个EOF代表整个北极中SIC的低估或高估,而第二个EOF描述了大西洋和PACIFIC部门的SIC偏见相反。回归分析表明,这两种SIC模式与夏季期间北极表面热孔的偏离密切相关,主要是短波和长波辐射,而传入的大西洋水则在大西洋部门发挥了作用。与夏季云覆盖,低级湿度,对流层温度/循环以及海洋变量的局部和全球联系。如三种气候模型所示,在北极在模型中与SIC偏差的局部关系大多相似,但显示出不同程度的大西洋流动影响。在全球范围内,建议在9月的夏季大气循环中对三种模型之一提出了强烈的影响,而大气影响主要是通过其他两个模型的热动力学。在其中一种模型中可以看到与北大西洋循环的明确联系。
早期的压力(EL)或逆境,特别是在儿童时期忽视和虐待的形式,与成年后的精神和身体健康状况不佳有关。然而,这些关系是由EL本身的后果还是其他经常与EL同时发生共发生的暴露的后果介导的。为了解决这个问题,我们在大鼠中进行了一项纵向研究,以隔离EL对与焦虑和抑郁有关的区域脑体积和行为表型的影响。我们使用了慢性ELS的重复母体分离(RMS)模型,并在整个成年期进行了行为测量,包括概率逆转学习(PRL),对渐进率任务,蔗糖偏好,新颖性偏好,新颖性反应性,新颖的反应性以及对高架的焦虑行为进行响应。我们的行为评估与磁共振成像(MRI)相结合,以定量三个时间点的区域脑体积:立即在RMS之后,成年后不进一步压力,并且成年后期后期有进一步的压力。我们发现RMS引起了持久的,性二态的偏见,对PRL任务的负面反馈做出了反应。RMS还放慢了PRL任务的响应时间,但没有直接影响任务性能。rms动物也对第二种压力源具有独特的敏感,该压力源不成比例地损害其性能,并减慢了对PRL任务的反应。MRI显示RMS动物的杏仁核体积较大。尽管对“抑郁症状”和“焦虑症”行为的常规测试缺乏影响,但这些行为和神经生物学效应仍然持续到成年,并且缺乏任何Anhedonia的证据。我们的发现表明ELS具有长期的认知和神经行为效应,与成年后的压力相互作用,并且可能与理解人类焦虑和抑郁的病因有关。
图 1 研究框架 (a) 和所分析模拟群落的描述,包括不同物种组成和 DNA 输入、评估的标记和用于生物多样性评估的代理 (b)。所有模拟群落均使用来自圣弗朗西斯科河流域 (SFRB) 和热基蒂尼奥尼亚河流域 (JQRB) 的物种构建。 (1) 标准化圣弗朗西斯科河模拟群落 (SFmc) 包含来自 SFRB 的 23 个物种,具有相同的 DNA 浓度 (10 ng/ μ L) 和 (2) 使用不同 DNA 浓度偏斜的 SFmc。 (3) 圣弗朗西斯科和热基蒂尼奥尼亚河组合模拟群落 (SFJQmc) 使用来自标准化热基蒂尼奥尼亚河模拟群落 (JQmc) JQmc 和 SFmc 的 38 个独特物种构建。 (4) 标准化热基蒂尼奥尼亚河模拟群落 (JQmc) 由来自 JQRB 的 23 个物种组成,使用相同浓度的 DNA 构建。 (5)JQmc skewed:由来自 JQRB 的 23 个物种组成的模拟群落,采用 DNA 浓度倾斜构建。