摘要 - 我们考虑了一个仓库,其中数十个移动机器人和人类采摘者共同努力收集和运送仓库中的物品。我们解决的基本问题(称为采摘订单问题)是这些工人代理必须如何协调其在仓库中的动作和行动,以最大程度地提高此任务的性能。使用启发式方法建立的行业方法需要大量的工程工作,以优化天生的仓库配置。相比之下,可以灵活地应用多代理增强学习(MARL)大小,布局,工人的数量/类型,项目补充频率)和不同类型的采摘订单范式(例如,商品对人和人的物品),因为代理商可以学习如何通过经验来最佳合作。我们开发了层次的MARL算法,在该算法中,经理代理商将目标分配给工人,经理和工人的政策是为了最大程度地提高全球目标(例如,选择率)。我们的层次结构算法在基线MARL算法上取得了显着提高,并且在多种仓库配置和不同的订单挑选范式中,多个已建立的行业启发式方法的总体选择率和整体选择率在多个已建立的行业启发式方面实现了显着提高。
b) 确保行星科学技术项目、目标、计划、资金水平、征集方法(包括选择率和选择结果),以及项目的运作方式、参与者、科学界和支持组织如何发挥作用等内容在 NASA 内部和外部透明地共享。
对于截至2021年12月31日的合并计划中的成员,该计划将继续可用,它将像今天一样起作用。合并计划成员将继续管理其职业生涯的会员捐款的投资。该计划将提供相同的残疾,幸存者和死亡福利。离开被OPERS覆盖的就业机会后,合并的计划成员仍然可以全额退还其帐户价值或获得终身退休福利。如果OPERS在财务上能够向退休人员提供医疗保健资金,则合并计划成员将在退休时符合资格要求,将获得这些资金。为什么Opers会进行此更改?定期,Opers评估了所有三个Opers退休计划的计划设计和选择率。在2003年建立合并和成员指导的计划时,研究表明,大约30%的新员工将选择合并计划。但是,自成立以来,合并计划的计划选择率只有8%。
图1。左:十个不同模型如何表现出相同的准确性的例证,同时在假设的十个人中给出不同的个人预测。右:两个多胶模型的示例:它们表现出相等的精度(所有人比80%),但进行不同的个人预测,从而导致歧视性行为的差异。左侧的图形在男女之间的选择率差异很大,而右图则没有。该图的较暗区域是指模型预测个人值得信誉的地方,而黑暗点对应于那些确实是信誉良好的人。该图的较轻区域是指模型预测个人不可信守的区域,而较轻的点对应于那些确实是不可信任的个体。三角形点是指女性,正方形指的是男人。
很多人也从公司的角度看待这个问题。每年每个雇主都会收到很多职位申请。在所谓的正常年份,这些申请者中只有很少一部分被录用。以我熟悉的一家公司为例,波士顿联合煤气公司在战前平均有大约 20,000 份职位申请。在这 20,000 份申请中,他们通常会录用大约 400 人。这就得到了统计学家所说的 2% 的选择率。这对 19,600 名未被录用的人意味着什么?为空缺职位找到最优秀的人才对公司意味着什么?具体来说,我们可以指出,如果 19,600 名被拒绝的申请者被拒之门外,他们觉得自己受到了不公平的对待,受到了歧视,只有老板的朋友被录用,这可能会给任何企业带来非常严重的公关问题。同样,如果 400 名员工能够顺利、高效地适应新工作,那么雇主将获得巨大的经济利益,这是显而易见的。这意味着员工队伍能够顺利运作,员工不会有怨言和问题,并且在其他各方面对公司都有好处。
为了确保算法决策系统的公平性,例如就业主持工具,计算机科学家和从业人员通常将所谓的“四分之一五分之一规则”提及,以衡量工具遵守反歧视法。这种依赖是有问题的,因为“规则”实际上不是歧视歧视的法律规则,并且提供了一种粗略的测试,通常在确定需要进一步审查的实践方面过于忽略和不包括。“四分之一的规则”是一类更广泛的统计检验之一,我们称之为统计奇偶校验测试(SPTS),比较了人口统计组之间的选择率。虽然某些SPT在统计学上更稳定,但所有人都在回顾性地具有不同的不同影响方面具有一些关键局限性。当这些测试被预期用作优化目标塑造模型开发时,就会出现对开发过程,行为激励措施和配盖性的其他担忧。在本文中,我们讨论了SPT在算法治理中的适当作用。我们建议采用多种措施,以利用预期优化过程中存在的其他信息,从而在建立和审计模型时更深入地了解公平考虑因素。
简介西点军校陆军网络学院 (ACI) 与北约合作网络防御卓越中心 (NATO CCD COE) 合作举办 2017 年美国网络冲突国际会议 (CyCon US)。CyCon US 以“网络冲突的未来”为主题,旨在为新想法、相关且可操作的内容、未来趋势洞察以及接触行业、政府和军事领导人、网络创新者和该学科先驱提供一个平台。此次会议旨在促进多学科网络计划,并进一步推动对网络威胁和机遇的研究与合作。网络空间已成为第五个冲突领域,渗透到陆、海、空、天四个领域。网络空间极大地影响着盟友、对手、竞争对手和行业之间的机遇、挑衅和威胁。网络重新定义了我们社会中的社会规范行为,并挑战了当前的冲突范式。网络空间无处不在,再加上量子计算、机器学习、大数据和机器人等新兴技术和科学突破,极大地扩展了战场,甚至重新定义了战争与和平的概念。CyCon US 将从技术、法律、道德、政治、军事和经济立场和研究等方面探索网络冲突的未来。以下 CyCon US 论文审查委员会从提交的 58 篇论文中选出了 15 篇论文在会议上发表(选择率为 26%)。这些论文分为以下五个主题:任务保证、网络政策、国际网络问题、新兴技术和网络行动。我们要感谢作者的深刻贡献,以及论文审查委员会成员志愿审查和评估提交论文的质量。
随着世界航空系统的扩展,对新民用飞行员的需求不断增长。美国的主线和区域航空公司每年需要约1,900至4,500名新飞行员(美国政府问责局,2014年)。选择新飞行员是对运营商的关键人力资源管理挑战。我们审查了相对于一组七种最佳实践的平民试点选拔程序:1)进行工作分析; 2)定义可衡量的可观察的工作绩效指标; 3)识别和使用可靠且有效的预测因子; 4)进行适当的验证研究; 5)根据预测的工作绩效确定测试中的裁切得分(通过/失败); 6)评估测试和切得分的公平性; 7)记录分析。,我们根据公开信息审查了15个美国和多个外国航空公司的试点测试电池和选择过程。总体而言,遵守相关法律和专业指南,标准,原则和实践的最佳实践是不一致的。相对较少的测试电池基于最近或当前的工作分析。有证据表明测试电池具有心理测量可靠性和有用的有效性。但是,没有证据表明试点选择中使用的访谈的可靠性或有效性。主要的工作绩效标准是成功或培训失败。在测试电池上,人群组的比较选择率(通过)没有数据。在欧洲,有关试点测试电池的技术报告和文档比美国更好总的来说,我们同意国际航空运输协会(IATA)在2012年的结论中,在全球范围内和美国的试点选择计划似乎没有强大的科学基础。我们提出了两项建议,以改善平民飞行员选择的最新建议。
尽管机器学习算法对个性化医学有希望,但其临床采用仍然有限。导致这种限制的一个关键因素是样本选择偏见(SSB),它是指研究人群不太代表目标人群,从而导致偏见且潜在的有害决定。尽管在文献中众所周知,但SSB在医疗保健机器学习中几乎没有研究。此外,现有技术试图通过平衡研究和目标人群之间的分布来纠正偏见,这可能导致预测性能的丧失。为了解决这些问题,我们的研究通过检查SSB对机器学习算法的性能的影响来说明与SSB相关的潜在风险。最重要的是,我们根据目标人群识别而不是偏见校正提出了一个新的研究方向,以解决SSB。具体而言,我们提出了两个用于解决SSB的独立网络(T-NET)和一个多任务网络(MT-NET),其中一个网络/任务标识了代表研究人群的目标亚群,第二个网络/任务对已识别的亚种群进行了预测。与研究人群相比,SSB可以通过合成和半合成数据集的突出显示,SSB可以导致目标人群的算法的性能大幅下降,并且目标亚群的绩效差异很大,而目标亚群的绩效差异很大,而该目标亚群体代表了所选的患者和研究人群的非秘密患者。此外,我们提出的技术证明了各种环境的鲁棒性,包括不同的数据集大小,事件速率和选择率,表现优于现有的偏见校正技术。
新加坡:超过340名年轻科学家1将在全球年轻科学家峰会(GYSS)2025年与来自世界各地的科学和技术领域的领先专家互动。峰会吸引了来自49个国家 /地区的参与者,比2024年2增长了40%,标志着过去五年的最高数量,反映了Gyss的全球知名度的提高。2于2025年1月6日至10日在新加坡国立大学(NUS)举行,峰会一直是新加坡的参与者选择率最高,自2024年以来,新加坡的100名参与者占100名,占欧洲的22%,来自欧洲的22%,亚洲的17%。峰会于今天在新加坡国家研究基金会副总理兼董事长Heng Swee Keat先生(NRF)的开幕式上启动。加深对NRF组织的年轻科学家3的参与,Gyss 2025将为年轻科学家提供更多机会展示他们的作品并与已建立的科学家,工程师和技术企业家互动。其中包括18位著名科学家,包括诺贝尔奖获得者,田野奖牌获得者,图灵奖获得者以及其他国际科学奖的获奖者。4峰会的主要亮点之一是小组会议,现在称为炉边聊天。这些会议使年轻的科学家可以在亲密的环境中与顶级思想互动,通常与大约25名参与者互动。今年,首脑会议将举办26次会议,比2024年的20次会议增加,其中包括四个双扬声器炉边聊天。5参与者将有机会与16位年轻科学家演讲者和两个专门的海报会议一起参加年轻科学家的Quickfire宣传会议,共有100个海报,他们可以在其中介绍他们的研究以尊重受尊敬的科学家和研究人员。峰会经验的一部分还包括访问当地大学和研究机构,为参与者提供了对新加坡开发的研究和技术的亲眼目睹。