允许将本工作的全部或一部分用于个人或课堂使用的数字或硬副本允许,而没有费用,只要副本不是用于Proft或Commercial Advantage的副本,并且副本均带有此通知和FRST页面上的完整引用。必须尊重他人所拥有的这项作品的组成部分的版权。允许用信用摘要。否则复制或重新发布以在服务器上发布或重新分配到列表,需要事先指定许可和/或费用。请求权限从permissions@acm.org。CHI '24,5月11日至16日,2024年,美国HI,HI,HI©2024由所有者/作者持有的版权。 出版权许可获得ACM的权利。 图像已深入地融入我们的生活中。 是否ACM ISBN 979-8-4007-0330-0/24/05 https://doi.org/10.1145/3613904.3642129通过绘画,摄影或数字技术,创建CHI '24,5月11日至16日,2024年,美国HI,HI,HI©2024由所有者/作者持有的版权。出版权许可获得ACM的权利。图像已深入地融入我们的生活中。是否ACM ISBN 979-8-4007-0330-0/24/05 https://doi.org/10.1145/3613904.3642129通过绘画,摄影或数字技术,创建
面部表达识别(FER)在计算机视觉应用中起着关键作用,包括视频不存在和人类计算机的相互作用。尽管FER的进展没有局部进步,但在处理在现实世界情景和数据集中遇到的低分辨率面部图像时,性能仍然会摇摆不定。一致性约束技术引起了人们的关注,以产生强大的卷积神经网络模型,从而通过增强来适应变化,但它们的功效在低分辨率FER的领域中得到了影响。这种性能下降可以归因于网络难以提取表达特征的增强样本。在本文中,我们确定了在考虑各种程度的分辨率时引起过度拟合问题的硬样品,并提出了新颖的硬样品感知一致性(HSAC)损失函数,其中包括组合注意力同意和标签分布学习。通过结合高分辨率和翻转低分辨率图像的激活图,将注意力图与适当的目标注意图与适当的目标注意图与适当的目标注意力图相结合的注意图与适当的目标注意力图的注意力图对齐。我们通过结合原始目标和高分辨率输入的预测来测量低分辨率面部图像的分类难度,并适应标签分布学习。我们的HSAC通过有效管理硬样品来赋予网络能够实现概括。各种FER数据集上的广泛实验证明了我们提出的方法比现有方法的多尺度低分辨率图像的优越性。此外,我们在原始RAF-DB数据集中达到了90.97%的最新性能。
尽管磁共振成像(MRI)对脑肿瘤分割和发现非常有帮助,但它在临床实践中缺乏某些方式。作为一种态度,预测绩效的退化是不可避免的。根据当前的实现,在模态特征的训练过程中,不同的模式被认为是独立的,彼此之间是独立的,但是它们是互补的。在本文中,考虑到不同方式对各种肿瘤区域的敏感性,我们提出了一种意识到类别的G组大量学习框架(称为GSS),以弥补本性模态模态提取阶段的信息。确切地说,在每个预测类别中,所有模态的预测构成了一个组,其中选择了最出色的灵敏度的预测作为组领导者。小组领导者与成员之间的合作努力以高的一致性和确定性为基础。作为我们的次要贡献,我们引入了一个随机面具,以减少可能的偏见。GSS采用标准培训策略而无需具体的建筑选择,因此可以轻松地插入现有的全模式内脑肿瘤分段中。在BRATS2020,BRATS2018和BRATS2015数据集上进行了明显的,广泛的实验表明,GSS可以平均证明现有的SOTA算法的性能平均为1.27-3.20%。该代码在https://github.com/qysgithubopen/gss上发布。
视觉语言(VL)模型已获得了显着的重点,从而在多模式推理方面取得了显着进步。这些体系结构通常包括视觉编码器,大型语言模型(LLM)和一个将视觉特征与LLM的代表空间保持一致的投影模块。尽管他们成功了,但仍然存在一个关键的限制:愿景编码过程仍然与用户查询相关,通常是以与图像相关的问题的形式。因此,所得的视觉特征可能无法最佳地调整图像的特定元素。为了解决这个问题,我们介绍了QA-Vit,这是一种问题的多模式原因,这是一种问题,将问题意识直接嵌入到视觉编码器中。此集成导致动态视觉特征,重点是提出问题的相关图像方面。QA-VIT是模型 - 静态的,并且可以有效地将其置于任何VL体系结构中。广泛的经验证明了将我们的方法应用于各种多模式体系结构的有效性,从而导致跨不同任务的一致改进,并展示了其以增强视觉和场景文本理解的能力。
摘要 - 机器学习在决策过程中的广泛采用引起了人们对公平性的担忧,尤其是对敏感特征和对少数群体的潜在歧视的治疗。软件工程社区的反应是开发面向公平的指标,经验研究和方法。但是,在整个机器学习生命周期中,理解和分类工程公平的做法仍然存在差距。本文介绍了一种新颖的实践目录,以解决从系统的映射研究中得出的机器学习中的公平性。该研究确定并分类了现有文献中的28种实践,将它们映射到机器学习生命周期的不同阶段。从该目录中,作者提取了可操作的项目及其对软件工程研究人员和从业者的影响。这项工作旨在提供全面的资源,以将公平考虑因素整合到机器学习系统的开发和部署,增强其可靠性,问责制和信誉。
● AI4SIDS:面向小岛屿发展中国家的人工智能驱动气候适应平台。团队负责人:Letetia Addison,特立尼达和多巴哥(获奖) ● Chameleon AI:人工智能驱动的平台,旨在改变马拉维小农户的灌溉方式。团队负责人:Alinafe Kaliwo,马拉维。● 气候智能灌溉器:智能水-食物-能源食物关系效率灌溉。团队负责人:Edmond Ng'walago,坦桑尼亚。● ACBA Energy 的 EmTrack:用于排放跟踪和碳排放量化的人工智能应用。团队负责人:Nair de Sousa,安哥拉。● RAICE:尼泊尔可持续水稻种植的人工智能驱动精准灌溉。团队负责人:Asbina Baral,尼泊尔。
我们介绍C ONTITION- WARE神经N ETWORK(CAN),这是一种将控制添加到图像生成模式中的新方法。与先前的条件控制方法并行,可以通过动态降低神经网络的重量来控制图像生成过程。这是通过引入条件感知的重量产生模式来实现的,该模块会根据输入条件为卷积/线性层生成条件重量。我们测试可以在Coco上的ImageNet和文本对图像生成上生成类别图像的生成。可以始终如一地为包括DIT和UVIT在内的扩散变压器模型提供显着改进。特别是,Ca n与有效的T(CAT)结合在Imagenet 512×512上达到2.78 FID,超过DIT-XL/2,同时每个采样步骤需要少52×MAC。
通过佛蒙特州地区代理商进行的“车轮上的进餐”计划,包括较老的和残疾的佛蒙特州,包括通过全球承诺投资来降低额外匹配的资金的选择。联邦营养计划被称为Snap-供应营养援助计划,称为佛蒙特州的3squaresvt(曾经称为“食品券”)。它旨在帮助低收入人购买他们所需的杂货以防止饥饿。3Squaresvt计划由人类服务机构内的儿童和家庭经济服务部门管理。我们听说过许多3squaresvt参与者将其称为生命线,在许多情况下,他们能够负担杂货的唯一原因。作为一个由一个非常充满爱心和勤奋的单身父亲抚养长大的人,抚养双胞胎女儿,我知道我父亲收到的快照是我们的整个每月杂货预算。我要亲身了解,快速的力量可以帮助家人度过,赶上,同时仍然经历了滋养共享的餐点的喜悦。我不会在没有快照的情况下成为我今天的位置。3squaresvt的资格由联邦政府和佛蒙特州决定。在佛蒙特州,收入或低于联邦贫困水平的185%的人和家庭可以有资格 - 对于一个四口之家,这意味着每月收入不超过$ 4,810,或每年的年收入约为57,000美元。那只是我们的一半