- 从不同传感器领域(光学摄像机、激光雷达、声纳、多波束、事件摄像机、高光谱传感)的低质量和/或稀缺数据中进行稳健识别。- 在高度动态环境或长期部署机器人系统中进行稳健识别。- 图像/视频恢复和增强,以消除由于低照度、色彩失真、恶劣天气、能见度差而导致的退化。- 新型传感器开发或传感器融合和校准技术,实现稳健的视觉感知。- 模拟环境和持续系统集成,即合成数据生成、模拟到现实世界的转换、硬件在环。- 视觉系统的低质量和稀缺数据挖掘、增强和处理方法。- 上述任何主题中的深度学习实践和机器学习管道。- 经过现场试验和部署及数据管理最佳实践的大量测试系统。- 对抗性和挑战性环境下计算机视觉算法和应用调查。- 上述任何一项在基于视觉的定位、配准、映射、建模、姿势估计和其他领域的应用。
图表目录 图 1-1 Reason 的人为错误瑞士奶酪模型 .............................................................. 13 图 1-2: 重复检查的瑞士奶酪模型 .............................................................................. 14 图 2-1:波音 737 价值流 .............................................................................................. 19 图 3-1:不同检查之间的飞机区域映射示例 ......................................................24 图 3-2:随时间推移的摇晃检查细分 ...................................................................... 26 图 3-3:随时间推移的适航性检查细分 ............................................................. 31 图 3-4:返工文档库存和流程图 ............................................................................. 32 图 3-5:摇晃检查库存和流程图 ............................................................................. 33 图 3-6:适航性和中间检查库存和流程图。 33 图 4-1:记录返工的简化反馈回路....................................................................... 37 图 4-2:高质量与低质量数据示例.............................................................................. 39 图 4-3:记录返工的理想时间图表(由图表面积表示)......................................................................................................................... 39 图 4-4:返工记录时间约束 - 100% 记录,低质量.........................................................................................
摘要 — 我们分析了自然语言处理和计算机视觉机器学习中使用的数据集大小的增长,并使用两种方法进行推断;使用历史增长率和估算未来预测计算预算的计算最佳数据集大小。我们通过估算未来几十年互联网上可用的未标记数据的总存量来研究数据使用量的增长。我们的分析表明,高质量语言数据将很快耗尽;可能在 2026 年之前。相比之下,低质量语言数据和图像数据的存量要晚得多才会耗尽;2030 年至 2050 年之间(低质量语言)和 2030 年至 2060 年之间(图像)。我们的研究表明,如果数据效率没有大幅提高或没有新的数据源可用,依赖海量数据集的 ML 模型不断增长的当前趋势可能会放缓。
摘要。对肿瘤分割模型的一个关键挑战是适应各种临床环境的能力,尤其是在应用于质量差的神经数据时。围绕这种适应性的不确定性源于缺乏代表性数据集,使最佳模型在整个撒哈拉以南非洲(SSA)中发现的MRI数据中发现的不符合外表的模型没有展示的模型。我们复制了一个框架,该框架确保了2022个小子中的第二位置,以调查数据集组成对Mod-el绩效的影响,并通过使用以下方式培训模型来追求四种不同的方法:仅Brats-Africa Data(Train_ssa,N = 60),N = 60),2)Brats-Adult Glioma DATATS(2)BRATS-ADULT GLIOMA DATATS(TRAIT_ DATAT)(Train_gli,N = 1251) n = 1311)和4)通过进一步培训使用BRATS-AFRICA数据(Train_FTSSA)的Train_GLI模型。值得注意的是,仅在较小的低质量数据集(Train_SSA)上进行培训就产生了低于标准的结果,并且仅在较大的高质量数据集(Train_Gli)上训练,在低质量验证集中努力努力划定Odematous Tissue。最有希望的AP-PRACH(TRAIN_FTSSA)涉及预先培训高质量神经图像的模型,然后在较小的低质量数据集中进行微调。这种方法超过了其他方法,在Miccai Brats非洲全球挑战外部测试阶段排名第二。这些发现强调了较大的样品大小的重要性,并在改善分割性能中广泛接触了数据。此外,我们证明了通过在本地使用更广泛的数据范围对这些模型进行微调来改善此类模型的潜力。
摘要 — 空间系统的网络安全是一个新兴话题,但是没有单个数据集记录过去发生的针对空间系统的网络攻击。这些事件通常散布在媒体报道中,同时缺少许多细节,我们称之为缺失数据问题。然而,即使是包含此类报告的“低质量”数据集也将极具价值,因为空间网络安全数据匮乏,而且空间系统的敏感性通常受政府限制披露。这引发了一个研究问题:我们如何描述现实世界中针对空间系统的网络攻击?在本文中,我们通过提出一个包括指标的框架来解决这个问题,同时还通过以原则性方式“推断”缺失数据来解决缺失数据问题。为了展示该框架的实用性,我们提取了 72 起针对空间系统的网络攻击的数据,并展示了如何推断这个“低质量”数据集以得出 4,076 条攻击技术杀伤链。我们的研究结果包括:针对空间系统的网络攻击越来越复杂;并且,成功防御在线攻击和社会工程攻击可以阻止 80% 的攻击。索引术语 — 太空网络安全、卫星安全事件、网络安全指标、网络威胁模型、ATT&CK、SPARTA
现代医疗保健局势具有挑战性。较少的提供者选择在农村COM市进行练习。越来越分散的护理景观通常是低质量,不平等且与当地医疗保健竞争。我们正在以改善蒙大拿州子女的生活,降低家庭的医疗费用并支持我们州自身的初级保健提供者的方式来重新思考蒙大拿州的小儿护理。
质量控制(QC)在任何工作流程中的步骤都有助于区分高质量和低质量样本。知道样品的质量对于大多数工作流程,包括下一代测序(NGS),这需要高质量的样本才能发挥最佳性能。敏捷的贴纸系统是自动电泳仪器,可提供对核酸样品的客观分析。挂接系统使用敏捷的基因组DNA筛选测定法来评估输入基因组DNA(GDNA)的样本量和浓度,并生成称为DNA完整性数(DIN)的DNA质量指标。DIN分析了分析的每个样本,分配了1到10的分数,其中1个表明低质量样本,10个指示最高质量的样本。以德国癌症研究中心(DKFZ)收集的4,000个样本及其测序数据及其相关的输入GDNA DIN值,例如,该应用程序显示了用户如何使用DIN来区分不同质量的样品。此外,通过定义每个输入GDNA样本的质量,用户可以定义一个阈值,以确定样品是否适合NGS。通过将DIN阈值纳入测序准备工作流程,可以简化该过程,从而节省时间和成本。
我们向当代光学识别(OMR)中最紧迫的两个问题提供了解决方案。我们提高了低质量,现实世界的识别准确性(即包含衰老,照明或污垢伪像)输入数据,并提供置信度评级的模型输出以实现有效的人类后处理。具体来说,我们提出了(i)复杂的输入增强方案,可以通过合成数据和现实世界文档的嘈杂扰动的结合来减少消毒基准和现实任务之间的差距; (ii)一种可用于改善OMR系统在低质量数据上的性能的对抗歧视域的适应方法; (iii)模型集合和预测融合的组合,该组合为每个预测产生值得信赖的置信度评级。我们在新创建的测试集上评估了我们的贡献,该测试集由来自国际音乐得分图书馆项目(IMSLP)/petrucci音乐库的手动注释的各种现实世界质量的页面组成。通过提出的数据增强方案,与最先进的培训相比,嘈杂的现实世界数据的检测性能从36.0%增加了一倍,达到73.3%。然后将此结果与强大的信心评级相结合,为OMR部署在现实世界中的道路铺平了道路。此外,我们还显示了无监督的对抗域适应的优点,以将36.0%的基线提高到48.9%。
风力涡轮机叶片的报废处理方式多种多样,从商业上可用的填埋到新兴的结构二次利用。这些报废处理方式回收叶片所含增强纤维、树脂和填充材料的全部价值的能力各不相同。商业技术(如水泥窑进料)和近乎商业化的技术(如气化)通过回收树脂和填充物作为能源的价值以及将纤维作为低质量增强材料或矿物的价值来妥协。新兴技术(如热塑性树脂)有望回收高质量的树脂和纤维。