在工业标记领域,连续喷墨技术以墨滴的高速发射为基础。发射出的墨滴形状是墨水特性和刺激操作点的结合,对打印质量有直接影响。本文通过使用 COMSOL Multiphysics ® 模拟多种粘度的液滴形状(正问题)并使用机器学习技术从液滴形状推断粘度(逆问题)来探索粘度的作用。此用例说明了如何设置机器学习逆问题解决策略的主要阶段:收集数据、选择和训练模型、测试模型并提高其预测能力。COMSOL Multiphysics ® 的灵活性使其易于与 Python 机器学习工具交互,从而高效地产生有价值的结果。
机器学习 (ML) 模型越来越多地被用于通常需要与人类专家合作的应用领域。在这种情况下,当 ML 模型难以预测某些实例时,将它们交给单个人类专家会很有优势。虽然以前的工作主要集中在只有一位人类专家的场景,但在许多现实世界中,可能会有几位具有不同能力的人类专家可供选择。在这项工作中,我们提出了一种训练分类模型的方法,以补充多位人类专家的能力。通过联合训练分类器和分配系统,分类器学会准确预测那些对人类专家来说很难的实例,而分配系统学会将每个实例传递给最合适的团队成员——分类器或其中一位人类专家。我们在公共数据集上与“合成”专家和由多位放射科医生注释的真实世界医学数据集进行了多次实验,以评估我们提出的方法。我们的方法优于以前的工作,比最好的人类专家或分类器更准确。此外,它可以灵活地适应不同规模和不同专家多样性水平的团队。
成像长期以来一直是癌症研究和临床护理的基石,为了解组织形态和空间细胞间动力学提供了依据。近年来的技术进步使显微镜的规模比以往任何时候都更大,导致常用数据集的大小呈指数级增长 - 这一趋势在未来几年可能会继续加速。生物医学成像中的“大数据”可以沿着两个正交轴概念化:样本大小和数据维数(图 1)。第一个轴(n)可以通过简单地计算数据集中的病例数来测量。这一维度的扩展主要受到高通量成像技术的进步的推动。一个显著的例子可以在病理学领域看到,该领域越来越多地采用数字化工作流程,导致幻灯片扫描被例行纳入病理学家的工作流程,从而创建大型全幻灯片图像 (WSI) 数据库。早期采用数字化病理学工作流程的人每年扫描超过 100 万张幻灯片 [1] - 比 TCGA 等当前基准数据集大几个数量级,并且表明随着工作流程日益数字化,大型学术三级医院可以预期定期生成的潜在数据量。与此同时,数据在每张图像中捕获的信息量也在增长,我们将其称为数据维数 (d)。这主要是由空间组学(即蛋白质或 RNA 等分子标记的空间量化)和高度多路复用成像(在 [2] 中进行了评论)的新兴技术推动的。与具有三个通道(红色、绿色和蓝色)的明场图像相比,这些高维图像中的每一个可能具有多达 10,000 个通道,每个通道代表一个特定目标。体积成像通过添加深度维度进一步增加了每个样本的信息内容,从而能够捕获三维组织形态。因此,即使病例数保持不变,数据集大小也会增长。图像数据的快速增长对癌症研究具有重要意义,尤其是与基因组学和结果等伴随元数据结合使用时。大样本量为发现和量化与临床和生物学相关特征相关的组织学模式提供了足够的能力,最近的研究表明这些方法有潜力改善临床和诊断工作流程 [3-5] 并发现基于图像的生物标志物以重现分子特征 [6, 7]。同样,高维成像数据中捕获的丰富背景信息为以前所未有的分辨率探究肿瘤微环境奠定了基础 [8, 9]。随着数字工作流程越来越多地部署在各种临床环境中,明场显微镜的普遍性使其成为基于图像的生物标志物开发的特别有吸引力的候选者。然而,虽然成像数据集规模的增加带来了新的研究机会和途径,但也带来了重大挑战。也就是说,这些进步只有通过利用计算图像分析方法,特别是深度学习才有可能实现。深度学习模型灵活而强大,在识别方面已显示出显著的成功
Meghan Grome博士是纽约科学院教育和公共计划的执行董事。她是学院与纽约州立大学之间的295万美元合作赠款的原则调查员。她曾是国家州长协会的高级政策分析师,在那里她从事《美国创新计划》和《建立茎议程》(STEM Andera)的合作,这是改善科学教育管道的框架。Linda M.Rodríguez,M.A。是纽约市青年和社区发展部能力建设助理专员。 她监督DYCD与社区组织的技术援助工作,并管理用于评估提供商的质量保证系统。 她还组织了该市首次以STEM为主题的专业发展会议,由300多个课后领导人参加。 加入DYCD之前,她曾在国家青年和劳动力发展中介机构工作。Linda M.Rodríguez,M.A。是纽约市青年和社区发展部能力建设助理专员。她监督DYCD与社区组织的技术援助工作,并管理用于评估提供商的质量保证系统。她还组织了该市首次以STEM为主题的专业发展会议,由300多个课后领导人参加。加入DYCD之前,她曾在国家青年和劳动力发展中介机构工作。