摘要 我们提出了一种新方法,称为机器学习策略识别 (MLSI),以发现隐藏的决策策略。在这种方法中,我们首先根据一组被指示使用特定策略的参与者的选择和过程数据训练机器学习模型,然后使用训练后的模型识别一组新参与者所采用的策略。与大多数需要多次试验才能识别参与者策略的建模方法不同,MLSI 可以逐个试验区分策略。我们在三个实验中检查了 MLSI 的表现。在实验一中,我们在配对比较决策任务中向参与者传授三种不同的策略。最好的机器学习模型识别出参与者使用的策略,准确率超过 90%。在实验二中,我们将 MLSI 与多重测量最大似然 (MM-ML) 方法进行了比较,后者也能够在策略识别中整合多种类型的数据,结果发现 MLSI 的识别准确率高于 MM-ML。在实验三中,我们向在有利于非补偿策略(取其优)的任务环境中自由做出决策的参与者提供反馈。 MLSI 的逐次试验结果表明,在实验过程中,大多数参与者一开始会探索多种策略,但最终学会使用“选择最佳”策略。总体而言,我们的研究结果表明,MLSI 可以逐次识别隐藏策略,并且准确率很高,可与需要多次试验才能识别策略的其他方法相媲美。
合成数据与人工智能医疗设备的创新、评估和监管 Puja Myles,公共卫生硕士、博士;Johan Ordish,文学硕士;Richard Branson,理学硕士、文学硕士 摘要 合成数据是模仿真实数据的属性和关系的人工数据。它有望促进数据访问、验证和基准测试,解决缺失数据和欠采样、样本增强以及在临床试验中创建对照组的问题。英国药品和保健产品管理局 (MHRA) 正在利用其目前对高保真合成数据开发的研究,制定其对经过合成数据训练的人工智能医疗设备的监管立场,并将合成数据作为人工智能医疗设备验证和基准测试的工具。 关键词 人工智能作为医疗设备 (AIaMD)、数据隐私、健康数据、合成数据、验证、监管 简介 人工智能 (AI) 在医疗和社会保健领域的应用预计将会兴起,这意味着人工智能作为医疗设备 (AIaMD) 将成为医疗设备中越来越突出的子类别。 1 因此,医疗器械法规是否适合人工智能变得越来越重要,制造商是否了解并遵守其义务也变得越来越重要,其中最主要的是证明其 AIaMD 具有良好的效益风险比。2 强大的数据集是展示 AIaMD 性能的核心,通常是此类设备开发的主要障碍。3 医疗器械监管机构有责任确保制造商拥有履行这些义务所需的工具,并提供更广泛的支持以鼓励此类创新设备的开发。合成数据集的开发很可能成为这样一种辅助工具。本文概述了 MHRA 在研究和开发合成数据方面的努力,并考虑在更广泛的改革背景下使用合成数据,以确保医疗器械法规适用于人工智能。合成数据概况 近年来,人们对合成数据的兴趣日益浓厚,原因有很多,包括在数据治理法规更加严格的世界中可能易于获取、保护患者隐私、在机器学习算法背景下的基准测试和验证能力,以及解决真实数据局限性的能力,如数据缺失、欠采样和样本量小。4 更重要的是,尽管合成数据的潜在应用已经讨论了多年,但直到最近,合成数据生成方法的进步才能够产生高质量的合成数据。5 定义合成数据 从概念上讲,合成数据是模仿真实数据的属性和关系的人工数据。合成数据的质量取决于生成合成数据的方法。合成数据的质量通常用其“效用”或“保真度”来描述。“能够捕捉各种数据字段之间复杂的相互关系以及真实数据的统计特性的合成数据集可称为“高实用性”或“高保真度”合成数据集。在患者医疗保健数据方面,高保真度合成数据集将能够捕捉复杂的临床关系,并且在临床上与真实患者数据难以区分。高效用合成数据的生成往往需要大量资源,并且根据需要合成数据的应用,使用低效用或中等效用合成数据可能是可以接受的。
1 温州医科大学附属眼科医院眼视光学院、卫生部视觉科学国家重点实验室、浙江省眼视光重点实验室,浙江省温州市,2 美国马里兰州贝塞斯达美国国立卫生研究院国家糖尿病、消化和肾脏疾病研究所分子生物学实验室,3 北京生命科学研究所,4 浙江省温州市温州医科大学附属第二医院和育英儿童医院,5 美国宾夕法尼亚州费城费城儿童医院雷蒙德·G·佩雷尔曼细胞与分子治疗中心,6 浙江省温州市温州医科大学基因组医学研究所,7 中国科学院遗传与发育生物学研究所植物细胞与染色体工程国家重点实验室和基因组编辑中心,北京