摘要:从大型多任务演示数据集中学习的模仿学习已成为构建普通能力的机器人的有前途的途径。结果,已经花费了1000个小时来在全球构建如此大规模的数据集上。尽管这种努力不断增长,但我们仍然缺乏对应收集哪些数据来改善机器人数据集的效用的系统性理解,并促进了下游政策学习。在这项工作中,我们进行了一项大规模的数据集组成研究,以回答这个问题。我们开发了一个数据生成框架,以在实际数据集(例如传感器放置,对象类型和安排)中模拟普通多样性,并使用它来生成具有控制组成的大规模机器人数据集,从而实现了在现实世界中会昂贵的数据集组成研究。我们专注于两个实际设置:(1)当未来的研究人员收集大规模的机器人数据集时,应强调哪种类型的多样性,以及(2)当前的从业人员如何从现有数据集中检索相关的演示以最大程度地提高关注任务的下游政策绩效。我们的研究产生了几个关键见解 - 例如,我们发现相机的姿势和空间排列是收集多样性和检索对齐方式的关键维度。在现实世界的机器人学习设置中,我们发现,不仅可以从模拟中进行洞察力,而且我们对现有数据集(例如Droid)的检索策略使我们能够始终如一地超过现有的培训策略高达70%。https://mimiclabs-iclr.github.io/
1 ,希腊国家天文台,希腊2物理学系,国家和卡普迪斯特里亚大学雅典大学,希腊,希腊3 3号气候和大气环境实验室,地理学和气候学部分,地理学和地质学系,国家维护,国民和国民学院,阿特里克·埃特里克·埃纳里克·埃纳里克·埃纳里克·埃伦尼克·埃纳里克·埃纳里奇,,希腊国家天文台,希腊2物理学系,国家和卡普迪斯特里亚大学雅典大学,希腊,希腊3 3号气候和大气环境实验室,地理学和气候学部分,地理学和地质学系,国家维护,国民和国民学院,阿特里克·埃特里克·埃纳里克·埃纳里克·埃纳里克·埃伦尼克·埃纳里克·埃纳里奇,,希腊国家天文台,希腊2物理学系,国家和卡普迪斯特里亚大学雅典大学,希腊,希腊3 3号气候和大气环境实验室,地理学和气候学部分,地理学和地质学系,国家维护,国民和国民学院,阿特里克·埃特里克·埃纳里克·埃纳里克·埃纳里克·埃伦尼克·埃纳里克·埃纳里奇,,希腊国家天文台,希腊2物理学系,国家和卡普迪斯特里亚大学雅典大学,希腊,希腊3 3号气候和大气环境实验室,地理学和气候学部分,地理学和地质学系,国家维护,国民和国民学院,阿特里克·埃特里克·埃纳里克·埃纳里克·埃纳里克·埃伦尼克·埃纳里克·埃纳里奇,,希腊国家天文台,希腊2物理学系,国家和卡普迪斯特里亚大学雅典大学,希腊,希腊3 3号气候和大气环境实验室,地理学和气候学部分,地理学和地质学系,国家维护,国民和国民学院,阿特里克·埃特里克·埃纳里克·埃纳里克·埃纳里克·埃伦尼克·埃纳里克·埃纳里奇,,希腊国家天文台,希腊2物理学系,国家和卡普迪斯特里亚大学雅典大学,希腊,希腊3 3号气候和大气环境实验室,地理学和气候学部分,地理学和地质学系,国家维护,国民和国民学院,阿特里克·埃特里克·埃纳里克·埃纳里克·埃纳里克·埃伦尼克·埃纳里克·埃纳里奇,,希腊国家天文台,希腊2物理学系,国家和卡普迪斯特里亚大学雅典大学,希腊,希腊3 3号气候和大气环境实验室,地理学和气候学部分,地理学和地质学系,国家维护,国民和国民学院,阿特里克·埃特里克·埃纳里克·埃纳里克·埃纳里克·埃伦尼克·埃纳里克·埃纳里奇,,希腊国家天文台,希腊2物理学系,国家和卡普迪斯特里亚大学雅典大学,希腊,希腊3 3号气候和大气环境实验室,地理学和气候学部分,地理学和地质学系,国家维护,国民和国民学院,阿特里克·埃特里克·埃纳里克·埃纳里克·埃纳里克·埃伦尼克·埃纳里克·埃纳里奇,,希腊国家天文台,希腊2物理学系,国家和卡普迪斯特里亚大学雅典大学,希腊,希腊3 3号气候和大气环境实验室,地理学和气候学部分,地理学和地质学系,国家维护,国民和国民学院,阿特里克·埃特里克·埃纳里克·埃纳里克·埃纳里克·埃伦尼克·埃纳里克·埃纳里奇,,希腊国家天文台,希腊2物理学系,国家和卡普迪斯特里亚大学雅典大学,希腊,希腊3 3号气候和大气环境实验室,地理学和气候学部分,地理学和地质学系,国家维护,国民和国民学院,阿特里克·埃特里克·埃纳里克·埃纳里克·埃纳里克·埃伦尼克·埃纳里克·埃纳里奇,,希腊国家天文台,希腊2物理学系,国家和卡普迪斯特里亚大学雅典大学,希腊,希腊3 3号气候和大气环境实验室,地理学和气候学部分,地理学和地质学系,国家维护,国民和国民学院,阿特里克·埃特里克·埃纳里克·埃纳里克·埃纳里克·埃伦尼克·埃纳里克·埃纳里奇,
胰腺癌是美国与癌症相关死亡的第三大主要原因。当前的治疗选择可提供惨淡的总体生存期,而5年生存期约为12%。对胰腺癌的临床和分子基础的分析对于开发早期检测方法以及新颖的治疗选择至关重要。这种疾病的侵略性和致命性需要开发用于胰腺癌数据的数据存储库和分析系统。胰腺癌动作网络(Pancan)Spark平台是由Velsera提供支持的基于云的数据和分析平台,它从Pancan研究计划中整合了现实世界中的患者健康数据,并通过使胰腺癌数据易于访问和使用来加速研究。涵盖了来自Pancan's New您的肿瘤®(KYT)精密医学服务中600多名胰腺癌患者的临床,成像和基因组学数据,Spark平台与癌症基因组学云(CGC)的公共可用癌症数据相连,也由Velsera驱动。CGC是NCI癌症研究数据共享(CRDC)的一部分,该数据共享(CRDC)是一种基于云的数据科学基础架构,该基础架构将数据与分析工具联系起来,以允许研究人员共享,集成,分析,可视化和推动科学发现。在这里,我们通过提供了一个案例研究来证明这些数据集的应用,该案例研究演示了如何结合和丰富数据以加速胰腺癌研究。目前,可在CRDC上获得的基因组和蛋白质组学数据分别为402例和304例胰腺肿瘤样品。我们将使用SPARK和CGC平台的功能,这些功能为不需要编码知识的多词分析提供了现成的工具。使用KYT和CRDC开放式胰腺癌数据,我们旨在演示如何对来自不同科学领域的数据进行综合分析,并与一个空间中的合作者共享,从而简化并增加了新科学发现的潜力。pancan和CGC数据集的进一步扩展无疑将为胰腺癌肿瘤生物学提供更全面的了解。SPARK和CGC基于云的计算基础架构,以及许多可用的癌症数据集以及易于使用的多派数据处理工作流程和数据分析工具将在此过程中发挥作用。
在过去的几年中,卷积神经网络(CNN)占据了计算机视觉领域的主导,这要归功于它们在分类问题中提取功能及其出色表现的能力,例如在X射线自动分析中。不幸的是,这些神经网络被视为黑盒算法,即不可能了解该算法是如何实现最终结果的。将这些算法应用于不同领域并测试方法的工作原理,我们需要使用可解释的AI技术。医学领域的大多数工作都集中在二进制或多类分类问题上。但是,在许多现实情况下,例如胸部X射线,可以同时出现不同疾病的放射学迹象。这引起了所谓的“多标签分类问题”。这些任务的缺点是阶级失衡,即不同的标签没有相同数量的样本。本文的主要贡献是一种深度学习方法,用于不平衡的多标签胸部X射线数据集。它为当前未充分利用的Padchest数据集建立了基线,并基于热图建立了新的可解释的AI技术。此技术还包括概率和模型间匹配。我们系统的结果很有希望,尤其是考虑到使用的标签数量。此外,热图与预期区域相匹配,即他们标志着专家将用来做出决定的领域。©2023作者。由Elsevier B.V.这是CC BY-NC-ND许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)下的开放访问文章。
3 2018 年《数据保护法》第 3 (2) 条将个人数据定义为“与已识别或可识别的在世个人有关的任何信息”。这意味着可以直接或间接识别个人,特别是参考以下信息:- (a) 标识符,例如姓名、身份证号、位置数据或在线标识符,或 (b) 一个或多个特定于个人身体、生理、遗传、精神、经济、文化或社会身份的因素。 4 NCA 的总干事将是数据控制者,NCA 决定处理任何个人数据的目的和方式。因此,第三方(作为数据处理者)代表 NCA 处理的数据集可以构成 BPD,因为 DG NCA 是数据控制者。 5 就本操作程序而言,数据的选择包括:
摘要 — 目标:我们提出一种迁移学习方法,用于具有不同维度、来自不同实验设置但代表相同物理现象的数据集。我们重点研究数据点是对称正定 (SPD) 矩阵的情况,该矩阵描述基于 EEG 的脑机接口 (BCI) 的统计行为。方法:我们的方案使用两步程序来转换数据点,使它们在维度和统计分布方面匹配。在维度匹配步骤中,我们使用等距变换将每个数据集映射到公共空间中,而不改变它们的几何结构。统计匹配是使用域自适应技术完成的,该技术适用于定义数据集的空间的固有几何形状。结果:我们在从具有不同实验设置(例如,不同数量的电极、不同的电极位置)的 BCI 系统获得的时间序列上说明了我们的建议。结果表明,所提出的方法可用于在原则上不兼容的 BCI 记录之间传输判别信息。结论和意义:这些发现为新一代 BCI 系统铺平了道路,尽管电极定位不同,该系统仍能够重复使用信息并从多种数据源中学习。
修道院. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 死亡. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 艾滋病2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 anova.negbin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 区域 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 细菌 . . . ... ... . . . . . . . . . . . . . . . . 14 beav1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 beav2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ... ................. ... 。 。 。 。 。 。 。 。 。 。 。 。 。 22 凯斯. 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 23 汽车93 . 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 24只猫。 。 。 。 。 。 。 。 。 。 。 。 ................. ... 。 。 。 。 27 con2tr。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 27 限制-质量。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 28 对比 sdif 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 28 鸡笼。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 29 对应 . 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 30 冠状病毒抢劫。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 31 冠状病毒特罗布。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。. ... . ... . ... . ... . ... . ... 33 中央处理器 . ... . ... . ... . ... . ... . ... . ... . ... . ... . ... . ... . ... . ... . ... . ... . ... . ... . ... . ... . ... . ... 34 螃蟹 . ... . ... . ... . ... . ... . ... . ... . ... . ... . ... . ... . ... . ... . ... . ... . ... . ... . ... . ... . ... . ... 35 库欣综合征 . ... . ... . ... . ... . ... . ... . ... . ... . ... ... 37 列举。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 38 剂量.p。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 39名司机。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .................................................................................................................................................................................................................................................................................................................................................. 43 eqscplot .................................................................................................................................................................................................................................................................................................................................................................................................................. 44 农场 .................................................................................................................................................................................................................................................................................................................................................................................................................................................. 44 农场 .................................................................................................................................................................................................................................................................................................................................................................................................................................................. 。 45 英尺。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 46 配合分配器。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 47
主观差异 1 +0.742 (0.47-0.88) +0.520 (0.14-0.77) +0.035 (-0.38-0.44) -0.009 (-0.42-0.4) +0.062 (-0.36-0.46) 级别 +0.742 (0.47-0.88) 1 +0.595 (0.24-0.81) -0.032 (-0.44-0.39) -0.045 (-0.45-0.37) +0.072 (-0.35-0.47) TLX_effort +0.818 (0.61-0.92) +0.648 (0.32-0.84) +0.375 (-0.04-0.68) +0.077 (-0.35-0.47) +0.035 (-0.38-0.44) -0.008 (-0.42-0.41) TLX_心理需求 +0.750 (0.49-0.89) +0.513 (0.13-0.76) +0.319 (-0.11-0.65) +0.075 (-0.35-0.47) +0.062 (-0.36-0.46) -0.006 (-0.42-0.41) TLX_时间需求 +0.669 (0.35-0.85) +0.671 (0.36-0.85) +0.459 (0.06-0.73) +0.053 (-0.37-0.46) +0.038 (-0.38-0.44) +0.105 (-0.32-0.5) TLX_实物需求 +0.266 (-0.16-0.61) +0.181 (-0.25-0.55) -0.042 (-0.45-0.38) -0.539 (-0.78-(-0.16)) -0.456 (-0.73–0.05) -0.304 (-0.64-0.12) TLX_性能 -0.383 (-0.69-0.04) -0.353 (-0.67-0.07) -0.261 (-0.61-0.17) -0.132 (-0.52-0.30) -0.018 (-0.43-0.4) +0.014 (-0.4-0.42) TLX_frustration +0.413 (0.00-0.70) +0.385 (-0.03-0.69) +0.144 (-0.29-0.52) -0.474 (-0.74-(-0.08)) -0.402 (-0.7-0.01) -0.149 (-0.53-0.28)
大型、多站点、异构脑成像数据集越来越需要用于训练、验证和测试基于深度学习 (DL) 的高级自动化工具,包括基于结构磁共振 (MR) 图像的诊断和治疗监测方法。在将多个较小的数据集组合成较大的数据集时,了解聚合数据集中不同采集和处理协议之间的潜在差异 (称为“批次效应”) 至关重要。训练数据集中存在差异很重要,因为它更接近地反映了真实的潜在数据分布,因此可以增强工具的整体通用性。然而,必须仔细评估批次效应的影响,以避免不良影响,例如可能降低性能指标。批次效应可能来自许多方面,包括采集设备、成像技术和参数以及应用的处理方法的差异。在开发工具时,必须考虑它们的影响,包括有益的和不利的,以确保它们的输出与提出的临床或研究问题(即实际的疾病相关或病理变化)相关,而不仅仅是由于聚合数据集中底层批次效应的特殊性。我们回顾了深度学习在结构性脑 MR 成像中的应用,它聚合了来自神经成像数据集的图像,这些数据集通常是在多个站点获取的。我们检查了包含健康对照参与者和患者的数据集,这些数据集是使用不同的采集协议获取的。首先,我们讨论了数据访问问题,并列举了一些常用的公开脑数据集的主要特征。然后,我们通过探索两大类方法回顾了纠正批次效应的方法:数据协调,使用数据标准化、质量控制协议或其他类似算法和程序来明确理解和最小化不必要的批次效应;领域自适应,开发深度学习工具,通过使用方法隐式处理批次效应以获得可靠和稳健的结果。在这篇叙述性评论中,我们强调了这两类 DL 方法的优缺点,并描述了未来研究中需要解决的关键挑战。
摘要 - 尽管进行了持续研究,但网络钓鱼电子邮件攻击正在上升,并且缺乏用于培训和测试电子邮件过滤技术的丰富策划数据集。为了解决这个问题,我们生产并发布了七个策划的数据集,其中包含203,176个电子邮件实例,可与机器学习一起使用(ML),以区分网络钓鱼电子邮件和合法的电子邮件。我们通过精心策划网络钓鱼和来自不同存储库的合法电子邮件来创建这些数据集。然后证明我们的策划数据集适合该目的,我们进行了定量分析,以评估五种ML算法的性能。我们还分析了这些策划数据集中不同特征对这些ML算法的重要性和影响。这些策划的数据集以及定量分析的发现将推动针对网络钓鱼攻击的强大防御。