由小有机化合物引起的分析干扰继续对早期药物发现构成巨大挑战。已经开发了各种计算方法来识别可能引起测定干扰的化合物。但是,由于可用于模型开发的数据稀缺,这些方法的预测准确性和适用性受到限制。在这项工作中,我们介绍了E-Guard(专家指导的鲁棒干扰复合检测的增强),这是一个新颖的框架,试图通过整合自我介绍,积极的学习和专家指导的分子产生来解决数据稀缺和失衡。e-guard迭代地用与干扰相关的分子丰富了训练数据,从而产生了具有出色性能的定量结构交流关系(QSIR)模型。我们以四个高质量数据集,氧化还原反应性,纳米酸酯酶抑制和萤火虫荧光素酶抑制的示例,证明了电子方形的实用性。与未经e-Guard数据增强的模型相比,这些数据集的MCC值最高为0.47,其富集因子的改进有两个或更高。这些结果突出了电子保守物作为缓解早期药物发现中测定干扰的可扩展解决方案的潜力。
摘要 - 由于耗时且昂贵的数据收集程序,基于脑电图的深度学习面临数据稀缺。数据增强已被证明是提高数据效率的有效方法。此外,最近已经证明,对比性学习在没有人类监督的情况下在学习有效表示方面具有巨大的希望,这有可能通过有限的标记数据来改善基于脑电图的识别性能。但是,大量数据增强是对比度学习的关键要素。鉴于脑电图处理中的基于样本的数据增强数量有限,三种方法,基于性能测量的时间扭曲,频率噪声添加和频率掩蔽,是根据脑电图信号的特征提出的。这些方法是免费的,易于实现的参数学习,并且可以应用于单个样本。在实验中,对三个基于脑电图的分类任务进行了评估所提出的数据增强方法,包括情况意识识别,运动图像分类和脑兼容器界面稳态稳态视觉唤起潜在的拼写器系统。的结果表明,使用拟议的数据增强方法训练的卷积模型产生了比基线的显着提高的性能。总体而言,这项工作提供了更多潜在的方法来应对有限的数据问题并提高脑电图处理中的分类性能。
IEA PVPS 任务 14,子任务 3 报告 IEA-PVPS T14-04:2014 年 11 月 作者:Kazuhiko Ogimoto 东京大学工业技术研究所,日本东京
医学图像分析在临床上引起了广泛关注。借助现代算法,计算机辅助诊断可帮助医生处理病理学以及观察者内和观察者之间的巨大差异。深度学习及其高计算能力将人为设计的特征转换为基于学习的特征提取过程。即使没有该领域的先验知识,模型也可以直接从数据中学习有意义的特征 [1]。因此,构建深度学习算法以学习分层特征表示需要大量数据。使用大数据集实现高精度使卷积神经网络 (CNN) 在医学图像分析任务中广受欢迎,例如肝病变分类 [2]、脑部分析 [3] 和视网膜图像分析 [4]。例如,谷歌提出的方法使用 128 万张视网膜图像来训练其系统以诊断糖尿病视网膜病变 [5],而深度 CNN 在皮肤病变分类方面也取得了理想的效果 [6]。不幸的是,在实际的医疗应用中,如此大量的带标签数据并不总是可访问的。有两个原因限制了医学图像领域对带标签数据的访问。首先,这是一项耗时而繁琐的任务,需要经验丰富的专家花费很长时间进行注释。其次,由于疾病并不常见,因此在应用中也很难获得所需数量的疾病图像。根据差异的类型,图像特征可分为两类,即相关特征和非相关特征 [7]。在医学图像中,相关特征包含确定器官或病变的最有用信息,而非相关特征则是图像之间变化的特征,例如强度差异。对于大多数医学图像应用而言,很难建立大型数据集,尤其是由于罕见疾病和患者隐私。训练小型数据集不利于模型捕捉广义的相关特征,并且可能由于过拟合问题导致性能下降。为了避免过拟合问题并提高深度学习算法的性能[8],研究人员尝试利用数据增强技术[9-12]。数据增强是一种通过向模型提供不同来源的数据来消除不相关方差的方法,它已被研究
由小有机化合物引起的分析干扰继续对早期药物发现构成巨大挑战。已经开发了各种计算方法来识别可能引起测定干扰的化合物。但是,由于可用于模型开发的数据稀缺,这些方法的预测准确性和适用性受到限制。在这项工作中,我们介绍了E-Guard(专家指导的鲁棒干扰复合检测的增强),这是一个新颖的框架,试图通过整合自我介绍,积极的学习和专家指导的分子产生来解决数据稀缺和失衡。e-guard迭代地用与干扰相关的分子丰富了训练数据,从而产生了具有出色性能的定量结构交流关系(QSIR)模型。我们以四个高质量数据集,氧化还原反应性,纳米酸酯酶抑制和萤火虫荧光素酶抑制的示例,证明了电子方形的实用性。与未经e-Guard数据增强的模型相比,这些数据集的MCC值最高为0.47,其富集因子的改进有两个或更高。这些结果突出了电子保守物作为缓解早期药物发现中测定干扰的可扩展解决方案的潜力。
“扩充计划”是指一项详细的计划,该计划可以是临时的,也可以是永久性的,目的是通过开发新的或替代的引水方式或引水点、汇集水资源、进行水交换项目、提供替代水源、开发新水源或任何其他适当方式,增加某个区域或部分区域可供有益使用的水源供应。“扩充计划”不包括通过根除地下水藻来挽救支流水,也不包括使用从已不透水的陆地表面收集的支流水,从而增加径流但不增加现有的支流水供应。 § 37-92-103(9),CRS 在审查拟议的扩容计划并考虑避免伤害所需的条款和条件时,仲裁员或水资源法官应考虑申请人使用或拟议使用水量在数量和时间上的消耗、申请人将提供的扩容水量和时间,以及是否存在对既得水权或法令规定的有条件水权下有权使用水的任何所有者或人员造成的伤害。扩容计划应足以允许继续进行引水,否则将需要削减水量以满足有效的老年人用水需求,只要申请人提供必要的替代水量以满足老年人引水者在当时和地点的合法要求,并且只要老年人因申请人的引水而被剥夺其合法权利。拟议的扩容计划依赖于扩容水供应,而扩容水供应(无论通过合同还是其他方式)的持续时间有限,只要该计划的条款和条件能够防止损害既得水权,则不得仅以扩容水供应持续时间有限为由而拒绝该计划。上述条款和条件应要求在任何地下水转移停止后替换非优先性耗竭。批准扩容计划的法令应要求州工程师减少所有非优先性转移,这些耗竭的替换方式无法防止损害既得水权。扩容计划可以规定程序,允许在初始法令颁布后在计划中使用额外或替代的替代水源,包括按年度或更少频率租赁的水,前提是使用上述额外或替代水源是根据 § 37-92-308、CRS 批准的替代供水计划的一部分,或者如果此类水源被法令用于此类用途。 § 37-92-305(8),CRS 一般来说,法规和判例法要求必须在时间、地点、质量和数量上弥补优先顺序外的损害性消耗。申请人有责任在本申请中提供每个建筑物的位置。对于已裁定的建筑物,请逐字逐句地使用裁定该位置的最新法令中的位置。对于新建筑物,请提供 PLSS 位置(四分之一、部分、乡镇和范围)和单点位置描述,使用 UTM 坐标(例如来自 GPS 设备)(首选)或已知部分线的测量距离。1. 申请人的姓名、邮寄地址、电子邮件地址和电话号码(如果有多个申请人,
由于传感器特性变化导致训练阶段的运行时域偏移会导致基于深度学习的传感系统性能下降。为了解决这个问题,现有的迁移学习技术需要大量的目标域数据,并会产生高昂的部署后开销。与此不同,我们建议利用控制域偏移的第一原理来减少对目标域数据的需求。具体来说,我们提出的方法 PhyAug 使用第一原理,结合源传感器和目标传感器收集的少量标记或未标记数据对,将现有的源域训练数据转换为增强的目标域数据,以校准深度神经网络。在关键词识别和自动语音识别这两个音频传感案例研究中,PhyAug 使用从目标麦克风收集的 5 秒未标记数据将麦克风特性变化导致的识别准确度损失恢复了 37% 至 72%。在基于声学的房间识别案例研究中,PhyAug 将智能手机麦克风变化导致的识别准确度损失恢复了 33% 至 80%。在最后一个鱼眼图像识别案例研究中,PhyAug 将由于相机引起的扭曲而导致的图像识别错误减少了 72%。
图 2.5 激活函数:(a)S 型函数,(b)双曲正切函数,(c)整流线性单位函数,(d)泄漏整流线性单位函数。......................................................................................................................... 18
摘要。配备了训练有素的环境动态,基于模型的型号增强学习(RL)算法可以成功地从固定尺寸的数据集中成功学习良好的策略,甚至有些质量较差的数据集。不幸的是,不能保证从训练有素的动态模型中生成的样品是可靠的(例如,某些合成样本可能位于静态数据集的支持区域的外面)。为了解决这一点,我们提出了与u ncleantity(tatu)的束缚t runcation,如果沿轨迹的累积不确定性太大,则可以自适应地截断合成轨迹。我们从理论上展示了塔图的绩效界限,以证明其受益合理。为了示出Tatu的优势,我们首先将其与两种基于经典模型的型号RL算法结合在一起,MOPO和组合。此外,我们将tatu与几个未经省的模型集成在一起,不含频率rl算法,例如BCQ。D4RL基准测试的实验结果表明,Tatu显着提高了其能力,通常会大幅度通过很大的边缘。代码可在此处找到。
摘要 - 多代理强化学习已成为控制多机器人系统的一种有希望的方法。尽管如此,MARL的样本效率低,这是其在机器人技术中更广泛应用的重要障碍。虽然数据增强似乎是提高样品效率的直接解决方案,但它通常会导致训练不稳定,从而使样本效率变得更糟。此外,手动为各种任务选择合适的增强是一个繁琐而耗时的过程。为了缓解这些挑战,我们的研究理论上分析了数据增强对MARL算法的含义。在这些信息的指导下,我们提出了Adaptaug,这是一个自适应框架,旨在选择性地识别有益的数据增强,从而实现了多机器人任务的卓越样本效率和整体性能。在模拟和现实世界多机器人方案中的广泛实验验证了我们提出的框架的有效性。