摘要。安全对于扩大重新执行学习(RL)的应用至关重要。通常,我们在将其部署在现实世界中之前,在受控环境(例如实验室)中训练RL代理。但是,现实世界的目标任务可能在部署前未知。无奖励RL训练代理,而无需奖励,一旦奖励揭示了奖励。我们考虑了无奖励的环境,代理(指南)学会了在没有奖励信号的情况下安全探索。该代理在受控环境中进行训练,该环境允许不安全的交互作用,并且仍然提供安全信号。揭示了目标任务后,不再允许违反安全性。因此,该指南被利用以制定安全的行为政策。从转移学习中绘制,我们还将目标政策(学生)正规化为指南,而学生不可靠,并且随着培训的进行,逐渐消除了指南的影响。经验分析表明,该方法可以实现安全的转移学习,并帮助学生更快地解决目标任务。
本文调查了利用以前任务的现有所谓模型以使用有限的培训数据来解决相关目标任务的问题。解决此问题的现有方法通常需要访问现有解决方案模型以及其培训数据的内部参数,这在许多实际设置中是不可能的。为了重新确定此要求,我们从黑框重新插入的新角度解决了这个问题,从而增加了目标输入并利用了现有的黑盒API将其相应的输出传达到功能集合中。我们假设可以学习这种功能集合,以将相关的黑框知识合并到目标数据的特征表示中,这将构成其稀缺性。通过我们提出的Black-box集合的报告确认了这一假设,以求解从各种基准数据集中得出的多个几次学习任务。所有报告的结果始终显示出,确实可以重复使用并有效地使用以前任务的异质黑盒解决方案,以解决合理相关的目标任务,而无需访问大型培训数据集。这是使新的可能性进一步补充传输或元学习中现有技术的第一步。
摘要 - 尽管许多研究已成功地将转移学习应用于医学图像分割,但是当有多个源任务可转移时,很少有人研究了选择策略。在本文中,我们提出了一个基于知识的知识和基于可传递性的框架,以在大脑图像分割任务集合中选择最佳的源任务,以提高给定目标任务上的转移学习绩效。该框架包括模态分析,ROI(感兴趣的区域)分析和可传递性效率,以便可以逐步对源任务选择进行。特别是,我们将最先进的分析转移能力估计指标调整为医学图像分割任务,并进一步表明,基于模态和ROI特征的候选源任务可以显着提高其性能。我们关于脑物质,脑肿瘤和白质超强度分割数据集的实验表明,从同一模式下的不同任务转移通常比在不同方式下从同一任务转移的实验更成功。此外,在相同的方式中,从具有更强的ROI形状相似性与目标任务的源任务转移可以显着提高最终传输性能。可以使用标签空间中的结构相似性指数捕获这种相似性。索引术语 - 转移学习,医学图像分析,来源选择I。
最近的研究发现了大语模型(LLM)通过提供高级指令来解决复杂的顺序决策任务的潜力。但是,基于LLM的代理缺乏解决特定目标问题的专业知识,尤其是在实时动态环境中。此外,在实际情况下部署基于LLM的代理可能既昂贵又耗时。另一方面,信息系统学习(RL)的方法是训练专门从事目标任务但经常遭受抽样效率低下和高勘探成本的训练代理。在本文中,我们介绍了一项新颖的框架,该框架通过使用基于LLM的教师代理商的INSTUCTIONS培训较小的专业学生RL代理来解决这些挑战。通过纳入教师代理的指导,学生代理可以将LLM的先验知识提炼成自己的模型。因此,可以对学生代理人进行培训的数据较少。此外,通过对环境反馈的进一步培训,学生代理人超过了其完成目标任务的能力。我们进行了针对挑战的Minigrid和栖息地环境进行的实验,该实验专门为体现的AI研究而设计,以评估我们的框架的有效性。结果清楚地表明,与强基线方法相比,我们的方法取得了卓越的性能。我们的代码可在https://github.com/zjlab-mmi/llm4teach上找到。
数据对于所有模型都是必不可少的。但是,嘈杂和低质量的数据可能会使算法的性能恶化。在这方面,需要通过查看其在特定任务上的表现来确定目标任务的最有用数据。RL可用于了解哪些数据最有价值。这种建议的方法比较旧的方法(例如丢弃的方法)要好得多,该方法通过查看该绩效如何变化(如果将该作品删除)来判断数据的重要性。
本文探讨了在迁移学习应用中使用神经网络修剪来实现更高效的推理。目标是将神经网络集中并优化在较小的专门目标任务上。随着物联网的出现,我们看到基于人工智能的移动和嵌入式设备(如可穿戴设备和其他智能设备)的应用大幅增加。然而,随着机器学习算法的复杂性和能力不断增加,由于这些设备上资源有限,这种向边缘的推进带来了新的挑战。需要某种形式的压缩才能让最先进的卷积神经网络在边缘设备上运行。在这项工作中,我们调整了现有的神经网络修剪方法,使它们能够专门化网络,使其仅关注最初训练的子集。这是一个迁移学习用例,我们优化大型预训练网络。这与标准优化技术不同,它允许网络忘记某些概念,并使网络的占用空间更小。我们比较了不同的修剪标准,包括可解释人工智能 (XAI) 领域的标准,以确定哪种技术可以实现尽可能小的网络,同时保持目标任务的高性能。我们的结果显示了在嵌入式设备上执行神经网络时使用网络专业化的好处,无论是否使用 GPU 加速。
许多基于机器学习的轴突追踪方法依赖于带有分割标签的图像数据集。这需要领域专家的手动注释,这需要大量劳动力,并且不适用于以细胞或亚细胞分辨率对半球或整个脑组织进行大规模脑映射。此外,保留轴突结构拓扑对于理解神经连接和大脑功能至关重要。自监督学习 (SSL) 是一种机器学习框架,允许模型在未注释的数据上学习辅助任务,以帮助完成监督目标任务。在这项工作中,我们提出了一种新颖的 SSL 辅助任务,即为面向拓扑的轴突分割和中心线检测的目标任务重建边缘检测器。我们使用小鼠大脑数据集对三个不同的 SSL 任务进行了 3D U-Nets 预训练:我们提出的任务、预测排列切片的顺序和玩魔方。然后,我们在不同的小鼠大脑数据集上评估了这些 U-Nets 和基线模型。在所有实验中,针对我们提出的任务进行预训练的 U-Net 分别将基线的分割、拓扑保留和中心线检测提高了 5.03%、4.65% 和 5.41%。相比之下,切片排列和魔方预训练的 U-Net 并没有比基线有持续的改进。
摘要。优化工业过程(例如制造或处理特定材料的加工)构成了许多研究人员的兴趣,并且其应用不仅可以导致加快相关过程的加快,还可以减少它们在它们期间产生的能源成本。本文介绍了一种优化计算机数字控件(CNC)计算机主轴运动的新方法。提出的解决方案是使用深度学习并加强绘制行业中使用的参考点实现优化(RPRO)算法的性能。进行了一项详细的研究,以查看所提出的方法执行目标任务的程度。此外,研究了许多不同因素和学习过程的超参数对训练剂的性能的影响。提出的解决方案取得了非常好的结果,不仅令人满意地复制了基准算法的性能,而且还可以加快加速过程并提供更高的准确性。
英国航天局双边计划(科学和工业)使英国能够与合作伙伴一起参与欧空局以外的任务,但英国只是次要合作伙伴。该行业长期以来一直希望由英国主导任务。本文件将最初的科学目标任务概念扩展到太空的所有用途。本文件是 2019 年关于所谓的科学卫星的 SPAN 白皮书的改进版。由于 SPAN 及其成员的时间和资源限制,本文件由 SPAN 联合主席 Mark Sims 教授和 SPAN 联络经理 Anushka Sharma 编写,基于对成员的调查以及 2024 年 3 月空间工程和技术工作组和空间科学与探索工作组的讨论。对讨论的任何解释错误均由联合主席 Sims 教授负责。
致谢……………………………………………………..……………………………………………..ii 表格列表…………………………………………....………………………………………………….iv 图表列表……………………..……………………….....…………………………….….……………..v 摘要………………………………………………....….……………………..…..………….vi 简介……………………………………………………………….……………………….1 文献综述…………………………………………………………………………………..…….3 目标任务相互依赖性和工作流程…………………………………………….…..………3 任务相互依赖性和工作流程感知……………………………………………..…………….….5 理论框架和假设陈述…………………………………………………6 材料和方法…………………………………………………………………………………………18 样本……………………………………………………………………………………………………18 程序……………………………………………………………………………………………………18 测量……………………………………………………………………………………………………………………21 缺失数据……………………………………………………………………………………………………27 结果…………………………………………………………………………………………………………29 分析策略和初步分析…………………………………………………………………………29 假设检验…………………………………………………………………………………………29 讨论…………………………………………………………………………………………………………44 目的和主要发现摘要…………………………………………………………………………44 局限性和未来方向研究…………………………………………………………..49 实践和研究意义………………………………………………………………………….54 总体结论…………………………………………………………………………………………..55 参考文献……………………………………………………………………………………………….56 附录 A:招聘传单………………………………………………………………………………...62 附录 B:研究会议时间表…………………………………………………………………….63 附录 C:编码通信单元的定义和示例………………………………………………………….64 附录 D:测量量表…………………………………………………………………………………...65 附录 E:假设摘要………………………………………………………………………….66 简历……………………………………………………………………………………………….68