抽象的深入强化学习表明,在视频游戏,机器人控制,官方驾驶和药物发现等不同领域的跨不同领域取得了巨大的成就。部分可观察的域中的常见方法在很大程度上倾向于从高维观测(例如图像)中端到端学习,而没有明确推理真实状态。我们提出了一个替代方向,引入了部分规定的加固学习(PSRL)框架。PSRL的核心是受监督和无监督学习的融合。该方法利用州估计器从高维观测中提取监督的语义状态信息,这些观察通常在培训时完全可用。这产生了更容易解释的政策,这些政策由控制构成状态预测。并行,捕获了一个无透视的潜在表示。这两个 - 语义状态和潜在状态 - 然后融合并用作策略网络的输入。这种并置为从业者提供了灵活而动态的范围:从强调监督的状态信息到整合富裕的潜在见解。广泛的实验结果表明,通过合并这些双重表示,PSRL提供了有效的平衡,增强了模型,可以在保存的同时使用,并且通常明显胜过表现,这是通过奖励和收敛速度以传统方法设定的性能基准。
一个人通常将信号表达式拟合到实验数据以估计模型参数。但是,某些生物物理模型中固有的不确定性使参数估计不稳定[22]。此外,准确的拟合并不一定证明基本的生物物理模型是合理的,并且估计的模型参数可能在生物物理上毫无意义[23,24]。由于数学并发症而排除了生物物理模型之类的微妙效果,例如神经突的起伏[11,20,25]。除了简化的几何模型带来的误差外,某些假设的有效性(例如GPA)仍然未知[23,26]。此外,几种信号表达式的有效性机制取决于微结构长度尺度[27]。体素可能表现出多长度尺度(例如,各种SOMA RADII),因此不同的有效性制度可以逐渐共存或逐渐出现[24],从而使全面的模型验证变得困难。
计算社会科学(CSS)的实践通常依靠人标记的数据来调查监督的文本分类器。我们评估了研究人员使用来自生成大语言模型(LLM)的替代培训标签增强或替换人类生成的培训数据的潜力。我们介绍了推荐的工作流程,并通过复制14个分类任务和测量性能来测试此LLM应用程序。我们采用了来自高影响力期间CSS文章的新型英语文本分类数据集。由于这些数据集存储在受密码保护的档案中,因此我们的分析不太容易受到污染问题。对于每项任务,我们将使用GPT-4标签的监督分类器进行了比较,并用人类注释进行了微调的分类器,并与GPT-4和Mismtral-7b的标签进行了微调,并以较少的镜头在上下文中学习。我们的发现表明,在LLM生成的标签上微调的监督分类模型与通过人类注释者的标签进行了微调的模型相当。使用LLM生成标签的微调模型可以是构建监督文本分类器的快速,高效且具有成本效益的方法。
抽象访问磁共振成像(MRI)对相同受试者进行扫描,包括各种对比度和野外强度,对于涉及涉及监督图像翻译的大脑研究至关重要,以预测缺失或无法获得的MRI数据。但是,涵盖低场和高场的此类数据集稀缺。为了弥合此间隙,我们提出了一个半合成的数据集,包括在1.5t和3t的T1,T2和PD中,在同一受试者的T1,T2和PD对比度中,在T1,T2和PD对比度上有一个半合成的数据集。我们还以2维格式呈现它,使其与广泛的模型兼容。我们使用评估指标以及基于形态的方法评估了我们提出的数据集,并使用我们的数据集在不同应用程序中展示了基于U-NET的架构的性能。最后,我们发布数据集,以促进涉及多对比MR图像翻译的未来研究。
最近基于深度学习的多视图人检测(MVD)方法在现有数据集上显示出令人鼓舞的结果。但是,当前方法主要在具有数量有限的多视图框架和固定相机视图的小型单个场景上进行培训和评估。结果,这些方法可能不可行,可以在更大,更复杂的场景中检测出严重的阻塞和摄像机误差错误。本文着重于通过开发有监督的观点加权方法来改善多视图人的检测,该方法可以更好地融合大型场景下的多相机信息。此外,还采用了大型合成数据集来增强模型的概括性,并实现了更实际的评估和比较。通过简单的域适应技术进一步证明了模型在新测试场景上的性能。实验结果证明了我们方法在实现有希望的跨场所多视角人检测表现方面的有效性。
。cc-by-nc 4.0国际许可(未获得同行评审证明),他授予Biorxiv授予Biorxiv的许可,以永久显示预印本。这是该预印本版本的版权持有人,该版本发布于2021年10月29日。 https://doi.org/10.1101/2021.10.26.466019 doi:biorxiv Preprint
申请人的证明:我声明我是该表格上提到的人,并且我(凭证的申请人)所需的所有信息都是完整而准确的,这是我的最大知识和信念。此外,我声明,完成了我(以及仅此信息)所需的信息后,将表格转发给相关的第三方,以完成他们所要求的信息。我还宣布,据我所知,相关的第三方(而不是我的申请人)向安全与专业服务部提供了完整的表格。最后,我声明我知道未能提供所请求的信息,对与我的凭据申请有关的任何实质性错误陈述和/或提供任何实质性虚假信息可能会导致凭证申请处理延迟;拒绝,撤销,停职或限制我的资格;或其任何组合;或法律可能提供的其他罚款。通过在下面签名,我表示我已经阅读并理解上述声明。
摘要 - 在太阳粒子事件(SPE)的几个小时或几天内,宇宙辐射的强度可能在五个数量级上有所不同,从而增加了多个数量级的空间应用中单事件Upsets(SEU)的概率(SEU)。因此,至关重要的是要尽早检测SEU速率变化,以确保及时激活辐射硬化措施。在本文中,提出了用于预测IN-FIRKIT SEU变化的硬件加速器,以预测SPE。嵌入的片上SRAM用作实时粒子检测器。专用硬件加速器实现了监督的机器学习模型,以预测SRAM SEUS提前一个小时,每小时在SPE和正常条件下对SEU变化进行细粒度的小时跟踪。整个设计旨在用于在空间应用中采用的高度可靠和自适应的多处理系统。因此,目标系统可以在高辐射水平发作之前驱动适当的辐射硬化机制。
18 F-氟脱氧葡萄糖 (FDG) 正电子发射断层扫描 (PET) 是神经退行性疾病领域最通用且最具成本效益的神经影像学生物标志物之一。事实上,这种生物标志物已广泛应用于帕金森病 (PD) 患者以及非典型帕金森病 (APD) 患者的早期鉴别诊断、临床相关性、疾病进展和治疗反应的客观评估,包括多系统萎缩 (MSA)、进行性核上性麻痹 (PSP) 和皮层基底节变性 (CBD) (1-5)。区域和脑网络生物标志物均用于基于 FDG PET 提供的葡萄糖代谢均值和方差信息的转化医学临床和研究应用。尽管过去十年取得了巨大成就,但在早期临床阶段区分 PD 与任何形式的 APD 仍然是一个挑战。
传统的监督学习在很大程度上依赖于人类通知的数据集,尤其是在渴望数据的神经方法中。然而,由于特定的域知识和大型集合,由于多标签的关系提取,尤其是多标签任务,例如文档级关系提取,在完全手动注释中构成挑战。因此,我们解决了多标签的积极 - 未标记学习(MLPUL)问题,其中只有一部分积极的类别被注释。我们提出了部分符合分类(MLPAC)的混合学习者,这是一个基于RL的框架,结合了增强学习的探索能力和监督学习的剥削能力。跨各种任务的实验性恢复,包括文档级别的关系提取,多标签图像构造和二进制PU学习,证明了我们框架的概括和有效性。