摘要 目的 . 脑机接口 (BCI) 有可能为患有神经系统疾病、说话肌肉无力的患者的言语能力保留或恢复。然而,成功训练低延迟语音合成和识别模型需要将神经活动与预期的语音或声学输出以高时间精度对齐。这对于无法发出可听见的言语的患者来说尤其具有挑战性,因为没有可以用于精确定位与言语同步的神经活动的基本事实。方法 . 在本研究中,我们提出了一种用于神经语音活动检测 (nVAD) 的新型迭代算法,称为迭代对齐发现动态时间规整 (IAD-DTW),该算法将 DTW 集成到深度神经网络 (DNN) 的损失函数中。该算法旨在发现患者的皮层脑电图 (ECoG) 神经反应与他们在收集数据以训练 BCI 解码器进行语音合成和识别期间说话尝试之间的对齐方式。主要结果 .为了证明该算法的有效性,我们测试了它在预测健全且有完整言语能力的患者产生的声音信号的开始和持续时间的准确性,这些患者正在接受癫痫手术的短期诊断性 ECoG 记录。我们通过随机扰动神经活动与所有言语开始和持续时间的初始单一估计之间的时间对应关系来模拟缺乏基本事实的情况。我们检查了模型克服这些扰动以估计基本事实的能力。在这些模拟中,即使在语音和静默之间存在最大错位的情况下,IAD-DTW 的性能也没有明显下降(准确度绝对下降 < 1%)。意义。IAD-DTW 计算成本低,并且可以轻松集成到现有的基于 DNN 的 nVAD 方法中,因为它只与最终的损失计算有关。这种方法使得使用无法产生可听言语的患者(包括患有闭锁综合症的患者)的 ECoG 数据来训练语音 BCI 算法成为可能。
- 我们知道,𝐻∗≥𝐻𝐻≥𝐻=𝑉=𝑉=𝑉 - 让𝜋+1 =𝑎𝑟𝑔𝑚𝑎𝑥+1 =𝑎𝑟𝑔𝑚𝑎𝑥𝑎+𝑎+𝛾𝑇𝑎𝑎𝑎𝑎𝑛𝑉𝑎𝐻𝐻𝐻𝐻𝐻∗ ∗ = ∗ =𝑉=𝑅=𝑅=++1+1+1+1+1+1+1+1+1+1+𝐼𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑛+1𝑉𝑉 - 因此𝑉+1 =𝐼𝐼𝑛+1 -1 - 𝑛++1≥𝑉
其唇缘。传递应力与唇缘张开之间的关系是材料的一种特性,称为软化曲线。直接测量该函数极其困难,因此,为了确定它,采用了间接程序。它们包括将真实曲线近似为依赖于多个参数的分析曲线,并通过实验确定这些参数[5,6]。最显着的简化模型之一是双线性曲线,由两个直线段组成,取决于三个参数:粘结阻力、断裂能和两个双线性段之间的分离点坐标。该曲线可以可靠地预测混凝土行为[6,13]。在[14]中可以找到一种不同的方法,其中软化曲线由一组材料参数参数化,这些参数确定为最小化实验结果和数值结果之间的差异。在当前工作中,应用迭代算法,该算法
图像注册在计算机视频中找到了多种应用,例如与立体视觉,模式识别和运动分析的图像匹配。不断增加,现有的图像注册技术往往是昂贵的。此外,它们通常无法处理图像的旋转或其他扭曲。在本文中,我们提出了一种新的图像注册技术,该技术使用空间强度梯度信息来指导搜索最佳匹配的位置。通过考虑有关图像的更多信息,该技术能够找到与图像比较少得多的两个图像之间的最佳匹配,这些技术比以某种固定顺序检查了注册位置的技术要少得多。我们的技术利用了以下事实:在许多应用中,这两个图像已经在近似注册中。可以将此技术推广以处理图像的任意线性扭曲,包括旋转。
当前的药物发现模式在很大程度上侧重于高通量筛选 (HTS),这种方法是针对目标筛选大量化合物库以确定合适的开发起点。1,2 典型 HTS 的命中率相对较低,在大多数测定中通常低于 1%,3 需要大型化合物库才能产生足够数量的命中,以使药物开发计划得以推进。这些库的大小导致筛选成本高昂,并且活动的准备时间较长。筛选活动的成本达到数十万美元并不罕见。随着筛选中出现更多与疾病相关但也更复杂的表型读数, 4 每种筛选化合物的成本往往会增加。根据我们的经验,每孔超过 1.50 美元的成本并不罕见。显然,需要一些方法来提高这些屏幕的回报率。此外,现在比以往任何时候都有更多的化学空间可以轻易购买,并且人们希望查询越来越多的化学物质。
对于使用模型检查技术进行的系统验证,基于二元决策图 (BDD) 的符号表示通常有助于解决众所周知的状态空间爆炸问题。基于符号 BDD 的表示也被证明可以成功分析出现的系统族,例如,通过可配置参数或遵循面向特征的建模方法。此类系统族的状态空间面临参数或特征数量的额外指数爆炸。众所周知,有序 BDD 中变量的顺序对于模型表示的大小至关重要。特别是对于从现实世界系统自动生成的模型,由于变量顺序错误,族模型甚至可能无法构建。在本文中,我们描述了一种称为迭代变量重新排序的技术,它可以构建大规模的族模型。我们通过一个具有冗余机制的飞机速度控制系统来证明我们的方法的可行性,该系统以概率模型检查器 P RISM 的输入语言建模。我们表明,标准重新排序和动态重新排序技术分别由于内存和时间限制而无法构建系列模型,而新的迭代方法则成功生成了符号系列模型。
1.引言多光谱图像通常提供互补信息,如可见光波段图像和红外图像(近红外或长波红外)。有强有力的证据表明,融合的多光谱图像提高了解释的可靠性(Rogers & Wood,1990;Essock 等人,2001);而彩色多光谱图像则提高了观察者的表现和反应时间(Toet 等人,1997;Varga,1999;Waxman 等人,1996)。计算机可以自动分析灰度融合图像(用于目标识别);而彩色图像则易于人类用户解释(用于视觉分析)。想象一下,夜间导航任务可以由配备多传感器成像系统的飞机执行。分析组合或合成的多传感器数据将比同时监测多光谱图像(如可见光波段图像(例如,图像增强,ll)、近红外(NlR)图像和红外(lR)图像)更方便、更有效。在本章中,我们将讨论如何使用图像融合和夜视彩色化技术合成多传感器数据,以提高多传感器图像的有效性和实用性。预计这种图像合成方法的成功应用将提高遥感、夜间导航、目标检测和态势感知的性能。这种图像合成方法涉及两种主要技术,即图像融合和夜视彩色化,分别在下面进行回顾。图像融合通过整合互补数据来组合多源图像,以增强各个源图像中明显的信息,并提高解释的可靠性。这样可以得到更准确的数据(Keys et al.,1990)并提高实用性(Rogers & Wood,1990;Essock et al.,1999)。此外,据报道,融合数据提供了更为稳健的操作性能,例如增加了置信度、减少了歧义性、提高了可靠性和改进了分类(Rogers & Wood,1990;Essock et al.,2001)。图像融合的一般框架可以在参考文献(Pohl & Genderen,1998)中找到。在本章中,我们的讨论重点是像素级图像融合。对融合图像质量的定量评估对于客观比较各个融合算法非常重要,它可以测量有用信息的数量和融合图像中引入的伪影数量。
摘要。可变形图像配准是医学图像分析中的关键步骤,用于找到一对固定图像和运动图像之间的非线性空间变换。基于卷积神经网络 (CNN) 的深度配准方法已被广泛使用,因为它们可以快速、端到端地执行图像配准。然而,这些方法通常对具有较大变形的图像对性能有限。最近,迭代深度配准方法已被用来缓解这一限制,其中变换以由粗到细的方式迭代学习。然而,迭代方法不可避免地延长了配准运行时间,并且倾向于在每次迭代中学习单独的图像特征,这阻碍了利用这些特征来促进以后的迭代配准。在本研究中,我们提出了一种用于可变形图像配准的非迭代由粗到细配准网络 (NICE-Net)。在 NICE-Net 中,我们提出了:(i) 单次深度累积学习 (SDCL) 解码器,可以在网络的单次(迭代)中累积学习从粗到细的转换;(ii) 选择性传播特征学习 (SFL) 编码器,可以学习整个从粗到细配准过程的常见图像特征并根据需要选择性传播这些特征。在 3D 脑磁共振成像 (MRI) 的六个公共数据集上进行的大量实验表明,我们提出的 NICE-Net 可以胜过最先进的迭代深度配准方法,而只需要与非迭代方法类似的运行时间。
在在线广告中,广告商通常通过使用需求端平台(DSP)提供的自动铸造工具参加广告拍卖的广告广告机会。当前的自动铸造算法通常采用强化学习(RL)。然而,由于安全问题,大多数基于RL的自动竞标政策都经过模拟培训,从而在在线环境中部署时会导致性能退化。要缩小此差距,我们可以并行部署多个自动竞标代理,以收集大型交互数据集。然后可以利用离线RL算法来培训新的政策。随后可以部署训练有素的策略以进行进一步的数据收集,从而产生了迭代培训框架,我们将其称为迭代的离线RL。在这项工作中,我们确定了这种迭代离线RL框架的瓶颈,该框架源自离线RL算法固有的保守主义引起的无效探索和剥削。为了克服这种瓶颈,我们提出了轨迹探索和外观(TEE),它引入了一种新颖的数据收集和数据利用方法,用于从轨迹有偏见的迭代离线RL。此外,为了在保留TEE的数据集质量的同时确保在线探索的安全性,我们建议通过自适应行动选择(SEAS)进行安全探索。在阿里巴巴展示广告平台上的离线实验和现实世界实验都证明了我们提出的方法的有效性。
人类视力和自然语言共有的基本特征是它们的组成性质。,尽管大型录音和语言进行了贡献,但最近的调查发现,大多数(如果不是全部)我们最先进的视觉语言模型在构图中挣扎。他们无法分辨“白人面对黑人的女孩”和“黑人面对白人的女孩”的图像。更重要的是,先前的工作表明,构图并非随着规模而产生:较大的模型尺寸或培训数据无济于事。本文开发了一种新的迭代培训算法,该算法将组成性构成。我们借鉴了数十年来确定文化传播(需要教新一代的需求)的认知科学研究,这是必要的归纳性,这激励了人类发展构图的领域。具体来说,我们将视觉语言对比度学习为视觉代理和语言代理之间的刘易斯信号游戏,并通过迭代地重置训练过程中的一个特工的权重来操作文化转移。在每次迭代之后,这种训练范式引起了“更易于学习”的表示形式,即构图语言的属性:例如我们在CC3M和CC12M上训练的模型将标准夹提高了4.7%,在糖筛基准中以4.0%的速度提高了4.0%。
