本文的本版本已被接受以供出版,经过同行审查(适用),并受到Springer Nature的AM使用条款的约束(https://www.springernature.com/gp/gp/open-research/policies/accepted-manuscript-terms),但并不是记录和未反映后的记录和任何更正的版本。记录版本可在线获得:http://dx.doi.org/10.1007/s00500-019-04006-2。
社交活动可能会对参与协作社交情境的人的大脑产生影响或反应。本研究评估了一种新方法 Tigramite,用于对此类情境中人的前额皮质 (PFC) 之间的定向因果关系进行时间域分析。实验情境采用超扫描脑电图,个人以手指敲击节奏相互引导和跟随。这项结构化任务持续时间长,前额皮质中发生脑间因果反应的可能性很高。Tigramite 是一种基于图形的因果发现方法,用于识别观察时间序列中的定向因果关系。Tigramite 用于分析 PFC 内部和之间的定向因果关系。在社交互动过程中,可以检测到大脑内部和之间的显著定向因果关系。这是 Tigramite 可以揭示超扫描脑电图时间序列中脑间和脑内定向因果效应的第一个经验证据。这一发现有望利用 Tigramite 在时间域的脑电图上进一步研究社交活动中神经网络的因果关系。
在能源系统建模中,获取基于天气的时间序列和大面积可再生能源的最大容量潜力是一个常见问题。存在具有开放 API 的网站,例如可用于此目的的 renewables.ninja(Pfenninger & Staffell, 2016;Staffell & Pfenninger, 2016),但它们难以用于本地执行(例如在集群环境中),并且仅限于非商业用途。此外,从设计上讲,它们既不公开底层数据集,也不公开用于获取时间序列的方法(此处称为转换函数/方法)。这使得它们不适合利用不同的天气数据集或探索替代转换函数。pvlib(Holmgren et al., 2018)适合本地执行并允许互换输入数据,但仅适用于光伏系统,且旨在用于单一位置建模。其他软件包,例如丹麦的 REatlas(Andresen 等,2015)面临可访问性障碍、基于专有代码、缺少文档并且输入的灵活性受到限制。
AU:请确认所有标题级别均正确表示:我们如何才能弄清楚不同微生物在微生物群落中是如何相互作用的?为了结合理论模型和实验数据,我们经常将系统平均动力学的确定性模型与平均数据拟合。然而,在平均过程中,数据中的大量信息会丢失——而确定性模型可能无法很好地表示随机现实。在这里,我们基于实验和模型都是随机的想法开发了一种微生物群落推理方法。从随机模型开始,我们不仅推导出平均值的动力学方程,还推导出微生物丰度更高统计矩的动力学方程。我们使用这些方程来推断最能描述生物实验数据的相互作用参数的分布——从而提高可识别性和精度。推断出的分布使我们能够做出预测,同时也能区分相当确定的参数和现有实验数据无法提供足够信息的参数。与相关方法相比,我们推导出也适用于微生物相对丰度的表达式,使我们能够使用传统的宏基因组数据,并解释了随着时间的推移无法追踪单个宿主而只能追踪复制宿主的情况。
对随机和不规则抽样的时间序列进行建模是在广泛的应用中发现的一个具有挑战性的问题,尤其是在医学中。神经随机微分方程(神经SDE)是针对此问题的有吸引力的建模技术,它可以将SDE的漂移和扩散项与神经网络相关。但是,当前用于训练神经SDE的算法需要通过SDE动力学进行反向传播,从而极大地限制了它们的可扩展性和稳定性。为了解决这个问题,我们提出了轨迹流匹配(TFM),该轨迹以无模拟方式训练神经SDE,通过动力学绕过反向传播。TFM利用从生成建模到模型时间序列的流量匹配技术。在这项工作中,我们首先为TFM学习时间序列数据建立必要条件。接下来,我们提出了一个改善训练稳定性的重新聚集技巧。最后,我们将TFM适应了临床时间序列设置,从绝对性能和不确定性预测方面,在四个临床时间序列数据集上的性能提高了,这是在这种情况下的关键参数。
1哥伦比亚大学欧文大学系统生物学系,美国纽约,美国2耶鲁癌症生物学研究所,耶鲁大学,西黑文,美国康涅狄格州西黑文,美国3现在的地址:美国纽约州塔里敦,美国4 J.P. Sulzberger哥伦比亚哥伦比亚哥伦比亚哥伦比亚哥伦比亚大学Irving Medical Scoriest,New York ny ny ny ny trokinia ny ne n Y Y Y Y Y Y Y Y Y Y Y Y Y YE,美国4 J.P.美国纽约州6耶鲁大学医学院,美国康涅狄格州纽黑文市药理学系7哥伦比亚大学欧文大学医学中心,纽约,纽约,纽约,美国8赫伯特·欧文·欧文综合癌症中心,哥伦比亚大学欧文大学纽约,纽约,纽约,纽约州,美国9号,美国9号哥伦比亚分子生物学,哥伦比亚大学医学中心。哥伦比亚大学欧文医学中心,纽约,美国纽约†同等贡献
可靠的脑电图(EEG)信号获取对于医疗疾病,脑机构界面(BCIS)和神经科学研究至关重要。然而,心电图(ECG)和电解图(EOG)伪像经常污染EEG记录,损害数据质量和解释性。传统的删除方法可能会扭曲脑电图信号,或需要其他传感器进行ECG和EOG获取。本研究使用多元预测方法将删除伪像作为回归任务,从EEG数据本身重建ECG和EOG信号。我们的方法在两个独立数据集上进行了严格评估,用于ECG和EOG信号,并在不同个体的未见数据上进一步验证。使用平方误差(MSE),平均绝对误差(MAE)和峰值信噪比(PSNR)评估性能。我们的方法实现了与使用实际的ECG和EOG记录的常规方法相媲美的方法,证明了使用原始EOG记录清洁清洁的脑电图和脑电图之间的PSNR为39 dB。这使我们的方法成为经济高效且非侵入性的替代方案。这些发现提出了脑电图噪声过滤研究的有希望的新方向。
储层计算是一种强大的机器学习范例,可用于在线时间序列处理。由于其独特的高计算能力和低训练成本组合,它在混沌时间序列预测和连续语音识别等任务中达到了最先进的性能,这使它有别于传统训练的循环神经网络等替代方案,此外,它还适合在专用硬件中实现,有可能实现极其紧凑和高效的储层计算机。最近有人提出使用随机量子系统,利用量子动力学的复杂性进行经典时间序列处理。然而,在不干扰量子系统状态的情况下从量子系统中提取输出是有问题的,并且可以预期会成为此类方法的瓶颈。在这里,我们提出了一种受储层计算启发的方法,用于在线处理由量子信息组成的时间序列,从而避开测量问题。我们通过将两个典型的基准任务从经典储层计算推广到量子信息,并引入一个没有经典模拟的任务来说明其强大功能,其中训练一个随机系统来在从不直接交互的系统之间创建和分配纠缠。最后,我们讨论只有输入或只有输出时间序列是量子的部分概括。
摘要 — 以时间序列形式出现的信号测量是医学机器学习应用中最常见的数据类型之一。此类数据集通常规模较小,收集和注释成本高昂,并且可能涉及隐私问题,这阻碍了我们为生物医学应用训练大型、最先进的深度学习模型的能力。对于时间序列数据,我们可以用来扩展数据集大小的数据增强策略套件受到需要维护信号基本属性的限制。生成对抗网络 (GAN) 可以用作另一种数据增强工具。在本文中,我们提出了 TTS-CGAN,这是一种基于 Transformer 的条件 GAN 模型,可以在现有的多类数据集上进行训练并生成任意长度的特定于类的合成时间序列序列。我们详细阐述了模型架构和设计策略。我们的模型生成的合成序列与真实序列没有区别,可以用来补充或替换相同类型的真实信号,从而实现数据增强的目标。为了评估生成数据的质量,我们修改了小波相干性度量,以便能够比较两组信号之间的相似性,并进行了一个案例研究,其中使用合成数据和真实数据的混合来训练用于序列分类的深度学习模型。结合其他可视化技术和定性评估方法,我们证明 TTS-CGAN 生成的合成数据与真实数据相似,并且我们的模型比其他为时间序列数据生成构建的最先进的 GAN 模型表现更好。TTS-CGAN 源代码:github.com/imics-lab/tts-cgan
近年来,深度生成模型对工程和科学产生了深远的影响,彻底改变了图像和音频生成等领域,并提高了我们建模科学数据的能力。特别是,去噪扩散概率模型 (DDPM) 已被证明可以准确地将时间序列建模为复杂的高维概率分布。实验和临床神经科学也将受益于这一进步,因为准确建模神经生理时间序列,例如脑电图 (EEG)、皮层电图 (ECoG) 和局部场电位 (LFP) 记录及其合成生成可以实现或改进各种神经科学应用。在这里,我们提出了一种使用 DDPM 建模多通道和密集采样的神经生理记录的方法,该方法可以灵活地应用于不同的记录模式和实验配置。首先,我们表明 DDPM 可以为各种数据集 11 生成逼真的合成数据,包括不同的记录技术(LFP、ECoG、EEG)和物种(大鼠、猕猴、人类)。DDPM 生成的时间序列准确捕获单通道和多通道统计数据,例如频谱和 13 相位幅度耦合,以及细粒度和数据集特定特征,例如尖锐的波纹。14 此外,可以根据实验条件或大脑状态等其他信息生成合成时间序列。我们展示了 DDPM 在几种神经科学特定分析中的实用性和灵活性,例如大脑状态分类和缺失通道的归纳以改进神经解码。总之,DDPM 可以作为神经生理记录的精确生成模型,并且在概率生成合成时间序列以用于神经科学应用方面具有广泛的实用性。20