摘要。脑电图 (EEG) 分析任务对于脑机接口 (BCI) 的发展至关重要。然而,要达到开发稳健、有用的 BCI 的目标,很大程度上取决于 BCI 理解神经动态的速度和准确性。为了实现这一目标,本文详细介绍了预训练视觉变换器 (ViT) 与时间卷积网络 (TCNet) 的集成,以提高 EEG 回归的精度。这种方法的核心在于利用 ViT 的顺序数据处理优势以及 TCNet 的卓越特征提取能力,显着提高 EEG 分析的准确性。此外,我们分析了如何构建最佳补丁以供注意力机制分析的重要性,以平衡速度和准确性。我们的结果表明,回归准确度显著提高,EEGEyeNet 的绝对位置任务的均方根误差 (RMSE) 从 55.4 降至 51.8,优于现有的最先进模型。在不牺牲性能的情况下,我们将该模型的速度提高了一个数量级(最高可提高 4.32 倍)。这一突破不仅为 EEG 回归分析树立了新的标杆,还为未来将 Transformer 架构与针对不同 EEG 数据集的专门特征提取方法相结合的研究开辟了新途径。
表观遗传年龄预测因子是Horvath的表观遗传钟1,这是一个统计预测模型,在353 CpG位点使用DNAM至1个预测年龄。2种训练表观遗传时钟的标准方法涉及几个关键步骤:(i)从具有不同背景的个体3个个体的生物样本中收集生物样本; (ii)提取DNA并进行DNA甲基化分析; (iii)进行数据预处理4个程序,例如缺少数据插补,离群值删除和数据归一化; (iv)采用特征筛选方法5来识别相关的CPG站点,这些位点可预测年龄或与衰老过程相关; (v)将高维6回归模型与弹性净罚款拟合; (vi)在独立的测试数据集上评估模型性能,以验证其7个准确性和鲁棒性。8尽管有完善的构造表观遗传时钟的管道,但其中大多数仅提供点平均预测1,2,5。9
脑网络因其能够更好地表征神经和精神疾病中的脑动态和异常而受到越来越多的关注。近年来,深度学习取得了巨大的成功。许多人工智能算法,尤其是图学习方法,已被提出用于分析脑网络。现有图学习方法的一个重要问题是这些模型通常不易解释。在本研究中,我们提出了一种可解释的脑网络回归分析图学习模型。我们将这个新框架应用于人类连接组计划 (HCP) 的受试者,以预测多个成人自我报告 (ASR) 分数。我们还使用其中一个 ASR 分数作为示例,说明如何使用我们的模型识别回归过程中的性别差异。与其他最先进的方法相比,我们的结果清楚地证明了我们的新模型在有效性、公平性和透明度方面的优越性。
机器学习(ML)算法正在各个行业中出现,作为传统数据回归方法的强大补充/替代方案。主要原因是,与确定性模型不同,即使没有详细的现象学知识,它们也可以使用。毫不奇怪,在传热应用中也探索了ML算法的使用。在处理复杂几何形状和潜在现象的系统中特别感兴趣(例如流体相变,多相流量,大量结垢堆积)。然而,传热系统提出了需要解决的特定挑战,例如高质量数据的稀缺性,已发表的数据源之间的不一致,输入的复杂(且经常相关)的影响,培训和测试集之间的数据拆分以及有限的划线能力,无法进行统一条件。试图克服这些挑战中的一些,更重要的是,为了提供系统的方法,本文回顾并分析了ML算法在传热应用中的应用中的过去努力,并提出了将其部署的回归框架以估算关键数量(例如传热系数),用于改进热交换器的设计和操作。该框架由六个步骤组成:i)数据预处理,ii)特征选择,iii)数据分裂理念,iv)训练和测试,v)调整超参数,而VI)具有特定指标的性能评估,以支持准确且可靠的模型的选择。相关案例研究涉及缩合传热系数在微囊管中的估计来说明所提出的框架。根据其估计和外推能力对两种数据驱动算法,深神经网络和随机森林进行了测试和比较。结果表明,与过去研究中提出的众所周知的半经验相关性相比,ML算法在预测传热系数方面通常更准确,其中最合适的ML模型的平均绝对误差为535 [𝑊𝑚2𝐾-1],与使用1061 [𝑊𝑚22-−1]的误差相比,与使用误差相比。在外推方面,所选的ML模型的平均绝对误差为1819 [𝑊𝑚2𝐾-1],而相关性为1111 [𝑊𝑚2𝐾-1],表明使用半经验模型的劣势,尽管对比较并不完全适合,但鉴于相关性不适合使用。此外,功能选择还启用了仅取决于可能与目标变量最重要的功能的更简单的模型。需要特别注意,因为部署这些模型时会遇到的过度拟合和有限的外推能力是常见的困难。
摘要。我们研究了形状约束(SC)的添加及其在符号识别步骤(SR)的参数识别步骤中的考虑。sc是一种将有关未知模型函数形状的先验知识引入SR的手段。与以前在SR中探索过SC的工作不同,我们建议在使用基于梯度的NU-MERIMILICE优化的参数识别期间最大程度地减少SC违规行为。我们测试了三种算法变体,以评估其在识别合成生成数据集的三个符号表达式时的性能。本文研究了两种基准方案:一个具有不同噪声水平的基准,另一个具有不同的培训数据。结果表明,当数据稀缺时,将SC纳入表达搜索特别有益。与仅在选择过程中使用SC相比,我们在参数识别期间最小化违规行为的方法在我们的某些测试用例中显示出具有统计学意义的好处,在任何情况下都没有明显更糟。
方法:在这项研究中,我们确定了24例与SLC6A1相关疾病的患者组成的发育回归模式,并评估了与回归相关的临床特征。我们回顾了与SLC6A1相关疾病患者的病历,并将受试者分为两组:1)回归组和2)对照组。我们描述了发育回归的模式,包括在回归之前是否有触发因素,多次回归发作以及是否恢复了技能。我们评估了回归和对照组之间临床特征的关系,包括人口统计学因素,癫痫发作,发育里程碑获取,胃肠道问题,睡眠问题,自闭症谱系障碍和行为问题。
对电池健康的了解非常重要。它提供了对给定系统能力的洞察力,并允许操作员更效率地计划。,但是测量电池的健康状态(SOH)是不同的,并且需要时间。更重要的是,需要将电池从操作中取出,以正确分析。本文旨在根据易于获取的操作数据评估预测电池健康的提议的线性回归方法。主要预测变量是电压偏差,这是电池电压/放电周期期间电池电压的特征。使用此方法,唯一需要提取电池的时间就是收集培训数据。然后,该模型可用于类似的电池来预测其SOH。这意味着这些系统永远不需要停止,从而提高生产率。本文的结果是所使用的数据不适合线性回归。残留物的异质性和非正态性存在问题,但主要是电压偏差与SOH之间关系的估计参数与已建立的理论相反。不能忽略。因此,估计的模型不应用于预测SOH。为了实现准确的SOH预测的目标,应进行更多的研究并使用更好的样本。
摘要。本文提出了一种新的贝叶斯回归实现,该回归具有标量协变量的多维数组(张量)响应。最近,各个学科中出现了复杂的数据集,迫切需要设计具有张量值响应的回归模型。本文考虑了一种这样的应用,即在存在张量值大脑图像和标量预测因子的情况下,在 fMRI 实验中检测神经元激活。此应用的总体目标是识别由外部刺激激活的大脑空间区域(体素)。在此类应用和相关应用中,我们建议将所有细胞(或大脑激活研究中的体素)的响应一起回归为标量预测因子的张量响应,以考虑张量响应中固有的结构信息。为了估计具有适当细胞特定收缩的模型参数,我们提出了一种新的张量结构化回归系数多向断棍收缩先验分布,从而能够识别与预测因子相关的细胞。本文的主要创新之处在于,当细胞数量增长速度快于样本大小时,对张量响应回归中提出的收缩先验的收缩特性进行了理论研究。具体而言,在温和的假设下,张量回归系数的估计值在 L2 意义上逐渐集中在真实稀疏张量周围。各种模拟研究和脑激活数据分析从经验上验证了所提出的模型在细胞级参数估计和推断方面的良好性能。
对耦合和因果关系的时间和频域度量的评估依赖于线性多元过程的参数表示。时间序列之间时间依赖性的研究基于矢量自回旋模型的识别。通过通过普通最小二乘(OLS)估计器解决的回归问题的定义来实现此过程。但是,其准确性受到数据点不足的强烈影响,并且并不能保证稳定的解决方案。要克服这个问题,可以使用受惩罚的回归技术。这项工作的目的是将OLS的行为与不同实验条件下连通性分析的不同惩罚回归方法进行比较。偏见,用于此目的的网络结构重建和计算时间的重建精度。通过模拟数据在不同量的可用数据示例中实现不同的地面真实网络的模拟数据测试了不同的惩罚回归。然后,将方法应用于从执行运动成像任务的健康志愿者中记录的真实脑电图信号(EEG)。惩罚的回归优于仿真设置中的OLS。实际脑电图数据上的应用程序显示了如何使用从大脑网络中提取的功能,即使在数据匮乏的条件下,也可以在两个任务之间进行分解。惩罚回归技术可用于大脑连通性估计,并且可以根据线性假设克服经典OLS施加的局限性来计算所有连接性估计器。