摘要 - 基于卷积神经网络(CNN)的深度学习模型已用于对阿尔茨海默氏病进行分类或从T1加权大脑MRI扫描中推断痴呆症的严重程度。在这里,我们研究了添加扩散加权MRI(DMRI)作为这些模型的输入的值。在这一领域进行了许多研究,重点介绍了特定数据集,例如阿尔茨海默氏病神经影像学计划(ADNI),该计划评估了北美人(主要是欧洲血统)的人,因此我们研究了对ADNI培训的模型,该模型如何推广到来自印度(Nimhans Cohort)的新人口数据集。我们首先通过预测“大脑时代”来基准我们的模型 - 从其MRI扫描中预测一个人的年龄并继续进行广告分类的任务。我们还评估了在训练CNN模型之前使用3D CycleGAN方法来协调成像数据集的好处。我们的实验表明,在大多数情况下,在协调后的分类性能会提高,并且DMRI作为输入的性能更好。
抽象的智能移动性和自动驾驶汽车(AV),必须非常精确地了解环境,以保证可靠的决策,并能够将公路部门获得的结果扩展到铁路等其他领域。为此,我们基于Yolov5引入了一个新的单阶段单眼3D对象检测卷积神经网络(CNN),该卷积神经网络(CNN)致力于公路和铁路环境的智能移动性应用。要执行3D参数回归,我们用混合锚盒替换了Yolov5的锚点。我们的方法有不同的模型大小,例如yolov5:小,中和大。我们提出的新模型已针对实时嵌入DED约束(轻巧,速度和准确性)进行了优化,该模型利用了被分裂注意的改进(SA)卷积所带来的改进(称为小型分裂注意模型(SMALL-SA)。为了验证我们的CNN模型,我们还通过利用视频游戏Grand Theft Auto V(GTAV)来引入一个新的虚拟数据集,以针对道路和铁路环境。我们在Kitti和我们自己的GTAV数据集上提供了不同模型的广泛结果。通过我们的结果,我们证明了我们的方法是最快的3D对象检测,其准确性结果接近Kitti Road数据集上的最新方法。我们进一步证明,GTAV虚拟数据集上的预训练过程提高了实际数据集(例如Kitti)的准确性,从而使我们的方法比最先进的方法获得了更高的准确性,该方法具有16.16%的3D平均均衡性精度,而硬CAR检测的推理时间为11.1 MS/rtx 3080 gpu的推理时间为11.1 s/simage。
图像字幕(自动生成图像的描述标题的任务)由于其潜力弥合视觉和语言理解之间的差距而引起了极大的关注。随着深度学习的进步,尤其是用于序列产生的特征提取和复发神经网络(RNN)的卷积神经网络(CNN),神经图像标题发生器在产生的字幕的质量和流利程度上都取得了重大进展。本文调查了图像字幕技术的演变,从传统模型到现代深度学习方法,包括使用变压器和多峰模型。我们讨论了关键组件,例如图像表示,字幕生成和注意机制,并检查大规模数据集和评估指标的作用。尽管取得了长足的进步,但在语义理解,上下文相关性和处理偏见等领域仍存在挑战。这项调查以研究目前的研究状态并概述了该领域的潜在方向,包括探索零射击学习,多模式集成以及改善字幕模型的概括。
准确的分子特性预测对于药物发现和计算化学至关重要,促进了有希望的化合物并加速治疗性发育的鉴定。传统的机器学习以高维数据和手动特征工程的速度失败,而现有的深度学习方法可能不会捕获复杂的分子结构,而留下了研究差距。我们引入了深CBN,这是一个新型框架,旨在通过直接从原始数据中捕获复杂的分子表示来增强分子性质预测,从而提高了准确性和效率。我们的方法论结合了卷积神经网络(CNN)和biforter注意机制,同时采用了前向算法和反向传播。该模型分为三个阶段:(1)功能学习,使用CNN从微笑字符串中提取本地特征; (2)注意力完善,通过向前前锋算法增强的Biforter模块捕获全球环境; (3)预测子网调整,通过反向传播进行微调。对基准数据集的评估 - 包括TOX21,BBBP,SIDE,Clintox,Clintox,Bace,HIV和MUV,表明深-CBN达到了近乎完美的ROC-AUC分数,显着超过了最好的State-Art-Art方法。这些发现证明了其在捕获复杂分子模式的有效性,提供了一种强大的工具来加速药物发现过程。
我们报告了能够对齐多个核苷酸序列的卷积变压器神经网络。神经网络基于图像分割中常用的U-NET,我们采用了该神经网络将其用于将未对准序列转换为对齐序列的U-NET。对于对齐场景,我们的ALI-U-NET神经网络已经接受过培训,在大多数情况下,它比MAFFT,T-Coffee,Muscle和Clustal Omega等程序更准确,同时比单个CPU核心上的类似准确的程序快得多。的限制是,神经网络仍针对某些对齐问题进行了专门训练,并且对于以前从未见过的差距分布而表现不佳。此外,该算法当前与48×48或96×96核苷酸的固定尺寸比对窗口一起工作。在此阶段,我们将研究视为概念证明,确信目前的发现可以扩展到更大的一致性,并在不久的将来将其扩展到更复杂的一致性方案。
随着个体通过数字平均值的显着相互作用的显着增加,图中节点的聚类已成为分析大型和复杂网络的一种基础方法。在这项工作中,我们提出了深层的位置模型(DEEPLPM),这是一种端到端的生成聚类方法,将广泛使用的潜在位置模型(LPM)与图形卷积网络(GCN)编码策略相结合。此外,还引入了一种原始估计算法,以通过变异推理和使用随机梯度下降进行图形重建来整合后聚类概率的明确优化。在模拟场景上进行的数值实验突出了DeepLPM自养生的能力,以选择簇数量的较低限制,这表明其聚类能力与最先进的方法相比。最后,DEEPLPM进一步应用于Merovingian Gaul的教会网络和引文网络Cora,以说明探索大型且复杂的现实世界网络的实际兴趣。
脉搏率(PR)是评估一个人健康的最重要标记之一。随着对长期健康监测的需求不断增长,使用成像光电学(IPPG)对非接触式PR估计的关注非常关注。这种非侵入性技术基于肤色细微变化的分析。尽管可以改善IPPG,但现有算法容易受到较不受约束的场景(即头部移动,面部表情和环境条件)。在本文中,我们提出了一个新颖的端到端时空网络,即X-ippgnet,直接从面部视频记录中直接进行瞬时PR估计。不像大多数现有系统一样,我们的模型从头开始学习IPPG概念,而无需结合任何先验知识或通过提取血液体积脉冲信号的提取。受Xception网络体系结构的启发,颜色通道解耦用于学习其他照相学信息信息,并概念地降低计算成本和内存重新质量。此外,X-ippGnet可以从短时间窗口(2秒)中预测脉搏率,该脉冲率具有较高且明显的脉搏率的优点。实验结果揭示了在所有条件下的高性能,包括头部运动,面部表情和肤色。我们的AP-PRACH明显优于三个基准数据集上的所有当前最新方法:MMSE-HR(MAE = 4。10; RMSE = 5。32; r = 0。85),ubfc-rppg(Mae = 4。99; RMSE = 6。26; r = 0。67),mahnob-hci(Mae = 3。17; RMSE = 3。93; r = 0。88)。
摘要 - 如今,深度学习方法在复杂的任务中起着关键作用,例如提取图像的有用特征,分割和语义分类。这些方法对近年来花类型分类具有重大影响。在本文中,我们正在尝试使用强大的深度学习方法对102种花种类进行分类。为此,我们使用了使用Densenet121体系结构的转移学习方法来对牛津102花数据集进行分类。在这方面,我们试图微调我们的模型,以实现对其他方法的更高准确性。,我们通过标准化图像和调整图像进行了预处理,然后将其喂入我们的微调预审计模型。我们将数据集划分为三组火车,验证和测试。我们可以达到50个时期的98.6%的准确性,这比研究中同一数据集的其他基于深度学习的方法更好。
摘要:汽车行业中的人工智能(AI)允许汽车制造商通过整合AI驱动的高级驾驶员辅助系统(ADAS)和/或自动化驾驶系统(ADS)(例如Traffiffififififient识别(TSR)系统),从而为智能和自动驾驶汽车提供智能和自动驾驶汽车。现有的TSR解决方案集中在他们认识的某些标志上。出于这个原因,提出了一种TSR方法,其中涵盖了更多的道路标志类别,例如警告,监管,强制性和优先符号,以构建一个智能和实时系统,能够分析,检测和分类为正确类别。提出的方法基于对不同的特征符号检测(TSD)和Traffim符号分类(TSC)的概述,旨在在准确性和处理时间方面选择最佳的特征。因此,提出的方法将HAAR级联技术与深CNN模型分类结合在一起。开发的TSC模型在GTSRB数据集上进行了培训,然后在各种路标上进行了测试。所达到的测试精度率达到98.56%。为了提高分类性能,我们提出了一个新的基于注意力的深卷积神经网络。由于获得的测试准确性和F1测量率分别达到99.91%和99%,因此所达到的结果比其他符号分类研究中存在的结果更好。在Raspberry Pi 4板上评估并验证了开发的TSR系统。实验结果证实了建议的方法的可靠性。