摘要:基于运动的脑机接口 (BCI) 很大程度上依赖于运动意图的自动识别。它们还允许患有运动障碍的患者与外部设备进行通信。提取和选择判别特征通常会增加计算机的复杂性,这是自动发现运动意图的问题之一。这项研究介绍了一种利用脑电图数据自动对二类和三类运动意图情况进行分类的新方法。在建议的技术中,原始脑电图输入直接应用于卷积神经网络 (CNN),而无需提取或选择特征。根据先前的研究,这是一种复杂的方法。建议的网络设计包括十个卷积层,后面是两个完全连接的层。由于其准确性高,建议的方法可用于 BCI 应用。
摘要 - 先前的研究证明了端到端深度学习对机器人导航的有效性,其中控制信号直接源自原始感觉数据。但是,大多数现有的端到端导航解决方案主要基于相机。在本文中,我们介绍了Tinylidarnet,这是一种基于自动赛车的基于轻量级的2D激光雷达的端到端深度学习模型。使用Tinylidarnet的第1辆汽车在第12场比赛中获得第三名,这表明了其竞争性能。我们会系统地分析其在未经训练的轨道和实时处理的计算要求上的性能。我们发现,基于Tinylidarnet的1D卷积Neu-ral网络(CNN)的体系结构显着胜过基于多层的多层感知器(MLP)体系结构。此外,我们表明它可以在低端微控制器单元(MCUS)上实时处理。
Blue Ashva Capital 是一家总部位于新加坡和印度的投资公司,支持可持续且盈利的企业,这些企业正在解决食品和农业、能源和环境、健康和保健以及货币和金融等领域的真正挑战。该公司旨在通过将资本、技术和市场联系在一起来培育企业。Blue Ashva Capital 在其印度和新加坡基金之间拥有超过 1 亿美元的基金,正在印度及其他地区积极部署资本。Blue Ashva 还运营着一个名为 Blue Ashva Labs 的深度技术孵化器,专注于将技术从实验室推向市场。一些重点领域包括绿色氢、制药 API、生物技术和电池回收。网站:www.blueashvacapital.com
对待精神状态的检测在神经反馈过程以及注意力缺陷和多动症(ADHD)中起着至关重要的作用。但是,检测方法的性能仍然不满意。挑战之一是为脑电图(EEG)数据找到适当的表示,该数据可以保留时间信息并保持空间拓扑特征。受到大脑 - 计算机界面(BCI)领域研究中的深度学习(DL)方法的启发,提出了提出了带有级联和平行卷积操作的3D卷积神经网络模型的EEG信号的3D表示。该模型利用了三个级联块,每个级联块由两个平行的3D卷积分支组成,以同时提取多尺度特征。在包含26名受试者的公共数据集上进行了评估,与对象内,受试者间和受试者自适应分类方案相比,所提出的模型的性能更好。这项研究证明了3D CNN模型检测细心状态的有希望的潜力。©2021 Elsevier Ltd.保留所有权利。
抽象的视觉检查有缺陷的轮胎后期生产对于人体安全至关重要,因为故障轮胎会导致爆炸,事故和生命损失。随着技术的进步,转移学习(TL)在许多计算机视觉应用中起着影响的作用,包括轮胎缺陷检测问题。但是,自动轮胎缺陷检测很难有两个原因。首先是复杂的各向异性多纹理橡胶层的存在。第二,没有用于缺陷检测的标准轮胎X射线图像数据集。在这项研究中,使用来自全球轮胎公司的新数据集提出了基于TL的轮胎缺陷检测模型。首先,我们收集并标记了数据集,该数据集由3366个X射线图像和20,000张合格轮胎的图像组成。尽管数据集涵盖了15种由不同的设计模式引起的缺陷,但我们的主要重点是二进制分类以检测缺陷的存在或不存在。该具有挑战性的数据集分别分别为70%,15%和15%的培训,验证和测试。然后,对提出的数据集进行了调整,训练和测试的九个常见的预训练模型。这些模型是Xception,InceptionV3,VGG16,VGG19,Resnet50,resnet152v2,densenet121,InceptionResnetv2和MobilenetV2。结果表明,精细的VGG19,Densenet21和InceptionNet模型获得了与文献的兼容结果。此外,在召回,精度,准确性和F1分数方面,Xception模型优于比较的TL模型和文献方法。此外,它在测试数据集73.7、88、80.2和94.75%的召回,精度,F1分数和准确性的94.75%以及验证数据集73.3、90.24、80.9和95%的召回召回,精度,F1分数和精度分别实现。
摘要 - 鉴于他们熟练使用非文本数据(包括图像和视频)的熟练程度,大型语言模型(MLLM)已成为研究界的重要领域。本研究旨在通过引入DraveGpt4(一种基于LLMS的新型可解释的最终自动驾驶系统)来扩展MLLM的应用到自动驾驶领域。能够处理多帧视频输入和文本查询,DriveGpt4促进了对车辆动作的解释,提供相关的推理,并有效地解决了用户提出的各种问题。此外,DriveGPT4以端到端方式预测低级车辆控制信号。通过使用定制的视觉说明调谐数据集实现了这些高级功能,该数据集是专门针对自主驾驶应用程序量身定制的,并结合了混合填充培训策略。DriveGpt4代表了利用LLM的开创性努力,以开发可解释的端到端自动驾驶解决方案。在BDD-X数据集上进行的评估展示了DriveGPT4的质量和定量性能。此外,特定于域的数据的精细调整使DriveGpt4在与GPT4-V形成对比时,可以在自主驾驶接地方面产生接近甚至改善的结果。本文的网页可在https://tonyxuqaq.github.io/projects/drivegpt4上找到。
• 使用 NLS 建筑物足迹 • 使用 LAS 数据 • 训练 maskRCNN 模型 • 使用 AI 为建筑物添加属性 • 根据属性应用程序规则来创建 3D • 可以进行手动处理
摘要 — 目的。为深度神经网络开发一种高效的嵌入式脑电图 (EEG) 通道选择方法,使我们能够将通道选择与目标模型相匹配,同时避免与神经网络结合使用包装器方法所带来的巨大计算负担。方法。我们采用一个具体的选择器层来联合优化 EEG 通道选择和网络参数。该层使用 Gumbel-softmax 技巧来构建选择过程中涉及的离散参数的连续松弛,从而允许以传统反向传播的方式端到端地学习它们。由于经常观察到选择层在某个选择中包含两次相同的通道,我们提出了一个正则化函数来缓解这种行为。我们在两个不同的 EEG 任务上验证了这种方法:运动执行和听觉注意解码。对于每个任务,我们将 Gumbel-softmax 方法的性能与针对此特定任务量身定制的基线 EEG 通道选择方法进行比较:分别使用效用度量的互信息和贪婪前向选择。主要结果。我们的实验表明,所提出的框架具有普遍适用性,同时其性能至少与这些最先进的、针对特定任务的方法一样好(通常更好)。意义。所提出的方法提供了一种有效的、独立于任务和模型的方法来联合学习最佳 EEG 通道以及神经网络权重。
1 埃及梅努菲亚大学理学院数学与计算机科学系,Shebin El-Koom 32511 2 埃及梅努菲亚大学网络安全、量子信息处理和人工智能卓越中心,Shebin El-Koom 32511 3 墨西哥蒙特雷技术大学,工程与科学学院,蒙特雷 64849 4 埃及卡夫雷尔谢赫大学计算机与信息学院计算机科学系,Kafrelsheikh 33516 5 韩国世宗大学计算机工程系,首尔 05006 6 英国曼彻斯特城市大学计算与数学系,曼彻斯特 M15 6BH 7 韩国世宗大学软件系,首尔 05006 8 波兰华沙理工大学计算机科学研究所,00-665
今天的端到端学习系统可以学会从感知中明确推断控制。很难保证这些系统的稳定性和鲁棒性,因为它们通常是针对非结构化,高维且复杂的观察空间的(例如,来自像素输入流的自动驾驶)。我们建议利用控制控制的Lyapunov功能(CLFS)为基于端到端视觉的策略配备具有稳定性的策略,并在CLFS(ATT-CLF)中引入稳定性注意力,以解决环境变化并提高学习灵活性。我们还提出了一种不确定性传播技术,该技术被紧密整合到ATT-CLF中。我们通过与经典的CLF,模型预测控制以及在光真实的模拟器和实际的全尺度自动驾驶汽车中进行比较,证明了ATT-CLF的有效性。关键字:端到端学习,稳定性,自主驾驶