无人驾驶飞行器 (UAV) 以其速度快、功能多样而闻名,可用于收集航空图像和遥感数据,用于土地利用调查和精准农业。随着无人机的可用性和可访问性的增长,它们现在作为船舶监控和搜索救援 (SAR) 行动等海洋应用的技术支持至关重要。无人机上可以配备高分辨率摄像头和图形处理单元 (GPU),以有效和高效地帮助定位感兴趣的物体,适用于紧急救援行动,或者在我们的案例中,用于精准水产养殖应用。现代计算机视觉算法使我们能够在动态环境中检测感兴趣的物体;然而,这些算法依赖于从无人机收集的大型训练数据集,而目前在海洋环境中收集这些数据集非常耗时且费力。为此,我们提出了一个新的基准套件 SeaD- roneSim,它可用于创建具有真实感的照片级航空图像数据集,并为任何给定对象的分割掩模提供地面实况。仅利用 SeaDroneSim 生成的合成数据,我们在真实航拍图像上获得了 71 个平均精度 (mAP),用于检测我们感兴趣的对象,即本可行性研究中流行的开源遥控水下机器人 (BlueROV)。这款新模拟套装的结果可作为检测 BlueROV 的基准,可用于
摘要 — 扩散加权磁共振成像 (DW-MRI) 可用于表征神经组织的微观结构,例如通过纤维追踪以非侵入性方式描绘脑白质连接。高空间分辨率的磁共振成像 (MRI) 将在以更好的方式可视化此类纤维束方面发挥重要作用。然而,获得这种分辨率的图像是以更长的扫描时间为代价的。由于患者的心理和身体状况,较长的扫描时间可能与运动伪影的增加有关。单图像超分辨率 (SISR) 是一种旨在从单个低分辨率 (LR) 输入图像中获得高分辨率 (HR) 细节的技术,通过深度学习实现,是本研究的重点。与插值技术或稀疏编码算法相比,深度学习从大数据集中提取先验知识并从低分辨率对应物中生成优质的 MRI 图像。在这项研究中,提出了一种基于深度学习的超分辨率技术,并已应用于 DW-MRI。 IXI 数据集中的图像已被用作地面实况,并被人工下采样以模拟低分辨率图像。所提出的方法在统计上比基线有显著的改进,并实现了 0.913±0.045 的 SSIM。索引术语 — 超分辨率、深度学习、DWI、DTI、MRI
3 《天气法》于 2017 年 4 月 18 日颁布。 4 NHC 在 https://www.nhc.noaa.gov/cyclones/(2024 年 7 月 29 日访问)上托管活跃热带气旋产品。 NWS 天气预报办公室 (WFO) 发布内陆地区的风灾信息。此外,中太平洋飓风中心和关岛和美属萨摩亚的 WFO 为其各自的责任区发布热带气旋灾害产品。 5 这是一个称为地面实况数据的概念。现场测量也可用于确认或校准远距离收集的数据,例如从卫星收集的数据。与飞机观测相比,卫星数据对风暴位置和强度的确定性较低。 6 NOAA 于 2023 年 6 月 27 日宣布 HAFS 投入运营。HAFS 是 NOAA 的新飓风预报模型。 7 集合是一组以略有不同的初始条件或模型版本运行的计算机天气模型。集合旨在通过平均各种预报来提高预报的准确性,并提供有关预报不确定性的可靠信息。 8 请参阅 https://www.nhc.noaa.gov/verification/verify5.shtml(2024 年 7 月 30 日访问)。 9 请参阅 Landsea, CW 和 JP Cangialosi,2018 年:“我们是否已经达到热带气旋轨迹预报的可预报性极限?” Bull. Amer. Meteor. Soc.,2237-2243。
摘要。获取和注释足够的标记数据对于开发准确且稳健的基于学习的模型至关重要,但在许多医学图像分割任务中,获取此类数据可能具有挑战性。一种有希望的解决方案是将真实数据与地面实况掩模注释合成。然而,之前没有研究探索过使用掩模生成完整的 3D 体积图像。在本文中,我们提出了 MedGen3D,这是一个可以生成成对的 3D 医学图像和掩模的深度生成框架。首先,我们将 3D 医学数据表示为 2D 序列,并提出多条件扩散概率模型 (MC-DPM) 来生成遵循解剖几何的多标签掩模序列。然后,我们使用以生成的掩模序列为条件的图像序列生成器和语义扩散细化器来生成与生成的掩模对齐的逼真的 3D 医学图像。我们提出的框架保证了合成图像和分割图之间的准确对齐。在 3D 胸部 CT 和脑部 MRI 数据集上进行的实验表明,我们的合成数据既丰富又忠实于原始数据,并展示了对下游分割任务的好处。我们预计,MedGen3D 合成配对 3D 医学图像和掩模的能力将在训练用于医学成像任务的深度学习模型方面发挥重要作用。
惯性测量单元 (IMU) 于 20 世纪 30 年代首次应用于飞机导航和大型设备。当时,由于尺寸、成本和功耗等限制,它们的应用受到限制。然而,近年来,微机电 (MEMS) IMU 被引入,具有低成本、紧凑性和低处理能力等非常有利的特性。这些低成本 IMU 传感器的缺点之一是与高端传感器相比精度较低。然而,过去的实验结果表明,冗余 MIMU(磁和惯性测量单元)可提高无人驾驶飞行器的导航性能。尽管过去的模拟和实验结果表明冗余传感器可提高导航性能,但目前的研究工作都没有提供有关需要多少个传感器才能达到一定精度的信息。本文使用模拟环境评估 MIMU 传感器阵列的不同数量的传感器配置。不同旋转的 MIMU 传感器以增量方式添加,并使用 Madgwick 滤波器估计脚踏式 MIMU 数据的欧拉角。使用的评估指标是基于欧拉角与地面实况相比的均方根误差 (RMSE)。在实验过程中,我们注意到随着传感器数量的增加,执行时间呈指数增长,因此,我们设计和实现了代码的并行化,并在多核机器上运行。因此,我们评估了并行实现的加速。使用具有 16 个传感器的并行版本的结果显示,执行时间比仅使用 1 个传感器的执行时间少两倍,比使用顺序版本的执行时间少 24 倍,同时准确率提高了 26%。
马哈拉施特拉邦政府一直积极致力于将人工智能融入该邦的政府流程。现任和前任政府都与国内外组织密切合作,推动使用现代技术来简化公共和私营部门的工作。为实现这一目标,马哈拉施特拉邦政府和 NITI Aayog 与 NASSCOM 联合举办了 2019 年人工智能创新挑战赛。这项举措旨在推动该邦面向未来的人工智能初创企业。CropIn 赢得了由马哈拉施特拉邦政府和 NITI Aayog 与 NASSCOM 联合举办的 2019 年人工智能创新挑战赛。CropIn 的“SmartFarm”技术平台覆盖了近 200 万农民的 500 万英亩农田。在后端,CropIn 的数据湖利用高分辨率卫星图像和天气信息扩展了这些地面实况数据,这些是其平台“SmartRisk”的坚实基础。通过分析平台上每天增加的数据点上 265 种作物和近 3,500 种变种的数据,他们将建造一条农业信息高速公路,它还将检测模式并预测作物的未来,为农业部门的利益相关者展示风险和机遇。我们希望这样的活动能更频繁地发生,这样国家就可以像 2019 年那样帮助推广更先进的技术,并帮助公民轻松做到这一点。
愿景 我擅长发明和应用技术对大脑和其他复杂生物系统进行系统映射、分析、修复和模拟。我在麻省理工学院的研究小组的理念是尝试将对这些复杂系统的观察和修复提升到“地面实况”水平,以可扩展和系统的方式解决这些系统运行的基本机制。我们正在开发一些工具,以实现纳米级精度的细胞和组织分子映射(扩展显微镜)、记录脑回路和其他生物系统的高速动态(机器人定向进化进化而来的电压指示器和其他荧光指示器,以及空间和时间多路复用的报告基因,以及使活体大脑更透明的方法),以及使用光驱动的分子工具控制脑细胞的活动(光遗传学)。我是一名神经科学家和物理学家,由于我在许多领域的跨学科培训,我精通许多工程领域,从纳米工程到化学到基因组学到光学到电气工程。我领导着一个多学科团队来解决这些问题,其中包括物理学家、化学家、计算机科学家、临床医生和硬件工程师。我们在内部将这些工具应用于分析秀丽隐杆线虫和斑马鱼幼虫等的神经系统,着眼于扩展到小鼠和人类,目标是以生物学上真实的方式模拟整个大脑。我们还致力于从根本上理解和对抗大脑衰老以及神经和精神疾病。我与世界各地的数十个实验室合作,将新技术付诸实践,并应用这些工具来解决基础和应用科学问题。我们在麻省理工学院的实验室和我们的合作伙伴已经将我们的工具分发给了世界各地的数千名研究人员。
摘要 目的 评估一种新的人工智能 (AI) 驱动的工具在全景 X 光片上检测和分割牙齿的性能。材料和方法共收集了 153 张 X 光片。牙颌面放射科医生标记和分割每颗牙齿,作为基本事实。一颗牙齿的类别不可知裁剪图像产生 3576 颗训练牙齿。AI 驱动的工具将两个深度卷积神经网络与专家细化相结合。系统检测和分割牙齿的准确度是主要结果,时间分析是次要结果。Kruskal-Wallis 检验用于评估牙齿组和不同设备之间性能指标的差异,卡方检验用于验证矫正量、假阳性和假阴性的存在以及牙齿的冠和根部分与潜在的 AI 误解之间的关联。结果该系统的牙齿检测灵敏度为 98.9%,精确度为 99.6%。对于牙齿分割,下颌犬齿的效果最佳,其交集比、精确度、召回率、F1 分数和豪斯多夫距离的值分别为:95.3%、96.9%、98.3%、97.5% 和 7.9。虽然仍高于 90%,但上下磨牙的分割结果略低。该方法显示,临床上显著减少了 67% 的手动时间。结论该 AI 工具在检测和分割牙齿方面表现出高度准确和快速的性能,比单独使用地面实况更快。临床意义与手动分割相比,创新的临床 AI 驱动工具在检测和分割全景 X 光片上的牙齿方面表现出更快、更准确的性能。
神经影像学中的可重复性危机,尤其是在研究动力不足的情况下,引发了人们对我们重现、复制和推广研究结果的能力的怀疑。作为回应,我们看到了为神经科学家提供的建议指南和原则的出现,这些建议被称为“良好科学实践”,用于开展更可靠的研究。尽管如此,每项研究在分析和统计方法的结合上仍然几乎是独一无二的。虽然考虑到设计和脑数据记录的多样性,这是可以理解的,但它也代表了可重复性的一个显著点。在这里,我们提出了一个非参数置换统计框架,主要用于神经生理数据,以便对非负信息测量进行组级推断,包括信息论、机器学习或距离测量的指标。该框架支持固定和随机效应模型,以适应个体间和会话间的变化。使用数值模拟,我们比较了两个组模型的地面实况检索的准确性,例如用于多重比较的测试和聚类校正。然后,我们使用空间均匀的 MEG 和非均匀的颅内神经生理数据重现并扩展了现有结果。我们展示了如何使用该框架来提取整个人群中刻板的任务和行为相关影响,涵盖从大脑区域的局部水平、区域间功能连接到总结网络属性的测量等各个方面。我们还介绍了一个名为 Frites 1 的开源 Python 工具箱,其中包括使用信息论指标(例如用于提取认知大脑网络的单次试验功能连接估计)的拟议统计管道。总之,我们认为这个框架值得认真关注,因为它的稳健性和灵活性可以成为统计方法统一化的起点。
摘要。目的:本研究探讨颅内电极捕获的神经信号的语音解码。大多数先前的研究只能使用 2D 网格上的电极(即脑皮层电图或 ECoG 阵列)和来自单个患者的数据。我们的目标是设计一个深度学习模型架构,可以同时适应表面(ECoG)和深度(立体定向 EEG 或 sEEG)电极。该架构应允许使用来自多个参与者的数据进行训练,这些参与者的电极位置变化很大,并且训练后的模型应该在训练期间未见过的参与者身上表现良好。方法:我们提出了一种名为 SwinTW 的新型基于变压器的模型架构,该架构可以与任意定位的电极一起工作,通过利用它们在皮层上的 3D 位置而不是它们在 2D 网格上的位置。我们使用来自单个参与者的数据训练特定于主题的模型,以及利用来自多个参与者的数据的多患者模型。主要结果:仅使用低密度 8x8 ECoG 数据的受试者特定模型在 N=43 名参与者中实现了高解码皮尔逊相关系数与地面实况频谱图 (PCC=0.817),优于我们之前的卷积 ResNet 模型和 3D Swin Transformer 模型。在每个参与者 (N=39) 中加入额外的条带、深度和网格电极可带来进一步的改进 (PCC=0.838)。对于只有 sEEG 电极的参与者 (N=9),受试者特定模型仍然具有可比的性能,平均 PCC=0.798。多受试者模型在看不见的参与者身上实现了高性能,在留一交叉验证中平均 PCC=0.765。意义:提出的 SwinTW 解码器使未来的语音神经假体能够利用任何对特定参与者来说临床上最佳或可行的电极位置,包括仅使用更常规的深度电极