无人驾驶飞行器 (UAV) 以其速度快、功能多样而闻名,可用于收集航空图像和遥感数据,用于土地利用调查和精准农业。随着无人机的可用性和可访问性的增长,它们现在作为船舶监控和搜索救援 (SAR) 行动等海洋应用的技术支持至关重要。无人机上可以配备高分辨率摄像头和图形处理单元 (GPU),以有效和高效地帮助定位感兴趣的物体,适用于紧急救援行动,或者在我们的案例中,用于精准水产养殖应用。现代计算机视觉算法使我们能够在动态环境中检测感兴趣的物体;然而,这些算法依赖于从无人机收集的大型训练数据集,而目前在海洋环境中收集这些数据集非常耗时且费力。为此,我们提出了一个新的基准套件 SeaD- roneSim,它可用于创建具有真实感的照片级航空图像数据集,并为任何给定对象的分割掩模提供地面实况。仅利用 SeaDroneSim 生成的合成数据,我们在真实航拍图像上获得了 71 个平均精度 (mAP),用于检测我们感兴趣的对象,即本可行性研究中流行的开源遥控水下机器人 (BlueROV)。这款新模拟套装的结果可作为检测 BlueROV 的基准,可用于
如今,食品制造公司要想保持竞争力,就必须保持最高质量的产出和最佳的生产力。为了实现这一点,食品制造公司需要能够自动对产品进行分类,并过滤掉生产线上流经的缺陷产品。实施支持人工智能的机器视觉可以大大简化和加速这一检测过程。通过集成人工智能,自动光学检测 (AOI) 可以通过深度学习增强其功能,实现无与伦比的速度和准确性,提供人工或传统基于规则的视觉检测无法实现的一致可靠结果。 挑战 需要支持人工智能的嵌入式视觉系统来实现下一代机器视觉。为了在几毫秒内扫描大量产品图像并识别细微特征,理想的系统不仅需要高性能的 Intel® Xeon® 或 Core TM 处理器,还需要依靠强大的 GPU(图形处理单元)或 VPU(视觉处理单元)加速器来执行自动缺陷检测,而这在很大程度上依赖于图像解释和深度学习技术。此外,系统必须集成实时视觉I/O,用于连接触发器和光学传感器,并支持多个摄像头接口,以实现涉及机器视觉的各种应用。主要要求
为什么佛罗里达大学早在 2020 年就开始了人工智能之旅?这次旅程的灵感来自 Chris Malachowsky。他是佛罗里达大学的校友,也是生产图形处理单元 (GPU) 的公司 NVIDIA 的联合创始人。虽然 GPU 最初驱动计算机图形(如在视频游戏中),但它们也成为当前为人工智能超级计算机的计算能力提供动力的首选硬件。Malachowsky 在 2020 年初向佛罗里达大学提供了一台人工智能超级计算机,佛罗里达大学承诺教授“跨课程人工智能”,这在当时是前所未有的概念。NVIDIA 首席执行官 Jensen Huang 和 NVIDIA 与 Malachowsky 合作,将这台超级计算机赠送给佛罗里达大学。在 COVID-19 大流行期间,NVIDIA 和佛罗里达大学信息技术部门的工作人员英勇地交付了 HiPerGator,并花了两个月的时间将其零部件组装起来,这是一个值得在另一个时间和地点讲述的故事。组件于 2020 年 11 月开始交付。在两家员工的共同专业知识的帮助下,HiPerGator 于 2021 年 2 月投入运行,佛罗里达大学开始将其愿景从简单地教授“跨课程人工智能”扩展到“成为一所人工智能大学”。
摘要 — 大脑模拟是人工智能领域的最新进展之一,它有助于更好地理解信息在大脑中的表示和处理方式。人脑极其复杂,因此只有在高性能计算平台上才能进行大脑模拟。目前,具有大量互连图形处理单元 (GPU) 的超级计算机用于支持大脑模拟。因此,超级计算机中的高吞吐量低延迟 GPU 间通信对于满足大脑模拟这一高度时间敏感的应用的性能要求起着至关重要的作用。在本文中,我们首先概述了当前使用多 GPU 架构进行大脑模拟的并行化技术。然后,我们分析了大脑模拟通信面临的挑战,并总结了应对这些挑战的通信设计指南。此外,我们提出了一种分区算法和一种两级路由方法,以实现多 GPU 架构中用于大脑模拟的高效低延迟通信。我们报告了在一台拥有 2,000 个 GPU 的超级计算机上模拟具有 100 亿个神经元的大脑模型的实验结果,以表明我们的方法可以显著提高通信性能。我们还讨论了尚待解决的问题,并确定了大脑模拟低延迟通信设计的一些研究方向。
摘要 大脑模拟作为人工智能领域的最新进展之一,有助于更好地理解信息在大脑中的表达和处理方式。人类大脑的极端复杂性使得大脑模拟只有在高性能计算平台上才可行。目前,用于支持大脑模拟的超级计算机具有大量互连的图形处理单元(GPU)。因此,超级计算机中的高吞吐量低延迟 GPU 间通信对于满足大脑模拟这一高度时间敏感的应用的性能要求起着至关重要的作用。在本文中,我们首先概述了当前使用多 GPU 架构进行大脑模拟的并行化技术。然后,我们分析了大脑模拟通信面临的挑战,并总结了应对这些挑战的通信设计指南。此外,我们提出了一种分区算法和一种两级路由方法,以实现多 GPU 架构中用于大脑模拟的高效低延迟通信。我们报告了在具有 2000 个 GPU 的超级计算机上模拟具有 100 亿个神经元的大脑模型(数字孪生大脑,DTB)的实验结果,以表明我们的方法可以显著提高通信性能。我们还讨论了尚待解决的问题,并确定了大脑模拟低延迟通信设计的一些研究方向。
摘要 - 在图形处理单元(GPU)上执行的深神经网络(DNN)的可靠性评估是一个具有挑战性的问题,因为硬件体系结构非常复杂,软件框架由许多抽象层组成。虽然软件级故障注入是评估复杂应用程序可靠性的一种常见且快速的方法,但它可能会产生不切实际的结果,因为它对硬件资源的访问有限,并且采用的故障模型可能太幼稚(即单位和双位翻转)。相反,用中子光束注射物理断层提供了现实的错误率,但缺乏故障传播可见性。本文提出了DNN故障模型的表征,该模型在软件级别结合了中子束实验和故障注入。我们将运行一般矩阵乘法(GEMM)和DNN的GPU暴露于梁中子,以测量其错误率。在DNNS上,我们观察到关键错误的百分比可能高达61%,并表明ECC在减少关键错误方面无效。然后,我们使用RTL模拟得出的故障模型进行了互补的软件级故障注入。我们的结果表明,通过注射复杂的断层模型,Yolov3的误导率被验证为非常接近通过光束实验测得的速率,该速率比仅使用单位倒换的断层注射测量的频率高8.66倍。
摘要 有多种原因使得脑癌识别成为神经外科医生在手术过程中的一项艰巨任务。由于脑肿瘤具有弥漫性,会渗透到周围的健康组织中,因此外科医生的肉眼有时不足以准确描绘脑肿瘤的位置和扩散范围。因此,为了改善手术效果并提高患者的生活质量,提供准确癌症界定的支持系统至关重要。作为欧洲“高光谱成像癌症检测”(HELICoiD)项目的一部分,开发的脑癌检测系统满足了这一要求,它利用了一种适合医学诊断的非侵入性技术:高光谱成像 (HSI)。该系统必须满足的一个关键约束是提供实时响应,以免延长手术时间。表征高光谱图像的大量数据以及分类系统执行的复杂处理使得高性能计算 (HPC) 系统对于提供实时处理至关重要。本工作中开发的最有效的实现利用了图形处理单元(GPU)技术,能够在不到三秒的时间内对数据库中最大的图像(最坏情况)进行分类,基本上满足了外科手术 1 分钟的实时约束,成为在不久的将来实现高光谱视频处理的潜在解决方案。
自从 20 世纪中叶麦卡洛克-皮茨神经元 1 和感知器 2 模型诞生以来,人工智能 (AI) 或人工神经网络 (ANN) 在很大程度上仍然是一个计算机科学术语。由于计算能力不足,本世纪后期的进展受到阻碍。1980-2000 年期间的集成电路制造无法在单个处理器和内存芯片上高密度集成晶体管。因此,在深度神经网络 (DNN) 或深度卷积神经网络 (DCNN) 3 上运行模拟并存储指数级累积的数据在时间和能源成本方面是不切实际的,尽管当时 ANN 模型已经相对完善 4-10 。随着芯片密度的提升以及对摩尔定律的追求带来的图形处理单元 (GPU) 等多核处理器的出现,再加上更高效的 ANN 算法 3,11,12,计算能力瓶颈在本世纪初得到成功解决。2012 年,具有十亿个连接的 DNN 被证明能够识别猫和人体等高度概念化的物体 13。同年,DNN 被证明在图像分类准确率方面与人类不相上下(基于 MNIST 数据库),甚至在交通标志识别方面也超越了人类 14。脉冲神经网络 (SNN) 由 Maass 于 1995 年提出 15,16,它采用脉冲
医学中的人工智能(AI)研究正在迅速增长。Healthcare AI项目比全球经济其他任何领域的AI项目吸引了更多的投资。然而,在兴奋中,存在同等的怀疑,在膨胀的期望时有些敦促谨慎[1,2]。自世纪之交以来,AI也成功地进入了医学和医疗保健领域[3,4]。基于证据的医学的核心是使用历史数据来为临床决策提供信息。该任务传统上是通过统计方法解决的,该方法将数据中的模式描述为数学方程[5]。例如,神经网络使用大量互连神经元以类似于人脑的方式表示数据。这些包括可用性且价格合理的计算(处理)工具,硬件(例如图形处理单元),软件和应用程序,即使在消费级的个人计算机以及移动设备以及具有多种信息类型和形式的移动设备以及在线和云平台中,以及通过可穿戴技术和互联网(6)(6)(6)(6)[IOT)(IOT)(IOT)(IOT)(IOT)(IOT)(IOT)(IOT)(IOT)(IOT)(IOT)(IOT)(IOT)(IOT)(IOT)(IOT)(IOT),开源编码资源以及从业者和用户交换资源,专有技术和经验的在线社区的增长;以及计算机处理与光子学(应用光学和电子融合)和人机接口等其他技术的集成[5,6]。
在信号处理中,通过网络表示探索复杂的系统已成为越来越兴趣的领域。这项研究介绍了模块化图,这是一种新的基于图的功能,以突出图形群落之间的关系。将应用程序显示为称为随机块模型的随机图类别后,我们考虑了根据实际脑电图估算的大脑功能连接网络。模块化图提供了一个定量框架,用于检查大脑网络中神经元簇之间的相互作用。模块化图与多尺度社区检测算法一起起作用,从而可以在各种规模上识别社区结构。引入模块化图后,我们将其应用于大脑功能连接网络,该网络是根据运动成像实验的公开脑电图记录估算的。跨多个量表的统计分析表明,与各种运动成像任务相关的不同大脑连接状态的模块化图不同。这项工作强调信号在图形处理技术上的应用以了解特定认知任务期间的大脑行为,从而利用新型模块化图来识别不同认知条件下脑连接的模式。这种方法为在图形分析上的进一步信号设定了阶段,以设计大脑网络模块,并洞悉运动成像机制。