多年来,单板计算机 (SBC) 领域的发展一直在不断加快。它们在计算性能和功耗之间实现了良好的平衡,这通常是移动平台所必需的,例如用于高级驾驶辅助系统 (ADAS) 和自动驾驶 (AD) 的车辆应用。然而,对更强大、更高效的 SBC 的需求日益增长,这些 SBC 可以实时运行功耗密集型深度神经网络 (DNN),还可以满足必要的功能安全要求,例如汽车安全完整性等级 (ASIL)。ZF 正在开发“ProAI”,主要用于运行强大而高效的应用程序,例如多任务 DNN,此外,它还具有 AD 所需的安全认证。在这项工作中,我们基于功耗密集型多任务 DNN 架构 Multitask-CenterNet,就 FPS 和功率效率等性能指标比较和讨论了最先进的 SBC。作为一款汽车超级计算机,ProAI 实现了性能和效率的完美结合,其每瓦 FPS 数量几乎是现代工作站笔记本电脑的两倍,几乎是 Jetson Nano 的四倍。此外,根据基准测试期间的 CPU/GPU 利用率,还显示 ProAI 上仍有剩余电量用于执行进一步更复杂的任务。
基于变压器的大语言模型(LLMS)在各种自然语言处理任务中都具有令人印象深刻的表现。为LLM推断为生成长含量而构成挑战,这是由于瞬态状态的巨大内存足迹(称为键值(KV)缓存),该状态以序列长度和批处理大小缩放。在本文中,我们提出了Infinigen,这是一种针对Longext Genertion量身定制的新型KV缓存管理框架,该框架协同与现代卸载基于卸载的推理系统合作。Infinigen利用了关键见解,即可以通过对当前层的最小彩排以及查询权重的一部分和后续层的关键缓存进行最小化的彩排来推测,对于计算变压器中后续注意力层至关重要的重要洞察力。这使我们只能预取基本的KV缓存条目(不提供所有内容),从而在基于卸载的LLM服务系统中减轻主机内存中的提取开销。我们对几种代表性LLMS的评估表明,与先前的KV高速缓存管理方法相比,Infinigen将基于现代卸载系统的总体性能提高了3.00倍,同时提供了更好的模型准确性。
从时间分辨的医学图像中精确重建右心几何形状和运动可增强基于图像可视化的诊断工具以及通过计算方法进行的心脏血液动力学分析。由于右心形态和运动的特殊性,常用的分割和/或重建技术仅采用短轴电影 MRI,在右心相关区域(如心室底部和流出道)缺乏准确性。此外,重建过程非常耗时,并且在生成计算域的情况下需要大量的人工干预。本文提出了一种从时间分辨 MRI 中精确高效地重建右心几何形状和运动的新方法。具体而言,所提出的方法利用表面变形来合并来自多系列电影 MRI(如短/长轴和 2/3/4 腔采集)的信息并重建重要的心脏特征。它还通过利用合适的图像配准技术自动提供完整的心脏收缩和放松运动。该方法既适用于健康病例,也适用于病理(法洛四联症)病例,并且比标准程序产生更准确的结果。所提出的方法还用于为计算流体动力学提供重要输入。相应的数值结果证明了我们的方法在计算临床相关血液动力学量方面的可靠性。© 2023 Elsevier BV 保留所有权利。
©作者2024。Open Access本文是根据Creative Commons Attribution 4.0 International许可获得许可的,该许可允许以任何媒介或格式使用,共享,适应,分发和复制,只要您对原始作者和来源提供适当的信誉,请提供与创意共享许可证的链接,并指出是否进行了更改。本文中的图像或其他第三方材料包含在文章的创意共享许可中,除非在信用额度中另有说明。如果本文的创意共享许可中未包含材料,并且您的预期用途不受法定法规的允许或超过允许的用途,则您需要直接从版权所有者那里获得许可。要查看此许可证的副本,请访问http://创建ivecommons。org/licen ses/by/4。0/。
检测化学和生物物质,以涉及各种应用方案,例如可穿戴电子设备,智能点(POC)诊断,环境监测等。[1,2]要适当地满足这些新兴要求,理想的生化传感器应具有诸如高灵敏度,长期鲁棒性,快速响应,实时监测能力,出色的选择性,低单位成本,检测下限,较大的动态范围,低功耗等等等特性[3]但是,人类仍然需要进行陡峭的攀登之旅才能实现这些目标。值得注意的是,2019年冠状病毒病的全球大流行(Covid-19)表明,我们的技术储备在满足这种紧急,庞大和多功能的要求方面并没有充分准备,并引起了对生化感测技术的极大关注。迄今为止,包括化学主义的几种主要技术路线,[4,5] plasonic,[6,7]电化学,[8,9]声传感器,[10,11]等。已经开发出来,每个传感器中的每一个都在某些上述方面具有针对各种实际应用方案的特定优点。纳米制造技术的快速开发用于不同材料和各种结构,由于其小特征和主动结构特性,例如高地表到数量,独特的物理特性,独特的物理特性等,戏剧性地增强了这些传感设备的性能。[12–14]
摘要本文介绍了GSCORE,这是一个硬件加速器单元,该单元有效地执行了使用算法优化的3D Gauss-ian剥落的渲染管道。GSCORE基于对基于高斯的辐射场渲染的深入分析的观察,以提高计算效率并将技术带入广泛采用。在此过程中,我们提出了几种优化技术,高斯形状感知的交叉测试,分层排序和下图跳过,所有这些都与GSCORE协同集成。我们实施了GSCORE的硬件设计,使用商业28NM技术进行合成,并评估具有不同图像分辨率的一系列合成和现实世界场景的性能。我们的评估要求表明,GSCORE在移动消费者GPU上实现了15.86倍的速度,其面积较小,能源消耗较低。
已注册的账户可选择 Merrill 指定为税收效率管理风格经理策略或风格经理策略的可用风格经理策略。风格经理策略是一种管理策略,以税收效率管理作为其投资组合管理投资方法的目标。在这种策略中,投资经理采用各种税收效率管理方法,例如寻求机会出售亏损的证券,并在出售日期后至少 30 天内将收益投资于与策略一致的替代证券。
摘要。朦胧的图像带来了一个具有挑战性的问题,由于信息丢失和颜色失真而遭受。当前的基于深度学习的去悬式方法通过增加网络深度来增强性能,但会导致大量参数开销。同时,标准卷积层集中在低频细节上,通常会说出高频信息,这阻碍了模糊图像中提出的先前信息的有效利用。在本文中,我们提出了TCL-NET,这是一个轻巧的飞行网络,该网络强调了频域特征。我们的网络首先包含一个用于提取高频和低频内形式的所谓层,该层是针对原始模糊图像的快速变压器专门设计的。同时,我们设计了一个频率域信息融合模块,该模块将高频和低频信息与后续卷积层的卷积网络作品集成在一起。此外,为了更好地利用原始图像的空间信息,我们引入了一个多角度注意模块。使用上述设计,我们的网络以仅0.48MB的总参数大小实现了出色的性能,与其他最先进的轻量级网络相比,参数的数量级降低了。
