处理器 QS 预生产版(40 核,2.0 GHz)、1 个英特尔® 服务器主板(QuantaGrid D54Q-2U)、总内存:512 GB(16x 32 GB 4800 MHz DDR5 DIMM)、英特尔® 超线程技术 = 开启、英特尔® 睿频加速技术 = 开启、BIOS = SE5C741.86B.01.01.0002.2212220608、微码 = 0x2b0001b0 存储(启动):1 个 Solidigm DC S4610(960 GB)、存储:6 个 Solidigm D7-P5510 系列(3.84 TB)、网络设备:1 个 25 GbE 英特尔® 以太网网络适配器 E810-XXV-4 @ 25 GbE、1 个 10 GbE 英特尔® 以太网融合网络适配器 X550-T2 @ 1 GbE、操作系统/软件:带有 Ubuntu Server 2022 的 Microsoft Azure Stack HCI 版本 20385。
图 4. 英特尔数字孪生边缘控制器 海运港口运营商可以通过实施智能港口技术来应对日益增加的可靠性、安全性、效率和成本挑战。英特尔及其生态系统合作伙伴提供使用英特尔® SceneScape 控制器、摄像头和传感器(带有英特尔组件)、CPU、高性能集成显卡和现场可编程门阵列 (FPGA) 技术进行图像采集和处理的解决方案。英特尔® OpenVINO 工具包™ 分发版等可部署的软件包也有助于加速 AI 推理和决策。这些解决方案结合了传感器硬件和软件、边缘到云处理技术和人工智能,有助于为海运组织提供更好的洞察。更好的洞察有助于做出更好的运营和安全业务决策,从而实现更可靠、更准时的运营。
• 英特尔 ® 针对 PyTorch* 的优化:英特尔 ® oneAPI 深度神经网络库 (oneDNN) 包含在 PyTorch 中,作为深度学习的默认数学内核库。 • 英特尔 ® 针对 PyTorch 的扩展:英特尔 ® 针对 PyTorch* 的扩展通过最新特性和优化扩展了 PyTorch* 功能,从而在英特尔硬件上进一步提升性能。 • 英特尔 ® 针对 TensorFlow* 的优化:此版本将 oneDNN 中的基元集成到 TensorFlow 运行时中,以加速性能。 • 英特尔 ® 针对 TensorFlow 的扩展:英特尔 ® 针对 TensorFlow* 的扩展是基于 TensorFlow PluggableDevice 接口的异构高性能深度学习扩展插件。此扩展插件将英特尔 XPU(GPU、CPU 等)设备带入 TensorFlow 开源社区,以加速 AI 工作负载。 • 英特尔 ® 针对 Python* 的分发版:开箱即用,获得更快的 Python 应用程序性能,几乎不需要更改代码。此发行版与英特尔 ® oneAPI 数学核心函数库和英特尔 ® oneAPI 数据分析库等英特尔 ® 性能库集成。 • 英特尔 ® Modin* 发行版(仅通过 Anaconda 提供),您可以使用这个智能的分布式数据框库(其 API 与 pandas 相同)在多节点之间无缝扩展预处理。只有通过使用 Conda* 软件包管理器安装英特尔 ® 人工智能分析工具包才能使用此发行版。 • 英特尔 ® Neural Compressor:在流行的深度学习框架(如 TensorFlow*、PyTorch*、MXNet* 和 ONNX*(开放神经网络交换)运行时)上快速部署低精度推理解决方案。 • 英特尔 ® Scikit-learn* 扩展:使用英特尔 ® oneAPI 数据分析库(oneDAL)无缝加速您的 Scikit-learn 应用程序。
Ultra处理器(S系列)专门针对需要强大的CPU性能,大量内存和广泛的I/O连接性的边缘AI应用程序进行了设计。它具有多达36个平台的处理能力顶部,并结合了P型核和电子核,IntegratedIntel®Graphics和Intel®AIBoost(NPU)在灵活的LGA插座设计中,使其能够有效地执行复杂的AI任务。
使用基于软件的I/O虚拟化,VMM将虚拟设备(例如网络接口控制器(NIC))公开为VM。VMM中的软件设备模型模拟了虚拟设备的行为。设备模型从虚拟设备命令转换为被转发到物理设备的物理设备命令。这种设备的软件仿真可以为在VM中运行的软件提供良好的兼容性,但会引起大量的性能开销,尤其是对于高性能设备。除了性能限制外,软件中的模拟虚拟设备对于可编程设备(例如图形处理单元(GPU)(GPU)和现场可编程栅极阵列(FPGA)来说,软件中的虚拟设备可能很复杂,因为这些设备执行了多种复杂功能。基于软件的I/O虚拟化的变体,例如“设备paravirtualization”和“ Medied Pass-Through”,可以减轻设备仿真的某些性能和复杂性。
在后续测试中,帧速率增加到 100 fps(正常情况下的十倍),以显示推理时间如何根据用于处理流的内核数量而变化。图 2 显示线程数从 2 到 208,推理时间从 0 到 50 毫秒。每个内核配置都会处理 100 fps 的流,其中 32 线程配置的推理时间最短。虽然大多数应用程序不会使用 100 fps,但此测试显示了系统对于具有不同帧速率的各种应用程序的可配置性。
英特尔 Arc GPU 代表了设备边缘图形技术的一次飞跃,它将先进的人工智能、卓越的图形和高效的媒体处理功能融合在单个 GPU 中。英特尔 Arc GPU 可与部分英特尔® 酷睿™ CPU 处理器无缝配对,形成完整的解决方案。英特尔 Arc GPU 基于英特尔先进的 X e 图形架构构建,可在从集成显卡到高性能独立显卡的各种计算环境中提供可扩展的性能。英特尔 X e HPG 架构为关键边缘用途和工作负载提供专用加速,包括用于加速推理的英特尔® X e 矩阵扩展 (英特尔® XMX) 人工智能引擎和用于加快转码和其他媒体处理任务的 X e 媒体引擎。英特尔 Arc GPU 专门针对边缘,提供五年的长期可用性和支持、多样化的边缘外形尺寸以及对边缘受限使用条件的支持。
Error 500 (Server Error)!!1500.That’s an error.There was an error. Please try again later.That’s all we know.