在Scala/C ++中构建和部署的高性能计算机视觉和建议服务,使用CAFFE/MXNET处理500m+每月请求。●社交媒体SaaS平台的后端Scala开发。AWS微服务堆栈。●研究并发布了生产计算机视觉分类和检测模型。●创建和托管的专有数据集用于培训深度学习模型
Horovod 是一个开源框架,用于在数百个 GPU 上并行扩展深度学习训练。它是一种基于环式全归约算法的分布式可扩展深度学习训练框架,利用高性能计算 (HPC) 技术(例如 MPI、数据并行等)在本地和云部署中的多个设备和节点上高效扩展。此外,它还支持运行支持 GPU 的 AI/ML 框架,例如 TensorFlow、Keras、PyTorch 和 Apache MXNet。本文介绍了使用 ResNet50 基准在八台支持 GPU 的 Supermicro 8U SuperBlade 服务器上运行图像分类的测试,展示了跨多个节点的分布式工作负载的高吞吐量。
1)机器学习/模式识别、计算机视觉、计算机科学或相关领域的博士/硕士/学士学位。 2)在算法设计和实现以及使用C/C++/Python/Java等编程语言方面具有丰富的经验和出色的技能。熟悉Pytorch/Caffe/Tensorflow/MXnet,具有从算法研究到建模、数据准备、测试、评估和现场环境实施的完整开发周期经验。 3)强大的分析和战略思维能力,能够处理大局和关键的技术决策 4)具有很强的跟踪最新技术发展和为商业应用实施尖端算法的能力。 5)良好的沟通能力,积极主动的态度,对新技术和想法充满热情。具有UI设计能力也是有利的。 6)在算法和ML/DL/计算机视觉研发的国际竞赛中发表过论文或获得过奖项的人将优先考虑。
• 英特尔 ® 针对 PyTorch* 的优化:英特尔 ® oneAPI 深度神经网络库 (oneDNN) 包含在 PyTorch 中,作为深度学习的默认数学内核库。 • 英特尔 ® 针对 PyTorch 的扩展:英特尔 ® 针对 PyTorch* 的扩展通过最新特性和优化扩展了 PyTorch* 功能,从而在英特尔硬件上进一步提升性能。 • 英特尔 ® 针对 TensorFlow* 的优化:此版本将 oneDNN 中的基元集成到 TensorFlow 运行时中,以加速性能。 • 英特尔 ® 针对 TensorFlow 的扩展:英特尔 ® 针对 TensorFlow* 的扩展是基于 TensorFlow PluggableDevice 接口的异构高性能深度学习扩展插件。此扩展插件将英特尔 XPU(GPU、CPU 等)设备带入 TensorFlow 开源社区,以加速 AI 工作负载。 • 英特尔 ® 针对 Python* 的分发版:开箱即用,获得更快的 Python 应用程序性能,几乎不需要更改代码。此发行版与英特尔 ® oneAPI 数学核心函数库和英特尔 ® oneAPI 数据分析库等英特尔 ® 性能库集成。 • 英特尔 ® Modin* 发行版(仅通过 Anaconda 提供),您可以使用这个智能的分布式数据框库(其 API 与 pandas 相同)在多节点之间无缝扩展预处理。只有通过使用 Conda* 软件包管理器安装英特尔 ® 人工智能分析工具包才能使用此发行版。 • 英特尔 ® Neural Compressor:在流行的深度学习框架(如 TensorFlow*、PyTorch*、MXNet* 和 ONNX*(开放神经网络交换)运行时)上快速部署低精度推理解决方案。 • 英特尔 ® Scikit-learn* 扩展:使用英特尔 ® oneAPI 数据分析库(oneDAL)无缝加速您的 Scikit-learn 应用程序。