点击购买,资源将自动在新窗口打开.
获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
在本课程中,我们将通过了解如何以高级语言编写的ML模型分解为低级内核,并以分布式方式跨硬件加速器(例如GPU)执行。本课程涵盖的主题包括:神经网络和反向传播,用于表达ML模型的编程模型,自动差异化,深度学习加速器,分布式培训技术,计算图优化,自动内核的生成,内存优化等。本课程的主要目标是就现有ML系统的工作方式提供全面的看法。在整个课程中,我们还将学习这些系统背后的设计原则,并讨论为下一代ML应用程序和硬件平台构建未来ML系统的挑战和机会。
主要关键词