Optimizing PyTorch Model Inference on AWS Graviton
在 CPU 上加速 AI/ML 的技巧 — 第 2 部分优化 AWS Graviton 上的 PyTorch 模型推理一文首先出现在 Towards Data Science 上。
Optimizing PyTorch Model Inference on CPU
在 Intel Xeon 上像狮子一样飞翔这篇文章在 CPU 上优化 PyTorch 模型推理首先出现在走向数据科学上。
On the Challenge of Converting TensorFlow Models to PyTorch
如何升级和优化旧版 AI/ML 模型《将 TensorFlow 模型转换为 PyTorch 的挑战》一文首先出现在 Towards Data Science 上。
PyTorch 模型性能分析和优化 — 第 11 部分克服可变形状张量的隐藏性能陷阱:PyTorch 中的高效数据采样一文首先出现在 Towards Data Science 上。
PyTorch Tutorial for Beginners: Build a Multiple Regression Model from Scratch
PyTorch 实践:构建用于多元回归的 3 层神经网络《PyTorch 初学者教程:从头开始构建多元回归模型》首先出现在《走向数据科学》上。
YOLOv1 Paper Walkthrough: The Day YOLO First Saw the World
YOLOv1 架构及其从头开始的 PyTorch 实现的详细演练 YOLOv1 后论文演练:YOLO 第一次看到世界的那一天首先出现在《走向数据科学》上。
Enhanced performance for Amazon Bedrock Custom Model Import
现在,您可以在使用 Amazon Bedrock 自定义模型导入时实现显着的性能改进,通过高级 PyTorch 编译和 CUDA 图形优化减少端到端延迟、加快首次令牌生成时间并提高吞吐量。通过 Amazon Bedrock 自定义模型导入,您可以将自己的基础模型引入 Amazon Bedrock 进行大规模部署和推理。在这篇文章中,我们介绍如何使用 Amazon Bedrock 自定义模型导入中的改进。
Learning Triton One Kernel at a Time: Softmax
关于快速、可读且支持 PyTorch 的 softmax 内核,您需要了解的所有信息这篇文章《一次学习 Triton 一个内核:Softmax》首先出现在《走向数据科学》上。