走向数据科学领域信息情报检索

在数据科学领域分享概念、思想和代码。Towards Data Science Inc.是一家在加拿大注册的公司。它为成千上万的人提供了一个交流思想、扩展对数据科学理解的平台。

人工智能泡沫将会破裂——为什么这并不重要

The AI Bubble Will Pop — And Why That Doesn’t Matter

历史上最大的科技泡沫如何解释人工智能下一步的发展方向人工智能泡沫将会破裂——以及为什么这并不重要一文首先出现在《走向数据科学》上。

在 CPU 上优化 PyTorch 模型推理

Optimizing PyTorch Model Inference on CPU

在 Intel Xeon 上像狮子一样飞翔这篇文章在 CPU 上优化 PyTorch 模型推理首先出现在走向数据科学上。

如何攀登数据科学隐藏的职业阶梯

How to Climb the Hidden Career Ladder of Data Science

让你晋升的行为《如何攀登数据科学隐藏的职业阶梯》一文首先出现在《迈向数据科学》上。

机器学习“降临日历”第 7 天:决策树分类器

The Machine Learning “Advent Calendar” Day 7: Decision Tree Classifier

在第 6 天,我们看到了决策树回归器如何通过最小化均方误差来找到最佳分割。今天,在机器学习“降临日历”的第 7 天,我们切换到分类。只需一个数值特征和两个类别,我们就可以探索决策树分类器如何使用基尼和熵等杂质度量来决定在哪里切割数据。即使不进行数学计算,我们也可以直观地猜测可能的分割点。但哪一个最好呢?杂质测量真的会产生影响吗?让我们在 Excel 中逐步构建第一个分割,看看会发生什么。机器学习“降临日历”第 7 天:决策树分类器一文首先出现在《走向数据科学》上。

人工智能、机器学习、深度学习和生成式 AI — 清晰解释

Artificial Intelligence, Machine Learning, Deep Learning, and Generative AI — Clearly Explained

理解 2026 年的人工智能——从机器学习到生成模型《人工智能、机器学习、深度学习和生成人工智能——清晰解释》一文首先出现在《走向数据科学》上。

阅读法学硕士时代的研究论文

Reading Research Papers in the Age of LLMs

我如何通过手动阅读和人工智能辅助阅读相结合的方式跟上论文的步伐《法学硕士时代的阅读研究论文》首先出现在《走向数据科学》上。

机器学习“降临日历”第六天:决策树回归器

The Machine Learning “Advent Calendar” Day 6: Decision Tree Regressor

在机器学习降临节日历的第一天,我们探索了基于距离的模型。今天,我们转向一种完全不同的学习方式:决策树。通过一个简单的单特征数据集,我们可以看到树如何选择其第一次分裂。这个想法总是一样的:如果人类可以直观地猜出分割,那么我们可以在 Excel 中逐步重建逻辑。通过列出所有可能的分割值并计算每个分割值的 MSE,我们可以识别出最能减少误差的分割。这让我们对决策树如何生长、如何进行预测以及为什么第一次分割如此关键的步骤有一个清晰的直觉。机器学习“降临日历”第 6 天:决策树回归器首先出现在《走向数据科学》上。

机器学习“降临节日历”第五天:Excel 中的 GMM

The Machine Learning “Advent Calendar” Day 5: GMM in Excel

本文介绍了高斯混合模型作为 k-Means 的自然扩展,通过方差和马哈拉诺比斯距离改进了距离测量方式。 GMM 没有将点分配给具有硬边界的簇,而是使用通过期望最大化算法(劳埃德方法的一般形式)学习的概率。使用简单的 Excel 公式,我们在 1D 和 2D 中逐步实现 EM,并可视化高斯曲线或椭圆在训练期间如何移动。均值转变、方差调整,形状逐渐围绕数据的真实结构稳定下来。GMM 提供了一种更丰富、更灵活的方式来建模集群,一旦该过程在电子表格中可见,它就会变得直观。机器学习“降临日历”第 5 天:Excel 中的 GMM 帖子首先出现在走向数据科学上。

产品数据科学家对 LinkedIn 游戏玩 500 天后的看法

A Product Data Scientist’s Take on LinkedIn Games After 500 Days of Play

一个简单的益智游戏揭示了实验、产品思维和数据科学的内容《产品数据科学家在玩 500 天后对 LinkedIn 游戏的看法》一文首先出现在《迈向数据科学》上。

YOLOv1 论文演练:YOLO 第一次看到世界的那一天

YOLOv1 Paper Walkthrough: The Day YOLO First Saw the World

YOLOv1 架构及其从头开始的 PyTorch 实现的详细演练 YOLOv1 后论文演练:YOLO 第一次看到世界的那一天首先出现在《走向数据科学》上。

将 TensorFlow 模型转换为 PyTorch 的挑战

On the Challenge of Converting TensorFlow Models to PyTorch

如何升级和优化旧版 AI/ML 模型《将 TensorFlow 模型转换为 PyTorch 的挑战》一文首先出现在 Towards Data Science 上。

TDS 简讯:如何设计有效的评估、指标和 KPI

TDS Newsletter: How to Design Evals, Metrics, and KPIs That Work

关于产生可靠见解和避免常见错误的挑战TDS 新闻通讯:如何设计有效的评估、指标和 KPI 首先出现在《迈向数据科学》上。

标签会让人工智能失明吗?自我监督解决了古老的约束问题

Do Labels Make AI Blind? Self-Supervision Solves the Age-Old Binding Problem

一篇新的 NeurIPS 2025 论文展示了自监督学习如何为 ViT 提供比监督学习更好的图像理解帖子《标签会让 AI 失明吗?》自我监督解决了古老的约束问题首先出现在《走向数据科学》上。

机器学习“降临节日历”第 4 天:Excel 中的 k-Means

The Machine Learning “Advent Calendar” Day 4: k-Means in Excel

如何实现最终看起来像“真正的”机器学习的训练算法机器学习“降临日历”第 4 天:Excel 中的 k-Means 帖子首先出现在走向数据科学上。

在 20 分钟内构建并部署您的第一个供应链应用程序

Build and Deploy Your First Supply Chain App in 20 Minutes

一位工厂操作员通过从笔记本电脑切换到 Streamlit 找到了幸福 - (图片由 Samir Saci 使用 GPT-5.1 生成)《在 20 分钟内构建和部署您的第一个供应链应用程序》一文首先出现在《走向数据科学》上。

克服可变形状张量的隐藏性能陷阱:PyTorch 中的高效数据采样

Overcoming the Hidden Performance Traps of Variable-Shaped Tensors: Efficient Data Sampling in PyTorch

PyTorch 模型性能分析和优化 — 第 11 部分克服可变形状张量的隐藏性能陷阱:PyTorch 中的高效数据采样一文首先出现在 Towards Data Science 上。

机器学习“降临节日历”第 3 天:Excel 中的 GNB、LDA 和 QDA

The Machine Learning “Advent Calendar” Day 3: GNB, LDA and QDA in Excel

从局部距离到全局概率机器学习“降临日历”第 3 天:Excel 中的 GNB、LDA 和 QDA 帖子首先出现在走向数据科学上。

多代理竞技场:2025 年伦敦 Great Agent Hack 的见解

Multi-Agent Arena: Insights from London Great Agent Hack 2025

重要的是:强大的代理、玻璃盒推理和红队弹性后多代理竞技场:伦敦伟大代理黑客 2025 的见解首先出现在走向数据科学上。