走向数据科学领域信息情报检索---XiaoMi-AI

2025年12月8日 15:00

人工智能泡沫将会破裂——为什么这并不重要

The AI Bubble Will Pop — And Why That Doesn’t Matter

历史上最大的科技泡沫如何解释人工智能下一步的发展方向人工智能泡沫将会破裂——以及为什么这并不重要一文首先出现在《走向数据科学》上。

2025年12月8日 12:00

在 CPU 上优化 PyTorch 模型推理

Optimizing PyTorch Model Inference on CPU

在 Intel Xeon 上像狮子一样飞翔这篇文章在 CPU 上优化 PyTorch 模型推理首先出现在走向数据科学上。

2025年12月7日 16:00

如何攀登数据科学隐藏的职业阶梯

How to Climb the Hidden Career Ladder of Data Science

让你晋升的行为《如何攀登数据科学隐藏的职业阶梯》一文首先出现在《迈向数据科学》上。

2025年12月7日 14:30

机器学习“降临日历”第 7 天：决策树分类器

The Machine Learning “Advent Calendar” Day 7: Decision Tree Classifier

在第 6 天，我们看到了决策树回归器如何通过最小化均方误差来找到最佳分割。今天，在机器学习“降临日历”的第 7 天，我们切换到分类。只需一个数值特征和两个类别，我们就可以探索决策树分类器如何使用基尼和熵等杂质度量来决定在哪里切割数据。即使不进行数学计算，我们也可以直观地猜测可能的分割点。但哪一个最好呢？杂质测量真的会产生影响吗？让我们在 Excel 中逐步构建第一个分割，看看会发生什么。机器学习“降临日历”第 7 天：决策树分类器一文首先出现在《走向数据科学》上。

2025年12月7日 13:00

人工智能、机器学习、深度学习和生成式 AI — 清晰解释

Artificial Intelligence, Machine Learning, Deep Learning, and Generative AI — Clearly Explained

理解 2026 年的人工智能——从机器学习到生成模型《人工智能、机器学习、深度学习和生成人工智能——清晰解释》一文首先出现在《走向数据科学》上。

2025年12月6日 16:00

阅读法学硕士时代的研究论文

Reading Research Papers in the Age of LLMs

我如何通过手动阅读和人工智能辅助阅读相结合的方式跟上论文的步伐《法学硕士时代的阅读研究论文》首先出现在《走向数据科学》上。

2025年12月6日 14:30

机器学习“降临日历”第六天：决策树回归器

The Machine Learning “Advent Calendar” Day 6: Decision Tree Regressor

在机器学习降临节日历的第一天，我们探索了基于距离的模型。今天，我们转向一种完全不同的学习方式：决策树。通过一个简单的单特征数据集，我们可以看到树如何选择其第一次分裂。这个想法总是一样的：如果人类可以直观地猜出分割，那么我们可以在 Excel 中逐步重建逻辑。通过列出所有可能的分割值并计算每个分割值的 MSE，我们可以识别出最能减少误差的分割。这让我们对决策树如何生长、如何进行预测以及为什么第一次分割如此关键的步骤有一个清晰的直觉。机器学习“降临日历”第 6 天：决策树回归器首先出现在《走向数据科学》上。

2025年12月5日 17:00

机器学习“降临节日历”第五天：Excel 中的 GMM

The Machine Learning “Advent Calendar” Day 5: GMM in Excel

本文介绍了高斯混合模型作为 k-Means 的自然扩展，通过方差和马哈拉诺比斯距离改进了距离测量方式。 GMM 没有将点分配给具有硬边界的簇，而是使用通过期望最大化算法（劳埃德方法的一般形式）学习的概率。使用简单的 Excel 公式，我们在 1D 和 2D 中逐步实现 EM，并可视化高斯曲线或椭圆在训练期间如何移动。均值转变、方差调整，形状逐渐围绕数据的真实结构稳定下来。GMM 提供了一种更丰富、更灵活的方式来建模集群，一旦该过程在电子表格中可见，它就会变得直观。机器学习“降临日历”第 5 天：Excel 中的 GMM 帖子首先出现在走向数据科学上。

2025年12月5日 15:30