A Realistic Roadmap to Start an AI Career in 2026
如何通过真实、可用的项目在 2026 年学习人工智能《2026 年开始人工智能职业的现实路线图》一文首先出现在《迈向数据科学》上。
Bridging the Silence: How LEO Satellites and Edge AI Will Democratize Connectivity
为什么设备上的智能和低轨道星座是实现普遍可及性的唯一可行途径《弥合沉默:LEO 卫星和边缘人工智能如何使连接民主化》一文首先出现在《迈向数据科学》上。
The Machine Learning “Advent Calendar” Day 8: Isolation Forest in Excel
隔离森林可能看起来很技术性,但它的想法很简单:使用随机分割来隔离点。如果一个点很快被孤立,那么它就是一个异常点;如果需要多次分割,这是正常的。使用微小的数据集1、2、3、9,我们可以清楚地看到逻辑。我们构建几个随机树,测量每个点需要多少个分割,平均深度,并将它们转换为异常分数。短深度的分数接近 1,长深度的分数接近 0。Excel 的实现很痛苦,但算法本身很优雅。它可以扩展到许多特征,不对分布做出任何假设,甚至可以处理分类数据。最重要的是,隔离森林提出了一个不同的问题:不是“什么是正常的?”,而是“我能以多快的速度隔离这一点?”机器学习“降临日历”第 8 天:Excel 中的隔离森林帖子首先出
The AI Bubble Will Pop — And Why That Doesn’t Matter
历史上最大的科技泡沫如何解释人工智能下一步的发展方向人工智能泡沫将会破裂——以及为什么这并不重要一文首先出现在《走向数据科学》上。
Optimizing PyTorch Model Inference on CPU
在 Intel Xeon 上像狮子一样飞翔这篇文章在 CPU 上优化 PyTorch 模型推理首先出现在走向数据科学上。
How to Climb the Hidden Career Ladder of Data Science
让你晋升的行为《如何攀登数据科学隐藏的职业阶梯》一文首先出现在《迈向数据科学》上。
The Machine Learning “Advent Calendar” Day 7: Decision Tree Classifier
在第 6 天,我们看到了决策树回归器如何通过最小化均方误差来找到最佳分割。今天,在机器学习“降临日历”的第 7 天,我们切换到分类。只需一个数值特征和两个类别,我们就可以探索决策树分类器如何使用基尼和熵等杂质度量来决定在哪里切割数据。即使不进行数学计算,我们也可以直观地猜测可能的分割点。但哪一个最好呢?杂质测量真的会产生影响吗?让我们在 Excel 中逐步构建第一个分割,看看会发生什么。机器学习“降临日历”第 7 天:决策树分类器一文首先出现在《走向数据科学》上。
Artificial Intelligence, Machine Learning, Deep Learning, and Generative AI — Clearly Explained
理解 2026 年的人工智能——从机器学习到生成模型《人工智能、机器学习、深度学习和生成人工智能——清晰解释》一文首先出现在《走向数据科学》上。
Reading Research Papers in the Age of LLMs
我如何通过手动阅读和人工智能辅助阅读相结合的方式跟上论文的步伐《法学硕士时代的阅读研究论文》首先出现在《走向数据科学》上。
The Machine Learning “Advent Calendar” Day 6: Decision Tree Regressor
在机器学习降临节日历的第一天,我们探索了基于距离的模型。今天,我们转向一种完全不同的学习方式:决策树。通过一个简单的单特征数据集,我们可以看到树如何选择其第一次分裂。这个想法总是一样的:如果人类可以直观地猜出分割,那么我们可以在 Excel 中逐步重建逻辑。通过列出所有可能的分割值并计算每个分割值的 MSE,我们可以识别出最能减少误差的分割。这让我们对决策树如何生长、如何进行预测以及为什么第一次分割如此关键的步骤有一个清晰的直觉。机器学习“降临日历”第 6 天:决策树回归器首先出现在《走向数据科学》上。
The Machine Learning “Advent Calendar” Day 5: GMM in Excel
本文介绍了高斯混合模型作为 k-Means 的自然扩展,通过方差和马哈拉诺比斯距离改进了距离测量方式。 GMM 没有将点分配给具有硬边界的簇,而是使用通过期望最大化算法(劳埃德方法的一般形式)学习的概率。使用简单的 Excel 公式,我们在 1D 和 2D 中逐步实现 EM,并可视化高斯曲线或椭圆在训练期间如何移动。均值转变、方差调整,形状逐渐围绕数据的真实结构稳定下来。GMM 提供了一种更丰富、更灵活的方式来建模集群,一旦该过程在电子表格中可见,它就会变得直观。机器学习“降临日历”第 5 天:Excel 中的 GMM 帖子首先出现在走向数据科学上。
A Product Data Scientist’s Take on LinkedIn Games After 500 Days of Play
一个简单的益智游戏揭示了实验、产品思维和数据科学的内容《产品数据科学家在玩 500 天后对 LinkedIn 游戏的看法》一文首先出现在《迈向数据科学》上。
YOLOv1 Paper Walkthrough: The Day YOLO First Saw the World
YOLOv1 架构及其从头开始的 PyTorch 实现的详细演练 YOLOv1 后论文演练:YOLO 第一次看到世界的那一天首先出现在《走向数据科学》上。
On the Challenge of Converting TensorFlow Models to PyTorch
如何升级和优化旧版 AI/ML 模型《将 TensorFlow 模型转换为 PyTorch 的挑战》一文首先出现在 Towards Data Science 上。
TDS Newsletter: How to Design Evals, Metrics, and KPIs That Work
关于产生可靠见解和避免常见错误的挑战TDS 新闻通讯:如何设计有效的评估、指标和 KPI 首先出现在《迈向数据科学》上。
Do Labels Make AI Blind? Self-Supervision Solves the Age-Old Binding Problem
一篇新的 NeurIPS 2025 论文展示了自监督学习如何为 ViT 提供比监督学习更好的图像理解帖子《标签会让 AI 失明吗?》自我监督解决了古老的约束问题首先出现在《走向数据科学》上。
The Machine Learning “Advent Calendar” Day 4: k-Means in Excel
如何实现最终看起来像“真正的”机器学习的训练算法机器学习“降临日历”第 4 天:Excel 中的 k-Means 帖子首先出现在走向数据科学上。
Build and Deploy Your First Supply Chain App in 20 Minutes
一位工厂操作员通过从笔记本电脑切换到 Streamlit 找到了幸福 - (图片由 Samir Saci 使用 GPT-5.1 生成)《在 20 分钟内构建和部署您的第一个供应链应用程序》一文首先出现在《走向数据科学》上。