6 Technical Skills That Make You a Senior Data Scientist
除了编写代码之外,这些设计层面的决策、权衡和习惯悄悄地将高级数据科学家与其他人区分开来。文章 6 使您成为高级数据科学家的技术技能首先出现在走向数据科学上。
The Machine Learning “Advent Calendar” Day 14: Softmax Regression in Excel
Softmax 回归只是扩展到多个类别的 Logistic 回归。通过计算每个类别的一个线性分数并使用 Softmax 对其进行归一化,我们在不改变核心逻辑的情况下获得多类别概率。损失、梯度和优化保持不变。只是并行分数的数量增加。在 Excel 中实现,模型变得透明:您可以看到分数、概率以及系数如何随时间变化。机器学习“降临日历”日帖子14:Excel 中的 Softmax 回归首先出现在《Towards Data Science》上。
The Skills That Bridge Technical Work and Business Impact
在作者聚焦系列中,TDS 编辑与我们社区的成员讨论了他们在数据科学和人工智能方面的职业道路、他们的写作以及他们的灵感来源。今天,我们很高兴与 Maria Mouschoutzi 分享我们的对话。 Maria 是一名数据分析师和项目经理,在运筹学、机械领域拥有深厚的背景。《连接技术工作和业务影响的技能》一文首先出现在《走向数据科学》上。
The Machine Learning “Advent Calendar” Day 13: LASSO and Ridge Regression in Excel
岭回归和套索回归通常被认为是线性回归的更复杂版本。事实上,预测模型保持完全相同。改变的是训练目标。通过对系数添加惩罚,正则化迫使模型选择更稳定的解决方案,尤其是当特征相关时。在 Excel 中逐步实现 Ridge 和 Lasso 使这个想法变得明确:正则化不会增加复杂性,它会增加偏好。机器学习“降临日历”第 13 天:Excel 中的 LASSO 和 Ridge 回归一文首先出现在《走向数据科学》上。
NeurIPS 2025 Best Paper Review: Qwen’s Systematic Exploration of Attention Gating
这个小技巧可以带来增强的训练稳定性、使用更大的学习率和改进的扩展特性NeurIPS 2025 最佳论文评论:Qwen 的注意力门控系统探索首先出现在 Towards Data Science 上。
The Machine Learning “Advent Calendar” Day 12: Logistic Regression in Excel
在本文中,我们直接在 Excel 中一步步重建逻辑回归。从二进制数据集开始,我们探讨线性回归作为分类器为何举步维艰,逻辑函数如何解决这些问题,以及对数损失如何自然地从似然中出现。借助透明的梯度下降表,您可以在每次迭代中观察模型的学习情况,从而使整个过程直观、直观且令人惊讶地令人满意。机器学习“降临日历”第 12 天:Excel 中的逻辑回归首先出现在走向数据科学。
Decentralized Computation: The Hidden Principle Behind Deep Learning
深度学习的大多数突破——从简单的神经网络到大型语言模型——都建立在比人工智能本身更古老的原则之上:去中心化。现代基于深度学习的人工智能模型之所以成功,是因为许多简单的单元在本地进行交互,而不是依赖强大的“中央规划器”来协调和指挥其他组件的行为。
EDA in Public (Part 1): Cleaning and Exploring Sales Data with Pandas
大家好!欢迎开始我称之为“公共 EDA”的重要数据之旅。对于那些了解我的人来说,我相信学习任何东西的最好方法就是解决现实世界的问题并分享整个混乱的过程——包括错误、胜利以及中间的一切。如果您一直在寻求提升 [...]公共 EDA 帖子(第 1 部分):使用 Pandas 清理和探索销售数据首先出现在走向数据科学上。
Spectral Community Detection in Clinical Knowledge Graphs
简介 我们如何识别大型队列中的潜在患者群体?我们如何才能发现患者之间的相似之处,而不仅仅是与特定疾病相关的众所周知的合并症群?更重要的是,我们如何提取可以在不同临床场景中进行分析、比较和重用的定量信号?与临床知识图中的光谱社区检测后相关的信息首先出现在走向数据科学上。
The Machine Learning “Advent Calendar” Day 11: Linear Regression in Excel
线性回归看似简单,但却介绍了现代机器学习的核心思想:损失函数、优化、梯度、缩放和解释。在本文中,我们在 Excel 中重建线性回归,将闭式解与梯度下降进行比较,看看系数如何一步步演化。这个基础自然会导致正则化、核、分类和对偶视图。线性回归不仅仅是一条直线,而是我们接下来将在降临节中探索的许多模型的起点。日历。机器学习“降临日历”第 11 天:Excel 中的线性回归一文首先出现在走向数据科学上。
Drawing Shapes with the Python Turtle Module
探索 Python Turtle 模块的分步教程使用 Python Turtle 模块绘制形状一文首先出现在 Towards Data Science 上。
7 Pandas Performance Tricks Every Data Scientist Should Know
在太多缓慢的笔记本和冻结的会话之后,我学到了如何让 Pandas 更快。每个数据科学家都应该知道的 7 个 Pandas 性能技巧后文章首先出现在《走向数据科学》上。
How Agent Handoffs Work in Multi-Agent Systems
了解基于 LLM 的代理如何在多代理系统中使用 LangGraph 相互传输控制权这篇文章《多代理系统中的代理切换如何工作》首先出现在《走向数据科学》上。
The Machine Learning “Advent Calendar” Day 10: DBSCAN in Excel
DBSCAN 展示了我们可以用一个非常简单的想法走多远:计算每个点附近有多少个邻居。它无需任何概率模型即可找到集群并标记异常,并且在 Excel 中运行良好。但由于它依赖于一个固定半径,因此需要 HDBSCAN 来使该方法在实际数据上稳健。机器学习“降临日历”第 10 天:Excel 中的 DBSCAN 帖子首先出现在《走向数据科学》上。
How to Maximize Agentic Memory for Continual Learning
了解如何通过持续学习成为一名高效的工程师 法学硕士如何最大化代理记忆以进行持续学习一文首先出现在《走向数据科学》上。
Optimizing PyTorch Model Inference on AWS Graviton
在 CPU 上加速 AI/ML 的技巧 — 第 2 部分优化 AWS Graviton 上的 PyTorch 模型推理一文首先出现在 Towards Data Science 上。
The Machine Learning “Advent Calendar” Day 9: LOF in Excel
在本文中,我们通过三个简单的步骤来探索 LOF:距离和邻居、可达距离以及最终的 LOF 分数。使用微小的数据集,我们可以看到两个异常如何对我们来说看起来很明显,但对于不同的算法却完全不同。这揭示了无监督学习的关键思想:不存在单一的“真实”异常值,只有定义。理解这些定义才是真正的技能。机器学习“降临日历”第 9 天:Excel 中的 LOF 这篇文章首先出现在走向数据科学上。