走向数据科学领域信息情报检索

在数据科学领域分享概念、思想和代码。Towards Data Science Inc.是一家在加拿大注册的公司。它为成千上万的人提供了一个交流思想、扩展对数据科学理解的平台。

使用 Google AI Studio 增强数据科学工作流程的 4 种方法

4 Ways to Supercharge Your Data Science Workflow with Google AI Studio

提供了使用 AI Studio 构建模式来更快地学习、更智能地构建原型、更清晰地沟通和更快地自动化的具体示例。使用 Google AI Studio 增强数据科学工作流程的 4 种方法一文首先出现在 Towards Data Science 上。

对于足够密集的输入,在线性时间内解决子集和问题

The Subset Sum Problem Solved in Linear Time for Dense Enough Inputs

当输入值彼此足够接近时,著名的 NP 完全问题的最佳解决方案。在足够密集输入的线性时间内解决的子集和问题一文首先出现在《走向数据科学》上。

受赫斯特价值百万美元的斑点画的启发,用 Python 生成艺术品

Generating Artwork in Python Inspired by Hirst’s Million-Dollar Spots Painting

使用 Python 生成艺术品这篇文章《受赫斯特百万美元斑点画的启发,用 Python 生成艺术品》一文首先出现在《走向数据科学》上。

使用 Python 进行时间序列异常检测的实用工具包

A Practical Toolkit for Time Series Anomaly Detection, Using Python

以下是如何检测每个序列中的点异常,并识别整个银行的异常信号使用 Python 进行时间序列异常检测的实用工具包一文首先出现在走向数据科学上。

机器学习“降临日历”第 17 天:Excel 中的神经网络回归器

The Machine Learning “Advent Calendar” Day 17: Neural Network Regressor in Excel

神经网络通常感觉就像黑匣子。在本文中,我们仅使用 Excel 公式从头开始构建神经网络回归器。通过明确从前向传播到反向传播的每一步,我们展示了神经网络如何学习仅用少量参数来逼近非线性函数。机器学习“降临日历”第 17 天:Excel 中的神经网络回归器一文首先出现在《走向数据科学》上。

AI 代理的生产级可观测性:最少代码、配置优先的方法

Production-Grade Observability for AI Agents: A Minimal-Code, Configuration-First Approach

LLM 作为法官、回归测试和多代理 LLM 系统的端到端可追溯性人工智能代理的后期生产级可观察性:最少代码、配置优先的方法首先出现在《走向数据科学》上。

有效利用人工智能代理进行编码的 3 种技术

3 Techniques to Effectively Utilize AI Agents for Coding

了解如何使用编码代理成为一名高效的工程师《有效利用人工智能代理进行编码的 3 种技术》一文首先出现在《走向数据科学》上。

何时(不)使用矢量数据库

When (Not) to Use Vector DB

当索引弊大于利时:我们如何认识到我们的 RAG 用例需要键值存储,而不是向量数据库何时(不)使用向量数据库一文首先出现在走向数据科学上。

使用 Power Query 将数字和文本分隔在一列中

Separate Numbers and Text in One Column Using Power Query

一个包含数字和文本列的 Excel 工作表?真是一团糟!使用 Power Query 在一列中分离数字和文本的帖子首先出现在走向数据科学上。

机器学习“降临日历”第 16 天:Excel 中的内核技巧

The Machine Learning “Advent Calendar” Day 16: Kernel Trick in Excel

核 SVM 通常感觉很抽象,包含核、对偶公式和支持向量。在这篇文章中,我们走了一条不同的路。从核密度估计开始,我们逐步将核 SVM 构建为局部钟声的总和,通过铰链损失进行加权和选择,直到仅保留基本数据点。机器学习“降临日历”第 16 天:Excel 中的核技巧首先出现在《走向数据科学》上。

8 年机器学习经验教训

Lessons Learned After 8 Years of Machine Learning

深度工作、过度识别、体育和博客《机器学习 8 年之后的经验教训》一文首先出现在《迈向数据科学》上。

机器学习“降临节日历”第 15 天:Excel 中的 SVM

The Machine Learning “Advent Calendar” Day 15: SVM in Excel

本文不是从边距和几何形状开始,而是从熟悉的模型逐步构建支持向量机。通过改变损失函数并重新使用正则化,SVM 自然地表现为经过优化训练的线性分类器。这种观点将逻辑回归、SVM 和其他线性模型统一到一个单一的、连贯的框架中。机器学习“降临日历”第 15 天:Excel 中的 SVM 帖子首先出现在走向数据科学上。

使您成为高级数据科学家的 6 项技术技能

6 Technical Skills That Make You a Senior Data Scientist

除了编写代码之外,这些设计层面的决策、权衡和习惯悄悄地将高级数据科学家与其他人区分开来。文章 6 使您成为高级数据科学家的技术技能首先出现在走向数据科学上。

机器学习“降临日历”第 14 天:Excel 中的 Softmax 回归

The Machine Learning “Advent Calendar” Day 14: Softmax Regression in Excel

Softmax 回归只是扩展到多个类别的 Logistic 回归。通过计算每个类别的一个线性分数并使用 Softmax 对其进行归一化,我们在不改变核心逻辑的情况下获得多类别概率。损失、梯度和优化保持不变。只是并行分数的数量增加。在 Excel 中实现,模型变得透明:您可以看到分数、概率以及系数如何随时间变化。机器学习“降临日历”日帖子14:Excel 中的 Softmax 回归首先出现在《Towards Data Science》上。

连接技术工作和业务影响的技能

The Skills That Bridge Technical Work and Business Impact

在作者聚焦系列中,TDS 编辑与我们社区的成员讨论了他们在数据科学和人工智能方面的职业道路、他们的写作以及他们的灵感来源。今天,我们很高兴与 Maria Mouschoutzi 分享我们的对话。 Maria 是一名数据分析师和项目经理,在运筹学、机械领域拥有深厚的背景。《连接技术工作和业务影响的技能》一文首先出现在《走向数据科学》上。

机器学习“降临日历”第 13 天:Excel 中的 LASSO 和岭回归

The Machine Learning “Advent Calendar” Day 13: LASSO and Ridge Regression in Excel

岭回归和套索回归通常被认为是线性回归的更复杂版本。事实上,预测模型保持完全相同。改变的是训练目标。通过对系数添加惩罚,正则化迫使模型选择更稳定的解决方案,尤其是当特征相关时。在 Excel 中逐步实现 Ridge 和 Lasso 使这个想法变得明确:正则化不会增加复杂性,它会增加偏好。机器学习“降临日历”第 13 天:Excel 中的 LASSO 和 Ridge 回归一文首先出现在《走向数据科学》上。

如何提高编码迭代速度

How to Increase Coding Iteration Speed

了解如何通过本地测试成为更高效的程序员《如何提高编码迭代速度》一文首先出现在《走向数据科学》上。

NeurIPS 2025 最佳论文评审:Qwen 对注意力门控的系统探索

NeurIPS 2025 Best Paper Review: Qwen’s Systematic Exploration of Attention Gating

这个小技巧可以带来增强的训练稳定性、使用更大的学习率和改进的扩展特性NeurIPS 2025 最佳论文评论:Qwen 的注意力门控系统探索首先出现在 Towards Data Science 上。