走向数据科学领域信息情报检索

在数据科学领域分享概念、思想和代码。Towards Data Science Inc.是一家在加拿大注册的公司。它为成千上万的人提供了一个交流思想、扩展对数据科学理解的平台。

公共 EDA(第 2 部分):Pandas 中的产品深度挖掘和时间序列分析

EDA in Public (Part 2): Product Deep Dive & Time-Series Analysis in Pandas

了解如何分析产品性能、提取时间序列特征以及揭示销售数据中的关键季节性趋势。公共 EDA 帖子(第 2 部分):Pandas 中的产品深度探究和时间序列分析首先出现在 Towards Data Science 上。

机器学习“降临节日历”第 19 天:Excel 中的装袋

The Machine Learning “Advent Calendar” Day 19: Bagging in Excel

从 Excel 中的基本原理理解集成学习机器学习“降临日历”第 19 天:Excel 中的装袋一文首先出现在《迈向数据科学》上。

我如何使用线性规划优化我的落叶策略

How I Optimized My Leaf Raking Strategy Using Linear Programming

从周末的琐事到有价值的运筹学原理的有趣应用我如何使用线性编程优化我的叶子收集策略一文首先出现在走向数据科学上。

2025 年必读:代理、Python、法学硕士等

2025 Must-Reads: Agents, Python, LLMs, and More

不要错过我们去年最受欢迎的文章!2025 年后必读文章:代理、Python、法学硕士等首先出现在《走向数据科学》上。

机器学习“降临节日历”第 18 天:Excel 中的神经网络分类器

The Machine Learning “Advent Calendar” Day 18: Neural Network Classifier in Excel

通过显式公式理解前向传播和反向传播机器学习“降临日历”第 18 天:Excel 中的神经网络分类器一文首先出现在《走向数据科学》上。

使用 Google AI Studio 增强数据科学工作流程的 4 种方法

4 Ways to Supercharge Your Data Science Workflow with Google AI Studio

提供了使用 AI Studio 构建模式来更快地学习、更智能地构建原型、更清晰地沟通和更快地自动化的具体示例。使用 Google AI Studio 增强数据科学工作流程的 4 种方法一文首先出现在 Towards Data Science 上。

对于足够密集的输入,在线性时间内解决子集和问题

The Subset Sum Problem Solved in Linear Time for Dense Enough Inputs

当输入值彼此足够接近时,著名的 NP 完全问题的最佳解决方案。在足够密集输入的线性时间内解决的子集和问题一文首先出现在《走向数据科学》上。

受赫斯特价值百万美元的斑点画的启发,用 Python 生成艺术品

Generating Artwork in Python Inspired by Hirst’s Million-Dollar Spots Painting

使用 Python 生成艺术品这篇文章《受赫斯特百万美元斑点画的启发,用 Python 生成艺术品》一文首先出现在《走向数据科学》上。

使用 Python 进行时间序列异常检测的实用工具包

A Practical Toolkit for Time Series Anomaly Detection, Using Python

以下是如何检测每个序列中的点异常,并识别整个银行的异常信号使用 Python 进行时间序列异常检测的实用工具包一文首先出现在走向数据科学上。

机器学习“降临日历”第 17 天:Excel 中的神经网络回归器

The Machine Learning “Advent Calendar” Day 17: Neural Network Regressor in Excel

神经网络通常感觉就像黑匣子。在本文中,我们仅使用 Excel 公式从头开始构建神经网络回归器。通过明确从前向传播到反向传播的每一步,我们展示了神经网络如何学习仅用少量参数来逼近非线性函数。机器学习“降临日历”第 17 天:Excel 中的神经网络回归器一文首先出现在《走向数据科学》上。

AI 代理的生产级可观测性:最少代码、配置优先的方法

Production-Grade Observability for AI Agents: A Minimal-Code, Configuration-First Approach

LLM 作为法官、回归测试和多代理 LLM 系统的端到端可追溯性人工智能代理的后期生产级可观察性:最少代码、配置优先的方法首先出现在《走向数据科学》上。

有效利用人工智能代理进行编码的 3 种技术

3 Techniques to Effectively Utilize AI Agents for Coding

了解如何使用编码代理成为一名高效的工程师《有效利用人工智能代理进行编码的 3 种技术》一文首先出现在《走向数据科学》上。

何时(不)使用矢量数据库

When (Not) to Use Vector DB

当索引弊大于利时:我们如何认识到我们的 RAG 用例需要键值存储,而不是向量数据库何时(不)使用向量数据库一文首先出现在走向数据科学上。

使用 Power Query 将数字和文本分隔在一列中

Separate Numbers and Text in One Column Using Power Query

一个包含数字和文本列的 Excel 工作表?真是一团糟!使用 Power Query 在一列中分离数字和文本的帖子首先出现在走向数据科学上。

机器学习“降临日历”第 16 天:Excel 中的内核技巧

The Machine Learning “Advent Calendar” Day 16: Kernel Trick in Excel

核 SVM 通常感觉很抽象,包含核、对偶公式和支持向量。在这篇文章中,我们走了一条不同的路。从核密度估计开始,我们逐步将核 SVM 构建为局部钟声的总和,通过铰链损失进行加权和选择,直到仅保留基本数据点。机器学习“降临日历”第 16 天:Excel 中的核技巧首先出现在《走向数据科学》上。

8 年机器学习经验教训

Lessons Learned After 8 Years of Machine Learning

深度工作、过度识别、体育和博客《机器学习 8 年之后的经验教训》一文首先出现在《迈向数据科学》上。

机器学习“降临节日历”第 15 天:Excel 中的 SVM

The Machine Learning “Advent Calendar” Day 15: SVM in Excel

本文不是从边距和几何形状开始,而是从熟悉的模型逐步构建支持向量机。通过改变损失函数并重新使用正则化,SVM 自然地表现为经过优化训练的线性分类器。这种观点将逻辑回归、SVM 和其他线性模型统一到一个单一的、连贯的框架中。机器学习“降临日历”第 15 天:Excel 中的 SVM 帖子首先出现在走向数据科学上。

使您成为高级数据科学家的 6 项技术技能

6 Technical Skills That Make You a Senior Data Scientist

除了编写代码之外,这些设计层面的决策、权衡和习惯悄悄地将高级数据科学家与其他人区分开来。文章 6 使您成为高级数据科学家的技术技能首先出现在走向数据科学上。