走向数据科学领域信息情报检索

在数据科学领域分享概念、思想和代码。Towards Data Science Inc.是一家在加拿大注册的公司。它为成千上万的人提供了一个交流思想、扩展对数据科学理解的平台。

我的模型失败了。这就是我成为一名更好的数据科学家的方式。

My Models Failed. That’s How I Became a Better Data Scientist.

数据泄露、真实世界模型以及医疗保健领域的 AI 生产之路我的模型失败了。这就是我成为一名更好的数据科学家的方式。首先出现在《走向数据科学》上。

如何让 Claude 代码从自己的错误中改进

How to Make Claude Code Improve from its Own Mistakes

通过持续学习增强 Claude Code 文章《如何让 Claude Code 从自身错误中改进》一文首先出现在《走向数据科学》上。

从仪表板到决策:重新思考人工智能时代的数据和分析

From Dashboards to Decisions: Rethinking Data & Analytics in the Age of AI

人工智能代理、数据基础和以人为本的分析如何重塑决策的未来《从仪表板到决策:人工智能时代重新思考数据和分析》一文首先出现在《走向数据科学》上。

2026 年首席数据和人工智能官人工智能实施完整指南

The Complete Guide to AI Implementation for Chief Data & AI Officers in 2026

如何利用框架有效地优先考虑人工智能计划,以快速加速增长和效率《2026 年首席数据和人工智能官员人工智能实施完整指南》一文首先出现在《走向数据科学》上。

4 个 Pandas 概念悄然破坏您的数据管道

4 Pandas Concepts That Quietly Break Your Data Pipelines

掌握数据类型、索引对齐和防御性 Pandas 实践,以防止实际数据管道中出现无声错误。帖子 4 Pandas Concepts That Quietly Break Your Data Pipelines 首先出现在 Towards Data Science 上。

因果推理正在吞噬机器学习

Causal Inference Is Eating Machine Learning

您的 ML 模型可以完美预测,但会建议错误的操作。学习 5 个问题诊断、方法比较矩阵和 Python 工作流程,通过因果推理来修复它。因果推理正在吞噬机器学习这篇文章首先出现在《走向数据科学》上。

神经符号欺诈检测:在 F1 下降之前捕捉概念漂移(无标签)

Neuro-Symbolic Fraud Detection: Catching Concept Drift Before F1 Drops (Label-Free)

本文询问接下来会发生什么。该模型将其欺诈知识编码为符号规则。 V14 低于阈值意味着欺诈。当这种关系开始改变时会发生什么?规则可以起到金丝雀的作用吗?换句话说:神经符号概念漂移监控能否在没有标签的情况下在推理时工作?混合神经符号欺诈检测的完整架构背景:用域规则引导神经网络以及神经网络如何学习自己的欺诈规则:神经符号人工智能实验。您将在没有它们的情况下阅读本文,但机制部分在上下文中更有意义。神经符号欺诈检测:在 F1 下降之前捕获概念漂移(无标签)首先出现在走向数据科学上。

我使用 Vibe Coding 在一个周末内构建了一个播客剪辑应用程序

I Built a Podcast Clipping App in One Weekend Using Vibe Coding

使用 Replit、AI 代理和最少的手动编码进行快速原型制作我使用 Vibe 编码在一个周末构建了一个播客剪辑应用程序的帖子首先出现在 Towards Data Science 上。

使用 OpenAI API 进行提示缓存:完整的 Python 实践教程

Prompt Caching with the OpenAI API: A Full Hands-On Python tutorial

使您的 OpenAI 应用程序更快、更便宜、更高效的分步指南使用 OpenAI API 进行提示缓存:完整的 Python 实践教程首先出现在 Towards Data Science 上。

从头开始用 Python 构建 Navier-Stokes 求解器:模拟气流

Building a Navier-Stokes Solver in Python from Scratch: Simulating Airflow

使用 NumPy 实现 CFD 的实践指南,从离散化到鸟翼周围的气流模拟从头开始用 Python 构建 Navier-Stokes 求解器:模拟气流一文首先出现在 Towards Data Science 上。

逃离 SQL 丛林

Escaping the SQL Jungle

大多数数据平台不会一夜之间崩溃;随着查询的进行,它们变得越来越复杂。随着时间的推移,业务逻辑遍布 SQL 脚本、仪表板和计划作业,直到系统变成“SQL 丛林”。本文探讨了这是如何发生的以及如何恢复结构。逃离 SQL 丛林的帖子首先出现在 Towards Data Science 上。

使用分段线性近似的非线性约束优化的简要介绍

A Gentle Introduction to Nonlinear Constrained Optimization with Piecewise Linear Approximations

分段线性逼近是使用 Gurobi 等 LP/MIP 求解器处理非线性约束模型的实用方法。这篇文章《使用分段线性逼近的非线性约束优化的温和介绍》首先出现在《走向数据科学》上。

杀死你的人工智能代理的数学

The Math That’s Killing Your AI Agent

准确率 85% 的 AI 代理在执行 10 步任务时,五分之四会失败。了解生产故障背后的复合概率数学(以及用于修复它的 4 检查预部署框架)。《杀死你的 AI 代理的数学》一文首先出现在《走向数据科学》上。

构建稳健的信用评分模型(第 3 部分)

Building Robust Credit Scoring Models (Part 3)

使用 Python 处理借款人数据中的异常值和缺失值。构建稳健的信用评分模型(第 3 部分)一文首先出现在 Towards Data Science 上。

如何衡量人工智能价值

How to Measure AI Value

虽然效率是人工智能价值的重要来源,但这只是图片的一部分《如何衡量人工智能价值》一文首先出现在《迈向数据科学》上。

Vibe 工程基础知识

The Basics of Vibe Engineering

构建没有编码部分的产品The Basics of Vibe Engineering 首先出现在 Towards Data Science 上。

超越提示缓存:您还应该在 RAG 管道中缓存 5 种内容

Beyond Prompt Caching: 5 More Things You Should Cache in RAG Pipelines

跨 RAG 管道缓存层的实用指南,从查询嵌入到完整的查询响应重用超越提示缓存:您应该在 RAG 管道中缓存的 5 种其他内容首先出现在 Towards Data Science 上。

线性回归实际上是一个投影问题,第 1 部分:几何直觉

Linear Regression Is Actually a Projection Problem, Part 1: The Geometric Intuition

向量和投影的视觉指南后线性回归实际上是一个投影问题,第 1 部分:几何直觉首先出现在《走向数据科学》上。