走向数据科学领域信息情报检索

在数据科学领域分享概念、思想和代码。Towards Data Science Inc.是一家在加拿大注册的公司。它为成千上万的人提供了一个交流思想、扩展对数据科学理解的平台。

TDS 时事通讯:引人入胜的数据故事如何带来更好的业务决策

TDS Newsletter: How Compelling Data Stories Lead to Better Business Decisions

为什么数据驱动的故事仍然是从业者的常青工具TDS 新闻通讯:引人注目的数据故事如何带来更好的业务决策首先出现在走向数据科学上。

为 Kaggle 竞赛组织代码、实验和研究

Organizing Code, Experiments, and Research for Kaggle Competitions

获得 Kaggle 竞赛奖牌时学到的经验教训和技巧《为 Kaggle 竞赛组织代码、实验和研究》一文首先出现在《迈向数据科学》上。

当 Pearson 不够时的 Spearman 相关系数

Spearman Correlation Coefficient for When Pearson Isn’t Enough

并非所有关系都是线性的,这就是 Spearman 的用武之地。当 Pearson 不够时的后 Spearman 相关系数首先出现在《走向数据科学》上。

Power BI 聚合终极指南

The Ultimate Guide to Power BI Aggregations

聚合是 Power BI 中最强大的功能之一 - 了解如何利用此功能来提高 Power BI 解决方案的性能这篇文章《Power BI 聚合终极指南》首先出现在 Towards Data Science 上。

如何评估 RAG 管道中的检索质量(第 3 部分):DCG@k 和 NDCG@k

How to Evaluate Retrieval Quality in RAG Pipelines (Part 3): DCG@k and NDCG@k

使用分级度量评估 RAG 管道的检索质量的第三部分也是最后一部分如何评估 RAG 管道中的检索质量(第 3 部分):DCG@k 和 NDCG@k 首先出现在 Towards Data Science 上。

特征检测,第 2 部分:拉普拉斯和高斯运算符

Feature Detection, Part 2: Laplace & Gaussian Operators

拉普拉斯遇见高斯——边缘检测中两个算子的故事特征检测后,第 2 部分:拉普拉斯和高斯算子首先出现在《走向数据科学》上。

数据科学的三个时代:何时使用传统机器学习、深度学习或法学硕士(用一个示例进行解释)

The Three Ages of Data Science: When to Use Traditional Machine Learning, Deep Learning, or an LLM (Explained with One Example)

一个描述数据科学家工作如何在三代机器学习中发生变化的实际用例《数据科学的三个时代:何时使用传统机器学习、深度学习或法学硕士(用一个例子解释)》一文首先出现在《走向数据科学》上。

如何使用 GPT-5 构建代理

How to Build Agents with GPT-5

了解如何使用 GPT-5 作为数据上强大的 AI 代理。如何使用 GPT-5 构建代理一文首先出现在 Towards Data Science 上。

人工智能炒作:不要高估人工智能的影响

AI Hype: Don’t Overestimate the Impact of AI

目标是登月而不是手推车人工智能炒作:不要高估人工智能的影响这篇文章首先出现在《走向数据科学》上。

使用 C 使 Python 速度提高 150 倍

Make Python Up to 150× Faster with C

将性能关键型代码卸载到 C 而不放弃 Python 的实用指南。使用 C 将 Python 速度提高 150 倍一文首先出现在 Towards Data Science 上。

为什么用数据讲故事对业务和数据分析师很重要

Why Storytelling With Data Matters for Business and Data Analysts

数据正在推动业务的未来,以下是您如何为未来做好准备的文章《为什么用数据讲故事对业务和数据分析师很重要》一文首先出现在《迈向数据科学》上。

更多的数据总是能带来更好的性能吗?

Does More Data Always Yield Better Performance?

通过试验样本大小、属性集和模型复杂性之间的相互作用,探索和挑战“更多数据 → 更好性能”的传统智慧。帖子“更多数据总是会产生更好的性能吗?”首先出现在《走向数据科学》上。

数据文化只是症状,而不是解决方案

Data Culture Is the Symptom, Not the Solution

数据投资失败的隐藏原因《数据文化是症状,而不是解决方案》一文首先出现在《迈向数据科学》上。

LLM 支持的时间序列分析

LLM-Powered Time-Series Analysis

第 2 部分:高级模型开发提示由法学硕士支持的时间序列分析首先出现在《走向数据科学》上。

营销中的力量分析:实践介绍

Power Analysis in Marketing: A Hands-On Introduction

第 1 部分:什么是统计功效以及我们如何计算它?营销中的功效分析:实践介绍首先出现在《走向数据科学》上。

超越数字:如何人性化您的数据和分析

Beyond Numbers: How to Humanize Your Data & Analysis

闪烁的网格视错觉是原始数据如何误导我们、导致我们看到错误趋势的完美比喻。为了摆脱“数据丰富,行动匮乏”的悖论,组织应该需要数据人性化。这种方法的重点是将抽象指标(“内容”)转化为清晰的、可操作的故事(“原因”)。它需要像“数据工匠”这样的新角色,这是“讲数据故事”的核心能力,并专注于证明这些更清晰的见解的财务影响(投资回报率)。超越数字:如何人性化您的数据和分析的帖子首先出现在走向数据科学上。

TDS 时事通讯:有效使用人工智能的理论与实践

TDS Newsletter: The Theory and Practice of Using AI Effectively

当我们遇到一项新技术(例如法学硕士申请)时,我们中的一些人往往会卷起袖子立即投入其中,迫不及待地开始修补。其他人则更喜欢更谨慎的方法:阅读一些相关的研究论文,或浏览一堆博客文章,目的是了解这些工具的背景[…]TDS 时事通讯:有效使用人工智能的理论和实践首先出现在走向数据科学上。

AI产品管理中的期望值分析

Expected Value Analysis in AI Product Management

关键概念和实际应用介绍人工智能产品管理中的期望值分析一文首先出现在《走向数据科学》上。