走向数据科学领域信息情报检索

在数据科学领域分享概念、思想和代码。Towards Data Science Inc.是一家在加拿大注册的公司。它为成千上万的人提供了一个交流思想、扩展对数据科学理解的平台。

我通过联邦学习评估了 50 万条信用记录。这是我发现的内容

I Evaluated Half a Million Credit Records with Federated Learning. Here’s What I Found

为什么隐私会在小范围内破坏公平性,以及协作如何在不共享单个记录的情况下解决这两个问题我用联邦学习评估了 50 万信用记录。这是我的发现首先出现在《走向数据科学》上。

概率多变量推理:将流利的 LLM 答案转化为加权选项

Probabilistic Multi-Variant Reasoning: Turning Fluent LLM Answers Into Weighted Options

人类引导的 AI 协作概率多变量推理:将流畅的 LLM 答案转化为加权选项一文首先出现在《走向数据科学》上。

为什么供应链是 2026 年数据科学家的最佳领域(以及如何学习)

Why Supply Chain is the Best Domain for Data Scientists in 2026 (And How to Learn It)

在供应链工作 10 年后,我对为什么供应链可以成为希望看到自己的技能得到重视的数据科学家的绝佳游乐场的看法。为什么供应链是 2026 年数据科学家的最佳领域(以及如何学习)一文首先出现在《走向数据科学》上。

使用 NeMo Agent Toolkit 衡量重要事项

Measuring What Matters with NeMo Agent Toolkit

可观察性、评估和模型比较的实用指南使用 NeMo Agent Toolkit 衡量重要内容一文首先出现在 Towards Data Science 上。

最好的数据科学家总是在学习

The Best Data Scientists Are Always Learning

第 2 部分:避免倦怠、学习策略和孤独的超能力最佳数据科学家总是在学习的帖子首先出现在《走向数据科学》上。

如何优化您的 AI 编码代理上下文

How to Optimize Your AI Coding Agent Context

让您的编码代理更高效如何优化您的 AI 编码代理上下文一文首先出现在《走向数据科学》上。

特征检测,第 3 部分:Harris 角点检测

Feature Detection, Part 3: Harris Corner Detection

寻找图像中信息最丰富的点特征检测后,第 3 部分:Harris 角点检测首先出现在《走向数据科学》上。

Ray:全民分布式计算,第 1 部分

Ray: Distributed Computing for All, Part 1

从本地 PC 及其他电脑上的单核到多核雷后:全民分布式计算,第 1 部分首先出现在《迈向数据科学》上。

停止责怪数据:处理协方差漂移的更好方法

Stop Blaming the Data: A Better Way to Handle Covariance Shift

不要使用偏移作为性能不佳的借口,而是使用逆概率加权来估计模型在新环境中的表现。停止指责数据:处理协方差偏移的更好方法首先出现在走向数据科学上。

YOLOv1 损失函数演练:所有人的回归

YOLOv1 Loss Function Walkthrough: Regression for All

解释 YOLOv1 如何衡量其对象检测和分类预测的正确性YOLOv1 损失函数演练:所有人的回归首先出现在《走向数据科学》上。

Prompt Engineering 与 RAG 编辑简历

Prompt Engineering vs RAG for Editing Resumes

在 Azure 中运行无代码比较用于编辑简历的 Prompt Engineering 与 RAG 帖子首先出现在 Towards Data Science 上。

如何在语义模型中过滤日期,包括或排除未来日期

How to Filter for Dates, Including or Excluding Future Dates, in Semantic Models

计划数据或上一年的数据显示在今天日期之后的情况很常见。但未来的数据可能会令人困惑。如何添加切片器来显示或隐藏未来的数据?让我们看看如何做到这一点。这篇文章《如何在语义模型中过滤日期,包括或排除未来日期》首先出现在《走向数据科学》上。

优化 AI/ML 工作负载中的数据传输

Optimizing Data Transfer in AI/ML Workloads

借助 NVIDIA Nsight™ 系统,深入探讨数据传输瓶颈、识别瓶颈和解决方案优化 AI/ML 工作负载中的数据传输一文首先出现在 Towards Data Science 上。

鲁棒机器学习系统中的漂移检测

Drift Detection in Robust Machine Learning Systems

机器学习系统长期成功的先决条件“鲁棒机器学习系统中的漂移检测”一文首先出现在《走向数据科学》上。

与众不同的职业是数据的未来

Off-Beat Careers That Are the Future Of Data

您需要探索的非传统职业道路“数据未来的另类职业”首先出现在《迈向数据科学》上。

讲述数据故事的真正挑战:通过简单性获得认可

The Real Challenge in Data Storytelling: Getting Buy-In for Simplicity

当您清晰的仪表板遇到希望在一个屏幕上显示所有内容的利益相关者时,会发生什么《数据讲故事的真正挑战:获得简单性的支持》一文首先出现在《走向数据科学》上。

公共 EDA(第 3 部分):Pandas 客户细分的 RFM 分析

EDA in Public (Part 3): RFM Analysis for Customer Segmentation in Pandas

如何逐步构建、评分和解释 RFM 细分公共 EDA 后(第 3 部分):Pandas 中客户细分的 RFM 分析首先出现在 Towards Data Science 上。

深度强化学习:Actor-Critic 方法

Deep Reinforcement Learning: The Actor-Critic Method

机器人朋友合作学习驾驶无人机《深度强化学习:演员-批评家方法》一文首先出现在《走向数据科学》上。