走向数据科学领域信息情报检索

在数据科学领域分享概念、思想和代码。Towards Data Science Inc.是一家在加拿大注册的公司。它为成千上万的人提供了一个交流思想、扩展对数据科学理解的平台。

克服可变形状张量的隐藏性能陷阱:PyTorch 中的高效数据采样

Overcoming the Hidden Performance Traps of Variable-Shaped Tensors: Efficient Data Sampling in PyTorch

PyTorch 模型性能分析和优化 — 第 11 部分克服可变形状张量的隐藏性能陷阱:PyTorch 中的高效数据采样一文首先出现在 Towards Data Science 上。

机器学习“降临节日历”第 3 天:Excel 中的 GNB、LDA 和 QDA

The Machine Learning “Advent Calendar” Day 3: GNB, LDA and QDA in Excel

从局部距离到全局概率机器学习“降临日历”第 3 天:Excel 中的 GNB、LDA 和 QDA 帖子首先出现在走向数据科学上。

多代理竞技场:2025 年伦敦 Great Agent Hack 的见解

Multi-Agent Arena: Insights from London Great Agent Hack 2025

重要的是:强大的代理、玻璃盒推理和红队弹性后多代理竞技场:伦敦伟大代理黑客 2025 的见解首先出现在走向数据科学上。

机器学习“降临节日历”第 2 天:Excel 中的 k-NN 分类器

The Machine Learning “Advent Calendar” Day 2: k-NN Classifier in Excel

探索 k-NN 分类器及其变体和改进机器学习“降临日历”第 2 天:Excel 中的 k-NN 分类器一文首先出现在《走向数据科学》上。

数据科学家如何在 Python 中使用简单数据契约

How to Use Simple Data Contracts in Python for Data Scientists

使用 Pandera 进行简单的开源验证,阻止您的管道在周五下午崩溃。如何为数据科学家使用 Python 中的简单数据契约一文首先出现在 Towards Data Science 上。

如何用 Python 生成二维码

How to Generate QR Codes in Python

探索 Python“qrcode”包的初学者友好教程 如何在 Python 中生成 QR 码一文首先出现在 Towards Data Science 上。

我本月学到的机器学习课程

The Machine Learning Lessons I’ve Learned This Month

圣诞节联系、副驾驶的成本、谨慎的(无)选择这篇文章《我本月学到的机器学习课程》首先出现在《迈向数据科学》上。

机器学习“降临节日历”第一天:Excel 中的 k-NN 回归器

The Machine Learning “Advent Calendar” Day 1: k-NN Regressor in Excel

降临节日历的第一天介绍了 k-NN 回归器,这是最简单的基于距离的模型。使用 Excel,我们探讨了预测如何完全依赖于最接近的观测值、为什么特征缩放很重要,以及异构变量如何使距离变得毫无意义。通过具有连续和分类特征的示例(包括加州住房和钻石数据集),我们看到了 k-NN 的优点和局限性,以及为什么定义正确的距离对于反映现实世界的结构至关重要。机器学习“降临日历”第一天:Excel 中的 k-NN 回归器一文首先出现在《走向数据科学》上。

人工智能浏览器的问题:安全缺陷和隐私的终结

The Problem with AI Browsers: Security Flaws and the End of Privacy

Atlas 和大多数当前的人工智能浏览器如何在三个方面失败:隐私、安全和审查制度人工智能浏览器的问题:安全缺陷和隐私的终结首先出现在《走向数据科学》上。

学习、黑客攻击和运输 ML

Learning, Hacking, and Shipping ML

Vyacheslav Efimov 谈论 AI 黑客马拉松、数据科学路线图以及 AI 如何有意义地改变 ML 工程师的日常工作学习、黑客和运输 ML 帖子首先出现在走向数据科学上。

为什么人工智能调整始于更好的评估

Why AI Alignment Starts With Better Evaluation

你无法调整你不评估的东西“为什么人工智能调整从更好的评估开始”一文首先出现在《走向数据科学》上。

机器学习和深度学习“降临日历”系列:蓝图

The Machine Learning and Deep Learning “Advent Calendar” Series: The Blueprint

直接在 Excel 中逐步打开 ML 模型的黑匣子机器学习和深度学习“降临日历”系列:蓝图首先出现在走向数据科学上。

贪婪 Boruta 算法:在不牺牲召回率的情况下加快特征选择

The Greedy Boruta Algorithm: Faster Feature Selection Without Sacrificing Recall

对 Boruta 算法的修改,可在保持高灵敏度的同时显着减少计算量《贪婪的 Boruta 算法:更快的特征选择而不牺牲召回率》一文首先出现在《走向数据科学》上。

指标欺骗:当您的最佳 KPI 隐藏您最严重的失败时

Metric Deception: When Your Best KPIs Hide Your Worst Failures

最危险的 KPI 并未被打破;即使他们失去了意义,他们仍然是值得信赖的人。 后《指标欺骗:当你最好的 KPI 隐藏你最糟糕的失败时》首先出现在《走向数据科学》上。

2026 年的数据科学:还值得吗?

Data Science in 2026: Is It Still Worth It?

10年AI工程师的真实观点2026年的后数据科学:还值得吗?首先出现在《走向数据科学》上。

为什么多年来我们一直在优化法学硕士中的错误内容

Why We’ve Been Optimizing the Wrong Thing in LLMs for Years

训练中的简单转变可以释放远见、更快的推理和更好的推理。为什么我们多年来一直在法学硕士中优化错误的事情,这篇文章首先出现在《走向数据科学》上。

产品运行状况评分:我如何通过统一监控和 n8n 自动化将严重事件减少 35%

The Product Health Score: How I Reduced Critical Incidents by 35% with Unified Monitoring and n8n Automation

产品、增长和工程团队如何融合单一信号以实现更好的事件管理产品健康评分:我如何通过统一监控和 n8n 自动化将关键事件减少 35% 的帖子首先出现在 Towards Data Science 上。

TDS 时事通讯:11 月有关 GraphRAG、ML 项目、LLM 支持的时间序列分析等的必读内容

TDS Newsletter: November Must-Reads on GraphRAG, ML Projects, LLM-Powered Time-Series Analysis, and More

不要错过我们过去一个月阅读量最大的故事TDS 新闻通讯:11 月有关 GraphRAG、ML 项目、LLM 驱动的时间序列分析等的必读文章首先出现在 Towards Data Science 上。