走向数据科学领域信息情报检索

在数据科学领域分享概念、思想和代码。Towards Data Science Inc.是一家在加拿大注册的公司。它为成千上万的人提供了一个交流思想、扩展对数据科学理解的平台。

块大小作为 RAG 系统中的实验变量

Chunk Size as an Experimental Variable in RAG Systems

通过试验不同的块大小来理解 RAG 系统中的检索《块大小作为 RAG 系统中的实验变量》一文首先出现在《走向数据科学》上。

机器学习“降临节日历”奖励 2:Excel 中的梯度下降变体

The Machine Learning “Advent Calendar” Bonus 2: Gradient Descent Variants in Excel

梯度下降、动量、RMSProp 和 Adam 都以相同的最小值为目标。他们不会改变目的地,只会改变路径。每种方法都增加了一种机制,可以修复前一种方法的局限性,使移动更快、更稳定或更自适应。目标保持不变。更新变得更加智能。机器学习“降临日历”奖励 2:Excel 中的梯度下降变体一文首先出现在走向数据科学上。

克服非凸最优控制问题中的非光滑性和控制颤动

Overcoming Nonsmoothness and Control Chattering in Nonconvex Optimal Control Problems

对于良好数值的一些提示克服非凸最优控制问题中的非平滑性和控制颤振一文首先出现在走向数据科学上。

机器学习“降临节日历”奖励 1:Excel 中的 AUC

The Machine Learning “Advent Calendar” Bonus 1: AUC in Excel

AUC 衡量模型将正数排在负数之上的程度,与任何选定的阈值无关。机器学习“降临日历”奖励 1:Excel 中的 AUC 帖子首先出现在《走向数据科学》上。

曲线下的药物 (AUC)

Agents Under the Curve (AUC)

旨在了解您的代理解决方案是否实际上更好 曲线下代理 (AUC) 帖子首先出现在走向数据科学上。

如何促进有效的人工智能编程

How to Facilitate Effective AI Programming

如何确保您的编码代理与您具有相同的上下文《如何促进有效的人工智能编程》一文首先出现在《走向数据科学》上。

机器学习与人工智能工程师:有什么区别?

Machine Learning vs AI Engineer: What Are the Differences?

目前科技界最令人困惑的问题之一是:人工智能工程师和机器学习工程师有什么区别?两者都是六位数的工作,但如果你选错了,你可能会浪费几个月的职业生涯来学习错误的技能,并错过优质的职位。作为一名实践者,机器学习与人工智能工程师:有什么区别?首先出现在《走向数据科学》上。

通过强化学习实施 Vibe 证明

Implementing Vibe Proving with Reinforcement Learning

如何让法学硕士通过可验证的、逐步的逻辑进行推理(第 2 部分)这篇文章《利用强化学习实现 Vibe 证明》首先出现在《走向数据科学》上。

打破硬件障碍:适用于较旧 GPU 的软件 FP8

Breaking the Hardware Barrier: Software FP8 for Older GPUs

深度学习工作负载越来越受内存限制,GPU 核心在等待数据传输时处于空闲状态。 FP8 精度在较新的硬件上解决了这个问题,但是已经部署的数百万个 RTX 30 和 20 系列 GPU 又如何呢? Feather 证明,通过按位打包进行基于软件的 FP8 仿真可以实现接近理论的 4 倍带宽改进(实测为 3.3 倍),无需昂贵的硬件升级即可实现高效的深度学习。《打破硬件障碍:适用于旧版 GPU 的软件 FP8》一文首先出现在《走向数据科学》上。

探索 TabPFN:为表格数据构建的基础模型

Exploring TabPFN: A Foundation Model Built for Tabular Data

了解架构、训练管道并在实践中实现 TabPFN 文章《探索 TabPFN:为表格数据构建的基础模型》首先出现在《走向数据科学》上。

IntelliNode 如何使用 Vibe Agent 自动执行复杂的工作流程

How IntelliNode Automates Complex Workflows with Vibe Agents

许多人工智能系统专注于孤立的任务或简单的提示工程。这种方法使我们能够通过单个提示构建有趣的应用程序,但我们开始遇到限制。当我们处理需要多个阶段或必须逐渐考虑信息的企业系统的复杂人工智能任务时,简单的提示是不够的。 [...]IntelliNode 如何使用 Vibe Agents 自动执行复杂工作流程的帖子首先出现在 Towards Data Science 上。

认为您的 Python 代码很慢?停止猜测并开始测量

Think Your Python Code Is Slow? Stop Guessing and Start Measuring

使用 cProfile + SnakeViz 查找(并修复)代码中的“热门”路径的实践之旅。文章认为您的 Python 代码很慢? 《停止猜测并开始测量》首先出现在《迈向数据科学》上。

保持概率诚实:雅可比调整

Keeping Probabilities Honest: The Jacobian Adjustment

正确转换随机变量的直观解释。保持概率诚实:雅可比调整首先出现在走向数据科学上。

为什么 MAP 和 MRR 无法进行搜索排名(以及使用什么替代)

Why MAP and MRR Fail for Search Ranking (and What to Use Instead)

MAP和MRR看似直观,却悄悄打破了排名评价。以下是这些指标产生误导的原因以及更好的替代方案如何解决这一问题。为什么 MAP 和 MRR 无法进行搜索排名(以及使用什么替代)一文首先出现在 Towards Data Science 上。

机器学习“降临日历”第 24 天:Excel 中文本的转换器

The Machine Learning “Advent Calendar” Day 24: Transformers for Text in Excel

直观、逐步地了解 Transformers 如何使用自注意力将静态词嵌入转换为上下文表示,并通过简单的示例和 Excel 友好的演练进行说明。机器学习“降临日历”第 24 天:Excel 中文本的 Transformers 帖子首先出现在《走向数据科学》上。

你的模型是时盲的吗?循环特征编码的案例

Is Your Model Time-Blind? The Case for Cyclical Feature Encoding

循环编码如何改进机器学习预测帖子“你的模型是时盲的吗?”循环特征编码案例首先出现在《走向数据科学》上。

优化 AI 编码效率的 4 种技巧

4 Techniques to Optimize AI Coding Efficiency

了解如何使用 AI 更有效地进行编码“优化 AI 编码效率的 4 种技术”一文首先出现在《走向数据科学》上。

Bonferroni 与 Benjamini-Hochberg:选择 P 值校正

Bonferroni vs. Benjamini-Hochberg: Choosing Your P-Value Correction

多重假设检验、P 值和蒙特卡洛Bonferroni 与 Benjamini-Hochberg 的对比:选择 P 值校正首先出现在《走向数据科学》上。