走向数据科学领域信息情报检索

在数据科学领域分享概念、思想和代码。Towards Data Science Inc.是一家在加拿大注册的公司。它为成千上万的人提供了一个交流思想、扩展对数据科学理解的平台。

为您的 AI 提供无限更新的上下文

Give Your AI Unlimited Updated Context

可移植知识层背后的架构以及使其保持活力的自动化。“为您的人工智能提供无限更新的上下文”一文首先出现在“迈向数据科学”上。

随着它们对现实的建模越来越好,主要推理模型如何汇聚到同一个“大脑”

How Major Reasoning Models Converge to the Same “Brain” as They Model Reality Increasingly Better

因为只有一个现实需要建模!主要推理模型如何在对现实建模越来越好时收敛到同一个“大脑”一文首先出现在《走向数据科学》上。

我在 Polars 中重写了真实数据工作流程。熊猫没有机会。

I Rewrote a Real Data Workflow in Polars. Pandas Didn’t Stand a Chance.

从 61 秒到 0.20 秒 - 以及我没想到的心理模型转变我在 Polars 中重写了真实数据工作流程的帖子。熊猫没有机会。首先出现在《走向数据科学》上。

当不确定性大于冲击时:英国地方选举的情景建模

When the Uncertainty Is Bigger Than the Shock: Scenario Modelling for English Local Elections

关于校准不确定性、历史误差以及为什么某些模型在拒绝预测时最有用的情景分析案例研究。文章《当不确定性大于冲击时:英国地方选举的情景建模》首先出现在《走向数据科学》上。

超越列表:使用 Python Deque 实现实时滑动窗口

Beyond Lists: Using Python Deque for Real-Time Sliding Windows

停止移动列表中的元素!了解为什么 collections.deque 是您下一个 Python 项目中高性能滑动窗口、线程安全队列和高效数据流的秘密。文章《超越列表:使用 Python Deque 实现实时滑动窗口》首先出现在 Towards Data Science 上。

Timer-XL:用于时间序列预测的长上下文基础模型

Timer-XL: A Long-Context Foundation Model for Time-Series Forecasting

探索仅解码器 Transformer 基础模型的内部工作原理后置 Timer-XL:用于时间序列预测的长上下文基础模型首先出现在 Towards Data Science 上。

用几个简单的“什么”问题解构任何指标

Deconstruct Any Metric with a Few Simple ‘What’ Questions

你所看到的很少是你通过华而不实的仪表板和数据讲故事所得到的用几个简单的“什么”问题解构任何指标的帖子首先出现在走向数据科学上。

离散事件时间建模 - 预测某事何时发生

Discrete Time-To-Event Modeling – Predicting When Something Will Happen

第 1 部分:基础知识 — 时间离散化、审查和生命表离散时间事件建模 — 预测某事何时发生的帖子首先出现在《走向数据科学》上。

如何让 Claude 代码验证自己的工作

How to Make Claude Code Validate its own Work

通过让 Claude Code 验证自己的工作来提高 Claude Code 的性能如何让 Claude Code 验证自己的工作一文首先出现在 Towards Data Science 上。

通过 MARL 克服物流中的高度不确定性

Surviving High Uncertainty in Logistics with MARL

第 2 部分:构建可无缝改变环境的规模不变代理与 MARL 一起克服物流中的高不确定性一文首先出现在《迈向数据科学》上。

单代理与多代理:何时构建多代理系统

Single Agent vs Multi-Agent: When to Build a Multi-Agent System

理解 AI 代理设计、ReAct 工作流程以及何时从单代理扩展到多代理系统的实用指南。单代理与多代理:何时构建多代理系统一文首先出现在 Towards Data Science 上。

如何为 AI 模型构建高效的知识库

How to Build an Efficient Knowledge Base for AI Models

为人工智能模型构建知识库不是一次性任务,而是一个迭代的细化过程。《如何为人工智能模型构建高效的知识库》一文首先出现在《走向数据科学》上。

通过 Deep Q-Learning 玩四子棋

Playing Connect Four with Deep Q-Learning

用函数逼近解决多人游戏《用深度 Q 学习玩四子棋》一文首先出现在《走向数据科学》上。

人工智能工具如何在物联网系统中产生技术债务 - 以及如何应对

How AI Tools Generate Technical Debt in IoT Systems — and What to Do About It

人工智能工具加速了物联网开发 - 但更接近硬件,看起来正确的相同代码可以同时悄悄地破坏数千台设备。人工智能工具如何在物联网系统中产生技术债务 - 以及如何处理它首先出现在走向数据科学上。

CSPNet 论文演练:只有更好,无需权衡

CSPNet Paper Walkthrough: Just Better, No Tradeoffs

对 Cross-Stage Partial Network 论文的回顾——以及从头开始的 PyTorch 实现 CSPNet 后的论文演练:更好,没有权衡首先出现在 Towards Data Science 上。

推理扩展(测试时计算):为什么推理模型会提高您的计算费用

Inference Scaling (Test-Time Compute): Why Reasoning Models Raise Your Compute Bill

为什么推理模型会显着增加生产系统中的令牌使用、延迟和基础设施成本The post Inference Scaling (Test-Time Compute): Why Reasoning Models Raise Your Compute Bill 首先出现在 Towards Data Science 上。

您实际上应该使用哪个正则化器? 134,400 次模拟的经验教训

Which Regularizer Should You Actually Use? Lessons from 134,400 Simulations

Ridge、Lasso 和 ElasticNet 的从业者决策框架基于您在拟合模型之前可以计算的三个量您实际上应该使用哪个正则化器? 134,400 次模拟的经验教训首先出现在《迈向数据科学》上。

2021 年量化算法如何悄然超越其 2026 年后续算法

How a 2021 Quantization Algorithm Quietly Outperforms Its 2026 Successor

一个尺度参数决定基于旋转的矢量量化的准确性。2021 年量化算法如何悄然超越其 2026 年后继者的帖子首先出现在《走向数据科学》上。