走向数据科学领域信息情报检索

在数据科学领域分享概念、思想和代码。Towards Data Science Inc.是一家在加拿大注册的公司。它为成千上万的人提供了一个交流思想、扩展对数据科学理解的平台。

零浪费代理 RAG:设计缓存架构以最大限度地减少延迟和 LLM 成本

Zero-Waste Agentic RAG: Designing Caching Architectures to Minimize Latency and LLM Costs at Scale

通过验证感知的多层缓存将 LLM 成本降低 30% 后零浪费代理 RAG:设计缓存架构以最大限度地减少延迟和大规模 LLM 成本首先出现在《走向数据科学》上。

情境工程作为您的竞争优势

Context Engineering as Your Competitive Edge

如果您既拥有独特的领域专业知识,又知道如何使其可用于您的人工智能系统,那么您将很难被击败。作为您的竞争优势的后上下文工程首先出现在《走向数据科学》上。

克劳德技能和子代理:逃离即时工程仓鼠轮

Claude Skills and Subagents: Escaping the Prompt Engineering Hamster Wheel

可重用、延迟加载的指令如何解决人工智能辅助开发中的上下文膨胀问题。《克劳德技能和子代理:逃离提示工程仓鼠轮》一文首先出现在《走向数据科学》上。

在 Databricks 上扩展 ML 推理:流动还是分区?加盐还是不加盐?

Scaling ML Inference on Databricks: Liquid or Partitioned? Salted or Not?

关于最大化集群技术的案例研究Databricks 上的后扩展 ML 推理:流动还是分区?加盐还是不加盐?首先出现在《走向数据科学》上。

使用 Python 从头开始编写 Pong 游戏

Coding the Pong Game from Scratch in Python

使用 OOP 和 Turtle 在 Python 中实现经典的 Pong 游戏在 Python 中从头开始编码 Pong 游戏的帖子首先出现在 Towards Data Science 上。

不要再询问模型是否可解释

Stop Asking if a Model Is Interpretable

开始询问解释应该回答什么问题。停止询问模型是否可解释的帖子首先出现在走向数据科学上。

生成式人工智能,有辨别力的人类

Generative AI, Discriminative Human

如何在炒作的海洋中批判性地思考人工智能后生成式人工智能、歧视性人类首先出现在《走向数据科学》上。

初级和高级数据科学家之间的差距不是代码

The Gap Between Junior and Senior Data Scientists Isn’t Code

为什么我对复杂算法的痴迷实际上阻碍了我的职业生涯。初级和高级数据科学家之间的差距不是代码,这篇文章首先出现在《走向数据科学》上。

设计可在生产中运行的数据和人工智能系统

Designing Data and AI Systems That Hold Up in Production

关于架构、代理和负责任规模的系统级视角《设计在生产中保持稳定的数据和人工智能系统》一文首先出现在《迈向数据科学》上。

物流调度的通用 MARL-LP 方法

A Generalizable MARL-LP Approach for Scheduling in Logistics

第 1 部分:动态车辆路线的混合解决方案 — 背景和架构用于物流调度的通用 MARL-LP 方法一文首先出现在《走向数据科学》上。

深入了解 DAX 中的过滤

Take a Deep Dive into Filtering in DAX

您是否想过在 DAX 表达式中应用过滤器时会发生什么?好吧,今天我将带您深入探讨这个引人入胜的主题,并通过示例帮助您学习一些新的、令人惊讶的东西。深入研究 DAX 中的过滤一文首先出现在《走向数据科学》上。

使用 Feast 和 Ray 扩展特征工程管道

Scaling Feature Engineering Pipelines with Feast and Ray

在生产机器学习系统中利用 Feast 等特征存储和 Ray 等分布式计算框架使用 Feast 和 Ray 扩展特征工程管道的帖子首先出现在《走向数据科学》上。

打破主机内存瓶颈:Peer Direct 如何改变 Gaudi 的云性能

Breaking the Host Memory Bottleneck: How Peer Direct Transformed Gaudi’s Cloud Performance

使用 libfabric、DMA-BUF 和 HCCL 在云主机 NIC 上设计类似 RDMA 的性能,以恢复分布式训练可扩展性 文章《打破主机内存瓶颈:如何对等直接转变 Gaudi 的云性能》首先出现在《走向数据科学》上。

如何定义内部信用风险模型的建模范围

How to Define the Modeling Scope of an Internal Credit Risk Model

基于内部评级 (IRB) 违约概率 (PD) 模型的数据集构建如何定义内部信用风险模型的建模范围一文首先出现在走向数据科学上。

优化 PyTorch 解码器模型中的令牌生成

Optimizing Token Generation in PyTorch Decoder Models

通过 CUDA 流交错隐藏主机设备同步这篇文章《优化 PyTorch 解码器模型中的令牌生成》首先出现在《走向数据科学》上。

边缘决策:大规模政策匹配

Decisioning at the Edge: Policy Matching at Scale

使用 PuLP 进行政策到机构优化边缘决策:大规模政策匹配一文首先出现在走向数据科学上。

使用 SAM 优化深度学习模型

Optimizing Deep Learning Models with SAM

深入探讨锐度感知最小化 (SAM) 算法以及它如何提高现代深度学习模型的通用性使用 SAM 优化深度学习模型一文首先出现在《走向数据科学》上。

人工智能机器人形成了卡特尔。没有人告诉他们。

AI Bots Formed a Cartel. No One Told Them To.

研究表明算法定价并不是代码中的错误。这是数学的一个特征。后人工智能机器人形成了卡特尔。没有人告诉他们。首先出现在《走向数据科学》上。