走向数据科学领域信息情报检索---XiaoMi-AI

2026年2月28日 13:00

在 Databricks 上扩展 ML 推理：流动还是分区？加盐还是不加盐？

Scaling ML Inference on Databricks: Liquid or Partitioned? Salted or Not?

关于最大化集群技术的案例研究Databricks 上的后扩展 ML 推理：流动还是分区？加盐还是不加盐？首先出现在《走向数据科学》上。

2026年2月27日 16:30

使用 Python 从头开始编写 Pong 游戏

Coding the Pong Game from Scratch in Python

使用 OOP 和 Turtle 在 Python 中实现经典的 Pong 游戏在 Python 中从头开始编码 Pong 游戏的帖子首先出现在 Towards Data Science 上。

2026年2月27日 15:00

不要再询问模型是否可解释

Stop Asking if a Model Is Interpretable

开始询问解释应该回答什么问题。停止询问模型是否可解释的帖子首先出现在走向数据科学上。

2026年2月27日 13:30

生成式人工智能，有辨别力的人类

Generative AI, Discriminative Human

如何在炒作的海洋中批判性地思考人工智能后生成式人工智能、歧视性人类首先出现在《走向数据科学》上。

2026年2月27日 12:00

初级和高级数据科学家之间的差距不是代码

The Gap Between Junior and Senior Data Scientists Isn’t Code

为什么我对复杂算法的痴迷实际上阻碍了我的职业生涯。初级和高级数据科学家之间的差距不是代码，这篇文章首先出现在《走向数据科学》上。

2026年2月26日 16:30

设计可在生产中运行的数据和人工智能系统

Designing Data and AI Systems That Hold Up in Production

关于架构、代理和负责任规模的系统级视角《设计在生产中保持稳定的数据和人工智能系统》一文首先出现在《迈向数据科学》上。

2026年2月26日 15:00

物流调度的通用 MARL-LP 方法

A Generalizable MARL-LP Approach for Scheduling in Logistics

第 1 部分：动态车辆路线的混合解决方案 — 背景和架构用于物流调度的通用 MARL-LP 方法一文首先出现在《走向数据科学》上。

2026年2月26日 12:00

深入了解 DAX 中的过滤

Take a Deep Dive into Filtering in DAX

您是否想过在 DAX 表达式中应用过滤器时会发生什么？好吧，今天我将带您深入探讨这个引人入胜的主题，并通过示例帮助您学习一些新的、令人惊讶的东西。深入研究 DAX 中的过滤一文首先出现在《走向数据科学》上。

2026年2月25日 20:42

使用 Feast 和 Ray 扩展特征工程管道

Scaling Feature Engineering Pipelines with Feast and Ray

在生产机器学习系统中利用 Feast 等特征存储和 Ray 等分布式计算框架使用 Feast 和 Ray 扩展特征工程管道的帖子首先出现在《走向数据科学》上。

2026年2月25日 18:43

打破主机内存瓶颈：Peer Direct 如何改变 Gaudi 的云性能

Breaking the Host Memory Bottleneck: How Peer Direct Transformed Gaudi’s Cloud Performance

使用 libfabric、DMA-BUF 和 HCCL 在云主机 NIC 上设计类似 RDMA 的性能，以恢复分布式训练可扩展性文章《打破主机内存瓶颈：如何对等直接转变 Gaudi 的云性能》首先出现在《走向数据科学》上。

2026年2月25日 12:00

如何定义内部信用风险模型的建模范围

How to Define the Modeling Scope of an Internal Credit Risk Model

基于内部评级 (IRB) 违约概率 (PD) 模型的数据集构建如何定义内部信用风险模型的建模范围一文首先出现在走向数据科学上。

2026年2月24日 20:00

优化 PyTorch 解码器模型中的令牌生成

Optimizing Token Generation in PyTorch Decoder Models

通过 CUDA 流交错隐藏主机设备同步这篇文章《优化 PyTorch 解码器模型中的令牌生成》首先出现在《走向数据科学》上。

2026年2月24日 19:22

边缘决策：大规模政策匹配

Decisioning at the Edge: Policy Matching at Scale

使用 PuLP 进行政策到机构优化边缘决策：大规模政策匹配一文首先出现在走向数据科学上。

2026年2月24日 13:30

使用 SAM 优化深度学习模型

Optimizing Deep Learning Models with SAM

深入探讨锐度感知最小化 (SAM) 算法以及它如何提高现代深度学习模型的通用性使用 SAM 优化深度学习模型一文首先出现在《走向数据科学》上。

2026年2月24日 12:00

人工智能机器人形成了卡特尔。没有人告诉他们。

AI Bots Formed a Cartel. No One Told Them To.

研究表明算法定价并不是代码中的错误。这是数学的一个特征。后人工智能机器人形成了卡特尔。没有人告诉他们。首先出现在《走向数据科学》上。

2026年2月23日 21:56

人工智能和数据就业市场已经死了吗？

Is the AI and Data Job Market Dead?

在当前的就业市场中你应该做什么人工智能和数据就业市场已经死了吗？首先出现在《走向数据科学》上。

2026年2月23日 21:34

面向 Pandas 用户的 PySpark

PySpark for Pandas Users

常见的 Pandas 操作及其在 PySpark 中的等效操作面向 Pandas 用户的 PySpark 帖子首先出现在 Towards Data Science 上。

2026年2月23日 21:19

多 GPU 中的人工智能：梯度累积和数据并行

AI in Multiple GPUs: Gradient Accumulation & Data Parallelism

在 PyTorch 中从头开始学习和实现梯度累加和数据并行性多 GPU 中的人工智能后处理：梯度累加和数据并行性首先出现在《走向数据科学》上。