走向数据科学领域信息情报检索

在数据科学领域分享概念、思想和代码。Towards Data Science Inc.是一家在加拿大注册的公司。它为成千上万的人提供了一个交流思想、扩展对数据科学理解的平台。

初级和高级数据科学家之间的差距不是代码

The Gap Between Junior and Senior Data Scientists Isn’t Code

为什么我对复杂算法的痴迷实际上阻碍了我的职业生涯。初级和高级数据科学家之间的差距不是代码,这篇文章首先出现在《走向数据科学》上。

设计可在生产中运行的数据和人工智能系统

Designing Data and AI Systems That Hold Up in Production

关于架构、代理和负责任规模的系统级视角《设计在生产中保持稳定的数据和人工智能系统》一文首先出现在《迈向数据科学》上。

物流调度的通用 MARL-LP 方法

A Generalizable MARL-LP Approach for Scheduling in Logistics

第 1 部分:动态车辆路线的混合解决方案 — 背景和架构用于物流调度的通用 MARL-LP 方法一文首先出现在《走向数据科学》上。

深入了解 DAX 中的过滤

Take a Deep Dive into Filtering in DAX

您是否想过在 DAX 表达式中应用过滤器时会发生什么?好吧,今天我将带您深入探讨这个引人入胜的主题,并通过示例帮助您学习一些新的、令人惊讶的东西。深入研究 DAX 中的过滤一文首先出现在《走向数据科学》上。

使用 Feast 和 Ray 扩展特征工程管道

Scaling Feature Engineering Pipelines with Feast and Ray

在生产机器学习系统中利用 Feast 等特征存储和 Ray 等分布式计算框架使用 Feast 和 Ray 扩展特征工程管道的帖子首先出现在《走向数据科学》上。

打破主机内存瓶颈:Peer Direct 如何改变 Gaudi 的云性能

Breaking the Host Memory Bottleneck: How Peer Direct Transformed Gaudi’s Cloud Performance

使用 libfabric、DMA-BUF 和 HCCL 在云主机 NIC 上设计类似 RDMA 的性能,以恢复分布式训练可扩展性 文章《打破主机内存瓶颈:如何对等直接转变 Gaudi 的云性能》首先出现在《走向数据科学》上。

如何定义内部信用风险模型的建模范围

How to Define the Modeling Scope of an Internal Credit Risk Model

基于内部评级 (IRB) 违约概率 (PD) 模型的数据集构建如何定义内部信用风险模型的建模范围一文首先出现在走向数据科学上。

优化 PyTorch 解码器模型中的令牌生成

Optimizing Token Generation in PyTorch Decoder Models

通过 CUDA 流交错隐藏主机设备同步这篇文章《优化 PyTorch 解码器模型中的令牌生成》首先出现在《走向数据科学》上。

边缘决策:大规模政策匹配

Decisioning at the Edge: Policy Matching at Scale

使用 PuLP 进行政策到机构优化边缘决策:大规模政策匹配一文首先出现在走向数据科学上。

使用 SAM 优化深度学习模型

Optimizing Deep Learning Models with SAM

深入探讨锐度感知最小化 (SAM) 算法以及它如何提高现代深度学习模型的通用性使用 SAM 优化深度学习模型一文首先出现在《走向数据科学》上。

人工智能机器人形成了卡特尔。没有人告诉他们。

AI Bots Formed a Cartel. No One Told Them To.

研究表明算法定价并不是代码中的错误。这是数学的一个特征。后人工智能机器人形成了卡特尔。没有人告诉他们。首先出现在《走向数据科学》上。

人工智能和数据就业市场已经死了吗?

Is the AI and Data Job Market Dead?

在当前的就业市场中你应该做什么人工智能和数据就业市场已经死了吗?首先出现在《走向数据科学》上。

面向 Pandas 用户的 PySpark

PySpark for Pandas Users

常见的 Pandas 操作及其在 PySpark 中的等效操作面向 Pandas 用户的 PySpark 帖子首先出现在 Towards Data Science 上。

多 GPU 中的人工智能:梯度累积和数据并行

AI in Multiple GPUs: Gradient Accumulation & Data Parallelism

在 PyTorch 中从头开始学习和实现梯度累加和数据并行性多 GPU 中的人工智能后处理:梯度累加和数据并行性首先出现在《走向数据科学》上。

使用 Claude 代码构建有效的内部工具

Build Effective Internal Tooling with Claude Code

使用 Claude Code 快速构建完全个性化的应用程序使用 Claude Code 构建有效的内部工具一文首先出现在 Towards Data Science 上。

为企业本地 AI 构建 GPUaaS

Architecting GPUaaS for Enterprise AI On-Prem

Kubernetes 上的多租户、调度和成本建模《为企业 AI On-Prem 设计 GPUaaS》一文首先出现在《Towards Data Science》上。

驴子,不是独角兽

Donkeys, Not Unicorns

商品化魔法时代的创业新规则《驴,而不是独角兽》一文首先出现在《走向数据科学》上。

使用 Agentic AI 美化开源存储库的端到端指南

An End-to-End Guide to Beautifying Your Open-Source Repo with Agentic AI

使用开源人工智能代理自动改进科学和工业存储库的指南《使用代理人工智能美化开源存储库的端到端指南》一文首先出现在《走向数据科学》上。