走向数据科学领域信息情报检索

在数据科学领域分享概念、思想和代码。Towards Data Science Inc.是一家在加拿大注册的公司。它为成千上万的人提供了一个交流思想、扩展对数据科学理解的平台。

如何定义内部信用风险模型的建模范围

How to Define the Modeling Scope of an Internal Credit Risk Model

基于内部评级 (IRB) 违约概率 (PD) 模型的数据集构建如何定义内部信用风险模型的建模范围一文首先出现在走向数据科学上。

优化 PyTorch 解码器模型中的令牌生成

Optimizing Token Generation in PyTorch Decoder Models

通过 CUDA 流交错隐藏主机设备同步这篇文章《优化 PyTorch 解码器模型中的令牌生成》首先出现在《走向数据科学》上。

边缘决策:大规模政策匹配

Decisioning at the Edge: Policy Matching at Scale

使用 PuLP 进行政策到机构优化边缘决策:大规模政策匹配一文首先出现在走向数据科学上。

使用 SAM 优化深度学习模型

Optimizing Deep Learning Models with SAM

深入探讨锐度感知最小化 (SAM) 算法以及它如何提高现代深度学习模型的通用性使用 SAM 优化深度学习模型一文首先出现在《走向数据科学》上。

人工智能机器人形成了卡特尔。没有人告诉他们。

AI Bots Formed a Cartel. No One Told Them To.

研究表明算法定价并不是代码中的错误。这是数学的一个特征。后人工智能机器人形成了卡特尔。没有人告诉他们。首先出现在《走向数据科学》上。

人工智能和数据就业市场已经死了吗?

Is the AI and Data Job Market Dead?

在当前的就业市场中你应该做什么人工智能和数据就业市场已经死了吗?首先出现在《走向数据科学》上。

面向 Pandas 用户的 PySpark

PySpark for Pandas Users

常见的 Pandas 操作及其在 PySpark 中的等效操作面向 Pandas 用户的 PySpark 帖子首先出现在 Towards Data Science 上。

多 GPU 中的人工智能:梯度累积和数据并行

AI in Multiple GPUs: Gradient Accumulation & Data Parallelism

在 PyTorch 中从头开始学习和实现梯度累加和数据并行性多 GPU 中的人工智能后处理:梯度累加和数据并行性首先出现在《走向数据科学》上。

使用 Claude 代码构建有效的内部工具

Build Effective Internal Tooling with Claude Code

使用 Claude Code 快速构建完全个性化的应用程序使用 Claude Code 构建有效的内部工具一文首先出现在 Towards Data Science 上。

为企业本地 AI 构建 GPUaaS

Architecting GPUaaS for Enterprise AI On-Prem

Kubernetes 上的多租户、调度和成本建模《为企业 AI On-Prem 设计 GPUaaS》一文首先出现在《Towards Data Science》上。

驴子,不是独角兽

Donkeys, Not Unicorns

商品化魔法时代的创业新规则《驴,而不是独角兽》一文首先出现在《走向数据科学》上。

使用 Agentic AI 美化开源存储库的端到端指南

An End-to-End Guide to Beautifying Your Open-Source Repo with Agentic AI

使用开源人工智能代理自动改进科学和工业存储库的指南《使用代理人工智能美化开源存储库的端到端指南》一文首先出现在《走向数据科学》上。

了解公式之外的卡方检验

Understanding the Chi-Square Test Beyond the Formula

分类数据如何成为统计证据。《理解公式之外的卡方检验》一文首先出现在《走向数据科学》上。

AlpamayoR1:自动驾驶的大型因果推理模型

AlpamayoR1: Large Causal Reasoning Models for Autonomous Driving

关于因果链推理和自动驾驶现状您需要了解的一切!AlpamayoR1:自动驾驶的大型因果推理模型首先出现在《走向数据科学》上。

多个 GPU 中的人工智能:GPU 如何通信

AI in Multiple GPUs: How GPUs Communicate

深入探讨支持 AI 工作负载多 GPU 通信的硬件基础设施多 GPU 中的后 AI:GPU 如何通信首先出现在《迈向数据科学》上。

人工智能可以解决供应链中的故障吗?

Can AI Solve Failures in Your Supply Chain?

当您的仓库和运输团队互相指责对方延迟交货时,谁是对的?我们可以要求与数据相关的代理来解决争论。人工智能可以解决供应链中的故障吗?首先出现在《走向数据科学》上。

在 SQL 表中的长文本文档上构建经济高效的 Agentic RAG

Building Cost-Efficient Agentic RAG on Long-Text Documents in SQL Tables

设计混合 SQL + 矢量检索系统,无需架构更改、数据迁移或性能权衡在 SQL 表中的长文本文档上构建成本高效的代理 RAG 帖子首先出现在走向数据科学上。

为什么每个分析工程师都需要了解数据架构

Why Every Analytics Engineer Needs to Understand Data Architecture

获得正确的数据架构,其他一切都会变得更容易。我知道这听起来很简单,但实际上,设计数据架构时的细微差别可能会产生代价高昂的影响。本文提供了关于影响您日常决策的架构的速成课程 - 从关系数据库到事件驱动系统。文章《为什么每个分析工程师都需要了解数据架构》首先出现在《走向数据科学》上。