走向数据科学领域信息情报检索

在数据科学领域分享概念、思想和代码。Towards Data Science Inc.是一家在加拿大注册的公司。它为成千上万的人提供了一个交流思想、扩展对数据科学理解的平台。

既然 AI 是您团队中的第一位分析师,现在会发生什么?

What Happens Now That AI is the First Analyst On Your Team?

在人工智能、自动化时代,一切都比预期进展得更快时,我如何适应我的职业生涯。人工智能成为你团队中的第一位分析师,现在会发生什么?首先出现在《走向数据科学》上。

意义地图:嵌入模型如何“理解”人类语言

The Map of Meaning: How Embedding Models “Understand” Human Language

了解为什么嵌入模型就像意义的 GPS。它不是搜索确切的单词,而是导航“想法地图”来查找具有相同氛围的概念。从电池类型到汽水口味,了解如何微调这些数字指纹,以在下一个人工智能项目中实现精确度。 文章《意义地图:嵌入模型如何“理解”人类语言》首先出现在《走向数据科学》上。

如何使 Claude 代码更好地一次性实现

How to Make Claude Code Better at One-Shotting Implementations

让你的编码代理更高效这篇文章《如何让 Claude 代码在一次性实现中变得更好》首先出现在《走向数据科学》上。

在几个小时内构建个人人工智能代理

Building a Personal AI Agent in a couple of Hours

我对个人构建者现在交付真实且有用的原型的速度如此之快感到非常惊讶。 Claude Code、Google AntiGravity 等工具以及围绕它们不断发展的生态系统已经跨越了一个门槛:您可以检查其他人在线构建的内容,并了解您今天可以构建多快。在过去的几周里,我开始[...]在几个小时内构建个人人工智能代理的帖子首先出现在走向数据科学上。

将 1.27 亿个数据点转化为行业报告

Turning 127 Million Data Points Into an Industry Report

我在从头开始构建应用程序安全报告时学到的有关数据整理、分段和讲故事的知识将 1.27 亿数据点转化为行业报告一文首先出现在《迈向数据科学》上。

如何与你的机器人最好的朋友一起用统计数据撒谎

How to Lie with Statistics with your Robot Best Friend

什么是 p 黑客攻击,它很糟糕吗?你能让人工智能为你做这件事吗?这篇文章《如何与你的机器人最好的朋友一起用统计数据撒谎》首先出现在《走向数据科学》上。

为什么数据科学家应该关心量子计算

Why Data Scientists Should Care About Quantum Computing

Sara A. Metwalli 谈论一项有前景的新技术的兴起、法学硕士对她工作的影响等等。文章《为什么数据科学家应该关心量子计算》首先出现在《走向数据科学》上。

生产中的可解释人工智能:用于实时欺诈检测的神经符号模型

Explainable AI in Production: A Neuro-Symbolic Model for Real-Time Fraud Detection

SHAP 需要 30 毫秒来解释欺诈预测。该解释是随机的,在决策之后运行,并且需要您必须在推理时维护的背景数据集。本文对神经符号模型进行了基准测试,该模型在 Kaggle 信用卡欺诈数据集上作为前向传递本身的副产品,在 0.9 毫秒内生成确定性的、人类可读的解释。加速比为 33 倍。欺诈召回是相同的。 生产中的可解释人工智能:用于实时欺诈检测的神经符号模型首先出现在走向数据科学上。

如何快速成为人工智能工程师(技能、项目、薪资)

How to Become an AI Engineer Fast (Skills, Projects, Salary)

剧透,这将需要超过 3 个月的时间《如何快速成为一名人工智能工程师(技能、项目、薪资)》一文首先出现在《走向数据科学》上。

PyTorch 中的自我修复神经网络:无需重新训练即可实时修复模型漂移

Self-Healing Neural Networks in PyTorch: Fix Model Drift in Real Time Without Retraining

当您的生产模型出现偏差并且无法进行重新训练时会发生什么?本文展示了自我修复神经网络如何检测漂移,使用轻量级适配器进行实时适应,并在无需重新训练或停机的情况下恢复 27.8% 的准确度。PyTorch 中的自我修复神经网络:无需重新训练即可实时修复模型漂移的帖子首先出现在《走向数据科学》上。

从 NetCDF 到见解:城市级气候风险分析的实用流程

From NetCDF to Insights: A Practical Pipeline for City-Level Climate Risk Analysis

将 CMIP6 预测、ERA5 再分析和影响模型集成到一个轻量级、可解释的工作流程中帖子《从 NetCDF 到见解:城市级气候风险分析的实用流程》首先出现在《走向数据科学》上。

Python 量子计算初学者指南

A Beginner’s Guide to Quantum Computing with Python

使用 Qiskit 模拟量子计算机《使用 Python 进行量子计算的初学者指南》一文首先出现在《走向数据科学》上。

ElevenLabs 语音 AI 如何取代仓库和制造运营中的屏幕

How ElevenLabs Voice AI Is Replacing Screens in Warehouse and Manufacturing Operations

仓库拣选操作是从存储位置收集物品以满足客户订单的过程。它是物流中劳动力最密集的活动之一,占仓库总运营成本高达 55%。对于每个订单,操作员都会收到一份要从其存储位置收集的物品列表。他们走到[…]文章《ElevenLabs 语音 AI 如何取代仓库和制造运营中的屏幕》首先出现在《走向数据科学》上。

如何通过响应流使您的 AI 应用程序更快、更具交互性

How to Make Your AI App Faster and More Interactive with Response Streaming

在我最新的帖子中,我们讨论了很多关于提示缓存和一般缓存的内容,以及它如何在成本和延迟方面改进您的 AI 应用程序。然而,即使对于完全优化的人工智能应用程序,有时响应也需要一些时间才能生成,而且只是[...]帖子如何使你的人工智能应用程序更快,与响应流更具交互性首先出现在走向数据科学上。

超越代码生成:完整数据科学工作流程的人工智能

Beyond Code Generation: AI for the Full Data Science Workflow

使用 Codex 和 MCP 在一个真实的工作流程中连接 Google Drive、GitHub、BigQuery 和分析超越代码生成:完整数据科学工作流程的人工智能一文首先出现在 Towards Data Science 上。

比特随机指标改变了我对 RAG 和代理的看法

What the Bits-over-Random Metric Changed in How I Think About RAG and Agents

为什么在纸面上看起来很出色的检索在真实的 RAG 和代理工作流程中仍然表现得像噪音《我如何看待 RAG 和代理》中的“比特随机指标发生了什么变化”一文首先出现在《走向数据科学》上。

跟进商店的同类交易:处理 PY

Following Up on Like-for-Like for Stores: Handling PY

我的上一篇文章是关于为商店实施 Like-for-Like (L4L) 的。在与同事和客户讨论我的解决方案后,我遇到了一个有趣的问题,这给我的第一个解决方案带来了额外的要求。这就是我想在这里讨论的内容。帖子“跟进商店的同类交易:处理 PY”首先出现在“迈向数据科学”上。

我本月学到的机器学习课程

The Machine Learning Lessons I’ve Learned This Month

主动性、阻塞和规划这篇文章《本月我学到的机器学习课程》首先出现在《迈向数据科学》上。