KDnuggets领域信息情报检索

KDnuggets是业务分析、大数据、数据挖掘和数据科学领域的领先网站。它由该领域的著名专家Gregory Piatetsky-Shapiro管理。

Anthropic 克劳德技能培养完整指南

Anthropic’s Complete Guide to Claude Skills Building

本指南涵盖了全貌:技术上的技能是什么,如何规划和设计它们,确切的文件结构和命名规则,如何编写 Claude 可靠遵循的指令,从头开始构建的完整工作技能,如何测试和分发,以及出现问题时该怎么办。

AI 工程师必须了解的 5 个 Python 概念

5 Must-Know Python Concepts for AI Engineers

在本文中,我们将探讨每个 AI 工程师必须了解的五个关键 Python 概念,以构建可扩展、安全且强大的系统。

深入探讨语言模型的校准:Platt 缩放、等渗回归、温度缩放

A Deep Dive into Calibration of Language Models: Platt Scaling, Isotonic Regression, Temperature Scaling

发现三种缩小置信度和准确性之间差距的事后方法。

高效文本处理和实体识别的 3 个 SpaCy 技巧

3 SpaCy Tricks for Efficient Text Processing & Entity Recognition

在本文中,我们将探讨每个开发人员工具包中都应具备的三个基本 spaCy 技巧,以最大限度地提高处理速度并自定义实体识别。

代理时代对数据科学意味着什么

What the Agentic Era Means for Data Science

了解人工智能代理如何重塑数据科学工作流程以及从业者在 2026 年需要哪些技能。

使用 Python 掌握时间序列分析的 7 个步骤

7 Steps to Mastering Time Series Analysis with Python

本文分解了 7 个关键步骤,帮助您使用 Python 分析和预测时间序列数据。

5 篇清晰解释法学硕士的有趣论文

5 Fun Papers That Explain LLMs Clearly

想更好地了解法学硕士吗?从这五篇解释它们如何工作的基础论文开始。

LLM 可解释性入门

A Gentle Primer on LLM Explainability

本文讨论了法学硕士的可解释性,并概述了这一重要研究领域的进展、趋势和持续发展。

10 个现代数据库系统和工具的 GitHub 存储库

10 GitHub Repositories for Modern Database Systems and Tools

探索现代数据库、分析、SQL、缓存、监控、复制、PostgreSQL、SQLite 和 AI 代理内存的 10 个顶级开源 GitHub 存储库。

使用 Mimesis 模拟一年的 IoT 传感器时间序列数据

Mocking a Year of IoT Sensor Time Series Data with Mimesis

在本指南中,您将了解生成一年的每日温度读数的过程,模仿看起来真实的季节性曲线 - 所有这些都与设备级元数据一起,并准备基于开源框架进行构建。

数据科学家必须了解的 5 个 Python 概念

5 Must-Know Python Concepts for Data Scientists

在本文中,我们将深入探讨五个必须了解的 Python 概念,这些概念将帮助您从编写笨重、缓慢的意大利面条式代码过渡到构建快如闪电、生产级且功能精美的数据管道。

“入门级”把关者:使用 Textstat 审核职位描述

The ‘Entry-Level’ Gatekeeper: Auditing Job Descriptions with Textstat

本文展示了如何使用 Python 及其 Textstat 库等免费开源工具构建一个脚本,在发布职位描述之前自动执行捕获“把关语言”的过程。

2026 年将构建的 7 个真实世界人工智能项目(附指南)

7 Real World AI Projects to Build in 2026 (with Guides)

探索七个可实现真实工作流程自动化的实用人工智能项目,包括求职、网络研究、投资研究、市场趋势分析、发票处理、图表数字化和个性化运动训练。

Pandas GroupBy 举例说明

Pandas GroupBy Explained With Examples

通过简单实用的示例,了解如何使用 Pandas GroupBy 来汇总、比较和分析分组数据。

模拟“假设”场景的 5 个 Scipy.stats 技巧

5 Scipy.stats Tricks for Simulating ‘What If’ Scenarios

在本文中,我们将深入了解 scipy.stats,探索仅使用 NumPy 和 SciPy 设计高性能、严格模拟的五个基本技巧。

用于机器学习工作流程的可视化调试工具

Visual Debugging Tools for Machine Learning Workflows

在本文中,我们涵盖三个主题:训练期间可视化的内容、提供这些可视化的工具以及使用挂钩和断点直接捕获模型计算的方法。

使用模仿的平衡数据集审计模型偏差

Auditing Model Bias with Balanced Datasets with Mimesis

了解如何使用 Mimesis 库生成平衡的反事实数据集,帮助分析模型中的潜在偏差。

系统设计面试问题:方便收集

System Design Interview Questions: A Handy Collection

Ace 系统设计访谈包含 10 个 GitHub 存储库,其中包含基础知识、经过验证的模式和真实问题,可帮助您充满信心地设计可扩展系统。