走向数据科学领域信息情报检索

在数据科学领域分享概念、思想和代码。Towards Data Science Inc.是一家在加拿大注册的公司。它为成千上万的人提供了一个交流思想、扩展对数据科学理解的平台。

我每 5 个步骤测量一次神经网络训练 10,000 次迭代

I Measured Neural Network Training Every 5 Steps for 10,000 Iterations

图片来自 Pixabay.com 文章《我每 5 个步骤测量 10,000 次迭代的神经网络训练》一文首先出现在《走向数据科学》上。

“人工智能产品的成功取决于用户与其功能交互的直观程度”

“The success of an AI product depends on how intuitively users can interact with its capabilities”

Janna Lipenkova 谈论人工智能战略、人工智能产品以及领域知识如何改变人工智能解决方案的整体形态。 “人工智能产品的成功取决于用户与其功能交互的直观程度”一文首先出现在《走向数据科学》上。

如何破解机器学习系统设计面试

How to Crack Machine Learning System-Design Interviews

Meta、Apple、Reddit、Amazon、Google 和 Snap ML 设计面试的综合指南《如何破解机器学习系统设计面试》一文首先出现在《走向数据科学》上。

公司在将 AI/ML 集成到流程中时犯的关键错误

Critical Mistakes Companies Make When Integrating AI/ML into Their Processes

我在跨行业领导人工智能团队中学到了什么公司在将人工智能/机器学习集成到其流程中时犯的关键错误一文首先出现在《迈向数据科学》上。

LLM 是随机算法

LLMs Are Randomized Algorithms

最新的人工智能模型与 50 年历史的学术领域之间令人惊讶的联系法学硕士后是随机算法首先出现在《走向数据科学》上。

使用 Python 的机器人技术:Q-Learning、Actor-Critic 与进化算法

Robotics with Python: Q-Learning vs Actor-Critic vs Evolutionary Algorithms

为您的 RL 机器人构建自定义 3D 环境Python 机器人学:Q-Learning vs Actor-Critic vs Evolutionary Algorithms 帖子首先出现在 Towards Data Science 上。

TDS 时事通讯:引人入胜的数据故事如何带来更好的业务决策

TDS Newsletter: How Compelling Data Stories Lead to Better Business Decisions

为什么数据驱动的故事仍然是从业者的常青工具TDS 新闻通讯:引人注目的数据故事如何带来更好的业务决策首先出现在走向数据科学上。

为 Kaggle 竞赛组织代码、实验和研究

Organizing Code, Experiments, and Research for Kaggle Competitions

获得 Kaggle 竞赛奖牌时学到的经验教训和技巧《为 Kaggle 竞赛组织代码、实验和研究》一文首先出现在《迈向数据科学》上。

当 Pearson 不够时的 Spearman 相关系数

Spearman Correlation Coefficient for When Pearson Isn’t Enough

并非所有关系都是线性的,这就是 Spearman 的用武之地。当 Pearson 不够时的后 Spearman 相关系数首先出现在《走向数据科学》上。

Power BI 聚合终极指南

The Ultimate Guide to Power BI Aggregations

聚合是 Power BI 中最强大的功能之一 - 了解如何利用此功能来提高 Power BI 解决方案的性能这篇文章《Power BI 聚合终极指南》首先出现在 Towards Data Science 上。

如何评估 RAG 管道中的检索质量(第 3 部分):DCG@k 和 NDCG@k

How to Evaluate Retrieval Quality in RAG Pipelines (Part 3): DCG@k and NDCG@k

使用分级度量评估 RAG 管道的检索质量的第三部分也是最后一部分如何评估 RAG 管道中的检索质量(第 3 部分):DCG@k 和 NDCG@k 首先出现在 Towards Data Science 上。

特征检测,第 2 部分:拉普拉斯和高斯运算符

Feature Detection, Part 2: Laplace & Gaussian Operators

拉普拉斯遇见高斯——边缘检测中两个算子的故事特征检测后,第 2 部分:拉普拉斯和高斯算子首先出现在《走向数据科学》上。

数据科学的三个时代:何时使用传统机器学习、深度学习或法学硕士(用一个示例进行解释)

The Three Ages of Data Science: When to Use Traditional Machine Learning, Deep Learning, or an LLM (Explained with One Example)

一个描述数据科学家工作如何在三代机器学习中发生变化的实际用例《数据科学的三个时代:何时使用传统机器学习、深度学习或法学硕士(用一个例子解释)》一文首先出现在《走向数据科学》上。

如何使用 GPT-5 构建代理

How to Build Agents with GPT-5

了解如何使用 GPT-5 作为数据上强大的 AI 代理。如何使用 GPT-5 构建代理一文首先出现在 Towards Data Science 上。

人工智能炒作:不要高估人工智能的影响

AI Hype: Don’t Overestimate the Impact of AI

目标是登月而不是手推车人工智能炒作:不要高估人工智能的影响这篇文章首先出现在《走向数据科学》上。

使用 C 使 Python 速度提高 150 倍

Make Python Up to 150× Faster with C

将性能关键型代码卸载到 C 而不放弃 Python 的实用指南。使用 C 将 Python 速度提高 150 倍一文首先出现在 Towards Data Science 上。

为什么用数据讲故事对业务和数据分析师很重要

Why Storytelling With Data Matters for Business and Data Analysts

数据正在推动业务的未来,以下是您如何为未来做好准备的文章《为什么用数据讲故事对业务和数据分析师很重要》一文首先出现在《迈向数据科学》上。

更多的数据总是能带来更好的性能吗?

Does More Data Always Yield Better Performance?

通过试验样本大小、属性集和模型复杂性之间的相互作用,探索和挑战“更多数据 → 更好性能”的传统智慧。帖子“更多数据总是会产生更好的性能吗?”首先出现在《走向数据科学》上。