走向数据科学领域信息情报检索

在数据科学领域分享概念、思想和代码。Towards Data Science Inc.是一家在加拿大注册的公司。它为成千上万的人提供了一个交流思想、扩展对数据科学理解的平台。

我本月学到的机器学习课程

The Machine Learning Lessons I’ve Learned This Month

2025 年 10 月:自述文件、MIG 和动作这篇文章《本月我学到的机器学习课程》首先出现在《迈向数据科学》上。

构建一个真正有效的监控系统

Building a Monitoring System That Actually Works

捕获真实异常情况而不被错误警报淹没的分步指南“构建实际有效的监控系统”一文首先出现在“迈向数据科学”上。

框架维度的力量:数据科学家应该了解什么

The Power of Framework Dimensions: What Data Scientists Should Know

实践指导和案例研究《框架维度的力量:数据科学家应该知道什么》一文首先出现在《迈向数据科学》上。

人工智能代理:从效率助手到明天的领导者?

AI Agents: From Assistants for Efficiency to Leaders of Tomorrow?

人工智能如何从“简单”的助手发展成为我们未来甚至首席执行官和州长的潜在架构师后人工智能代理:从效率助手到明天的领导者?首先出现在《走向数据科学》上。

如何一致地从复杂文档中提取元数据

How to Consistently Extract Metadata from Complex Documents

了解如何从文档中提取重要信息“如何从复杂文档中一致地提取元数据”一文首先出现在“迈向数据科学”上。

在固定预算下为法学硕士选择最佳模型大小和数据集大小

Choosing the Best Model Size and Dataset Size under a Fixed Budget for LLMs

使用 Tiny Transformers 进行小规模探索《为法学硕士选择固定预算下的最佳模型大小和数据集大小》一文首先出现在《走向数据科学》上。

将 OpenAI Agent Builder 聊天机器人部署到网站

Deploy an OpenAI Agent Builder Chatbot to a Website

使用 OpenAI 的 Agent Builder ChatKit 将 OpenAI Agent Builder 聊天机器人部署到网站一文首先出现在 Towards Data Science 上。

当变形金刚歌唱时:采用 SpectralKD 进行基于文本的知识蒸馏

When Transformers Sing: Adapting SpectralKD for Text-Based Knowledge Distillation

探索 Transformers 的频率指纹以指导更智能的知识蒸馏《当 Transformers Sing:采用 SpectralKD 进行基于文本的知识蒸馏》一文首先出现在 Towards Data Science 上。

如何控制人工智能成本

How to Keep AI Costs Under Control

扩大法学硕士规模的经验教训《如何控制人工智能成本》一文首先出现在《迈向数据科学》上。

如何使用 Python 控制机器人

How to Control a Robot with Python

使用 PyBullet 进行 3D 模拟和运动控制如何使用 Python 控制机器人一文首先出现在 Towards Data Science 上。

多元线性回归简单解释(第 1 部分)

Multiple Linear Regression Explained Simply (Part 1)

拟合平面而不是直线背后的数学。简单解释多元线性回归(第 1 部分)一文首先出现在《走向数据科学》上。

TDS 时事通讯:当人工智能达到极限时会发生什么?

TDS Newsletter: What Happens When AI Reaches Its Limits?

从远处看,新的法学硕士及其支持的应用程序似乎闪闪发光,甚至神奇。不断的产品发布和媒体报道增加了他们的光环,并在机器学习从业者和企业高管中产生了极度的 FOMO 情绪。整体效果如何?感觉人工智能是不可避免的,其价值不容置疑。我们选择的文章 […]后 TDS 时事通讯:当人工智能达到极限时会发生什么?首先出现在《走向数据科学》上。

为什么我们应该为 ML 中的量子计算烦恼?

Why Should We Bother with Quantum Computing in ML?

量子机器学习原理这篇文章我们为什么要为机器学习中的量子计算烦恼?首先出现在《走向数据科学》上。

联邦学习和自定义聚合方案

Federated Learning and Custom Aggregation Schemes

设计和分析稳健聚合策略的实用指南联邦学习和自定义聚合方案后首先出现在走向数据科学上。

使用 Neo4j 和 LlamaIndex 实现 DRIFT 搜索

Implementing DRIFT Search with Neo4j and LlamaIndex

结合全局和本地搜索以获得最准确的响应使用 Neo4j 和 LlamaIndex 实现 DRIFT 搜索一文首先出现在 Towards Data Science 上。

金融领域的代理人工智能:印度尼西亚的机遇与挑战

Agentic AI in Finance: Opportunities and Challenges for Indonesia

人工智能的兴起几乎触及每个行业,包括金融业。事实上,金融行业长期以来一直采用我们现在所说的“传统机器学习”,将其用于预测建模、信用评分和风险分析。但随着当前围绕大型语言模型 (LLM) 和 Agentic AI 的炒作,我开始 […]金融领域的 Agentic AI:印度尼西亚的机遇和挑战首先出现在《走向数据科学》上。

将推荐变压器扩展到十亿个参数

Scaling Recommender Transformers to a Billion Parameters

如何实现新一代 Transformer 推荐器将 Recommender Transformers 扩展至十亿个参数后首次出现在 Towards Data Science 上。

RAG 死了吗?代理人工智能的上下文工程和语义层的兴起

Is RAG Dead? The Rise of Context Engineering and Semantic Layers for Agentic AI

上下文工程、语义层和代理 AI 检索的演变The post Is RAG Dead?代理人工智能的上下文工程和语义层的兴起首先出现在《走向数据科学》上。