走向数据科学领域信息情报检索

在数据科学领域分享概念、思想和代码。Towards Data Science Inc.是一家在加拿大注册的公司。它为成千上万的人提供了一个交流思想、扩展对数据科学理解的平台。

2025年5月6日 01:26

使KPI更改有意义

Making Sense of KPI Changes

理解帖子中真正发生的事情的实用指南首先出现在数据科学方面。

2025年5月5日 18:39

用于文档理解的微调VLLM

Fine-Tuning vLLMs for Document Understanding

了解如何对特定任务进行微调视觉语言模型，以供文档理解进行微调VLLM，首先出现在数据科学上。

2025年5月5日 18:29

网站功能工程规模：Pyspark，Python＆Snowflake

Website Feature Engineering at Scale: PySpark, Python & Snowflake

介绍和问题想象一下，您正在盯着一个数据库，该数据库包含多个国家 /地区的数千个商人，每个国家都有自己的网站。你的目标？确定与新业务建议合作的顶级候选人。手动浏览每个网站是不可能的，因此您需要一种自动化的方法来评估每个商人的[…]邮政网站的大规模工程：Pyspark，Python＆Snowflake首先出现在数据科学上。

2025年5月2日 20:03

从一个点到L∞

From a Point to L∞

AI如何使用从一个点到L∞的距离柱首先出现在数据科学上。

2025年5月2日 19:56

使用LLMS构建和查询知识图

Build and Query Knowledge Graphs with LLMs

从文档摄入到智能查询中 - 所有这些都使用开放的工具和指导设置的邮政构建和查询知识图首先出现在数据科学上。

2025年5月2日 18:46

为什么我停止使用光标并恢复为VSCODE

Why I stopped Using Cursor and Reverted to VSCode

Github Copilot是数据科学家的最佳AI辅助因素吗？为什么我停止使用光标并恢复为VScode的帖子首先出现在数据科学上。

2025年5月2日 18:38

功率查询中的重复和参考之间的区别

The Difference between Duplicate and Reference in Power Query

在电源查询中，我们可以复制或引用现有表。但是它们之间有什么区别？让我们深入研究它。

2025年5月2日 18:29

想要更好的集群吗？尝试DeepType

Want Better Clusters? Try DeepType

使用深度学习帖子群集数据的更聪明的方式想要更好的群集？尝试DeepType首先出现在数据科学方面。

2025年5月2日 05:52

与孩子们谈论AI

Talking to Kids About AI

“这是您在LLM上的大脑”，其他您不应该说与孩子们谈论AI的帖子首先出现在数据科学方面。

2025年5月2日 05:13

代理AI 101：开始您的旅程构建AI代理

Agentic AI 101: Starting Your Journey Building AI Agents

了解如何创建AI代理的基本原理。后期ADIC AI 101：启动您的旅程构建AI代理商首先出现在数据科学方面。

2025年5月2日 05:02

生锈的Python开发人员：为什么要看生锈的编程语言

Rust for Python Developers: Why You Should Take a Look at the Rust Programming Language

发现Rust如何通过速度，安全性和控制来补充Python，以及为什么值得您作为现代开发人员的关注。python开发人员的生锈：为什么您应该看看Rust编程的语言首先出现在数据科学上。

2025年4月29日 01:10

在2025年努力夺取数据角色？这5个技巧将改变

Struggling to Land a Data Role in 2025? These 5 Tips Will Change That

您的梦想数据工作并不是在欺骗您 - 您只需要智能搜索。这5个提示将首先改变数据科学。

2025年4月28日 18:38

numexpr：“比numpy快”库，大多数数据科学家从未使用过

NumExpr: The “Faster than Numpy” Library Most Data Scientists Have Never Used

与Numpythe Post Numexpr的比较性能测试：“比Numpy更快”库，大多数数据科学家从未使用过首先使用的数据科学。

2025年4月28日 18:32

当Openai并不总是答案时：基于包装的AI代理背后的企业风险

When OpenAI Isn’t Always the Answer: Enterprise Risks Behind Wrapper-Based AI Agents

数据隐私，合规性和信任差距在当今的AI代理集成中，当Openai并不总是答案时：基于包装的AI代理背后的企业风险首先出现在数据科学上。

2025年4月28日 17:56

添加训练噪声以改善变形金刚的检测

Adding Training Noise To Improve Detections In Transformers

deNoising，该帖子添加了训练噪声以改善变形金刚的检测，这首先是迈向数据科学的检测。

2025年4月28日 17:47

动手多代理LLM餐厅模拟，带Python和Openai

Hands-on Multi Agent LLM Restaurant Simulation, with Python and OpenAI

这是我使用大型语言模型代理模拟端到端餐厅流程的方式。

2025年4月25日 20:35

使用LLMS供电的分步指南

A Step-By-Step Guide To Powering Your Application With LLMs

探索一个动手指南，将大型语言模型集成到现实世界中的应用程序中，而不仅仅是阅读有关它。帖子逐步使用LLMS供电您的应用程序为数据科学供电。

2025年4月25日 20:20

魔术背后：张量如何驱动变压器

Behind the Magic: How Tensors Drive Transformers

变形金刚内部的张量的工作流程魔术背后的帖子：张量如何使变形金刚首先出现在数据科学上。