走向数据科学领域信息情报检索

在数据科学领域分享概念、思想和代码。Towards Data Science Inc.是一家在加拿大注册的公司。它为成千上万的人提供了一个交流思想、扩展对数据科学理解的平台。

我研究的一切都成为机器学习工程师(无CS背景)

Everything I Studied to Become a Machine Learning Engineer (No CS Background)

我在旅途中使用的书籍,课程和资源。我研究的帖子成为机器学习工程师(无CS背景)的所有内容首先出现在数据科学方面。

时间序列预测变得简单(第4.1部分):理解时间序列中的平稳性

Time Series Forecasting Made Simple (Part 4.1): Understanding Stationarity in a Time Series

seriesthe帖子时间序列预测的直观平稳性指南变得简单(第4.1部分):了解时间序列中的平稳性首先出现在数据科学上。

通过论文简短的GPT历史

A Brief History of GPT Through Papers

语言模型变得非常好。但是它们来自哪里?该帖子首先通过论文介绍了GPT的简短历史。

您需要平移和倾斜360°图像的数学

The Math You Need to Pan and Tilt 360° Images

平移球形图像只是水平卷,但是垂直倾斜它要棘手。让我们看看数学!帖子首先出现在数据科学上,您需要平移和倾斜360°图像所需的数学。

如何开发强大的内部LLM基准

How to Develop Powerful Internal LLM Benchmarks

了解如何使用自己的基准标准比较LLM,该帖子如何首先出现在数据科学方面。

柏拉图的洞穴和数据阴影

Plato’s Cave and the Shadows of Data

关于真理,幻觉以及数据可以在柏拉图的洞穴之后复制的数据和数据阴影首先出现在数据科学方面。

变形金刚中的位置嵌入:绳索和alibi的数学指南

Positional Embeddings in Transformers: A Math Guide to RoPE & ALiBi

学习gpt的猿,绳索和不在场的位置嵌入 - 直觉,数学,pytorch代码以及在变形金刚的TinyStoriesthe后位置嵌入的实验:绳索和艾比利的数学指南首先出现在数据科学上。

为什么您的提示不属于git

Why Your Prompts Don’t Belong in Git

在源中存储提示的隐性成本codethe帖子为什么您的提示不属于git,首先出现在数据科学上。

如何基于Google Cloud上的经典机器学习工作负载

How to Benchmark Classical Machine Learning Workloads on Google Cloud

利用CPU用于实用的,具有成本效益的机器学习帖子如何在Google Cloud上进行基准的经典机器学习工作负载首先出现在数据科学方面。

为什么科学必须与生成AI共同创造以打破当前的研究障碍

Why Science Must Embrace Co-Creation with Generative AI to Break Current Research Barriers

致科学界的公开信中,为什么科学必须与生成AI进行共同创造,以打破当前的研究障碍,这首先出现在数据科学方面。

Google对Gemini的影响进展或绿色洗涤是否揭示?

Is Google’s Reveal of Gemini’s Impact Progress or Greenwashing?

从表面上看,Google的数字听起来很小,但是您看的越近,故事就越复杂。首先出现在数据科学上。

更好的机器学习模型

Three Essential Hyperparameter Tuning Techniques for Better Machine Learning Models

了解如何优化ML模型以更好地结果,帖子为更好的机器学习模型的三个基本的高参数调谐技术首先出现在数据科学方面。

破解密度代码:为什么MAF在KDE Stalls

Cracking the Density Code: Why MAF Flows Where KDE Stalls

了解为什么自回旋流是高维datathe柱破裂密度代码的高密度估计工具:为什么MAF流向KDE Stalls首先出现在数据科学上的位置。

如何执行全面的大规模LLM验证

How to Perform Comprehensive Large Scale LLM Validation

了解如何验证大型LLM应用程序邮政如何进行全面的大规模LLM验证,首先是朝着数据科学迈进。

如果我在2020年有AI:租用跑道动态定价模型

What If I Had AI in 2020: Rent The Runway Dynamic Pricing Model

曾经想过,如果Covid在Covid开始时存在Chatgpt,那可能会有多大不同?特别是对于必须更新其预测模型的数据科学家?如果我在2020年有AI:租用跑道动态定价模型该怎么办,首先出现在数据科学方面。

设计值得信赖的ML模型:Alan&Aida发现机器学习中的单调性

Designing Trustworthy ML Models: Alan & Aida Discover Monotonicity in Machine Learning

精确度不能保证可信度。单调性确保预测与常识和业务规则保持一致。设计值得信赖的ML模型:Alan&Aida发现机器学习中的单调性首先出现在数据科学方面。

使用5行代码

How We Reduced LLM Costs by 90% with 5 Lines of Code

当干净的代码隐藏效率低下时:我们从修复几行代码并节省了90%的LLM成本中学到的内容。帖子我们如何将LLM成本降低90%,而5行代码首先出现在数据科学方面。

您需要了解的有关新电源BI存储模式

Everything You Need to Know About the New Power BI Storage Mode

直接左右的50个阴影发布了您需要了解的有关新功率BI存储模式的所有信息,首先是在数据科学方面出现的。