Toward关键词检索结果

四维数据可视化:气泡图中的时间

4-Dimensional Data Visualization: Time in Bubble Charts

气泡图将大量信息优雅地压缩为单个可视化,气泡大小增加了第三个维度。但是,比较“之前”和“之后”状态通常至关重要。为了解决这个问题,我们建议在这些状态之间添加过渡,以创建直观的用户体验。由于我们找不到现成的解决方案,所以我们开发了自己的解决方案。[…]文章 4 维数据可视化:气泡图中的时间首先出现在 Towards Data Science 上。

Gamma 障碍分布

The Gamma Hurdle Distribution

哪个结果重要?这是一个常见的场景:进行了 A/B 测试,其中为活动选择了随机单位样本(例如客户),并为他们提供了处理 A。选择了另一个样本以接受处理 B。“A”可能是沟通或要约,“B”可能是没有沟通或没有 […]The post The Gamma Hurdle Distribution appeared first on Towards Data Science.

三角预测:为什么传统影响估计被夸大了(以及如何修复它们)

Triangle Forecasting: Why Traditional Impact Estimates Are Inflated (And How to Fix Them)

准确的影响估计可以成就或毁掉您的业务案例。然而,尽管它很重要,但大多数团队都使用过于简单的计算,这可能会导致预测过高。这些盲目估计的数字不仅会破坏利益相关者的信誉,还会导致资源分配不当和计划失败。但有一种更好的方法来预测渐进式影响[…]The post Triangle Forecasting: Why Traditional Impact Estimates Are Inflated (And How to Fix They) appeared first on Towards Data Science.

我尝试制作自己的(糟糕的)LLM 基准以在密室逃脱中作弊

I Tried Making my Own (Bad) LLM Benchmark to Cheat in Escape Rooms

最近,DeepSeek 发布了他们的最新模型 R1,一篇又一篇文章称赞其相对于成本的性能,以及此类开源模型的发布如何真正永远改变 LLM 的发展方向。这真是令人兴奋!而且,范围太大了,无法一一列举……但是当像 DeepSeek 这样的模型 […]The post I Tried Making my own (Bad) LLM Benchmark to Cheat in Escape Rooms 首次出现在 Towards Data Science 上。

使用 LLM 生成合成数据

Synthetic Data Generation with LLMs

RAG 的流行度 在过去两年与金融公司合作的过程中,我亲眼目睹了他们如何识别和优先考虑生成式 AI 用例,在复杂性和潜在价值之间取得平衡。检索增强生成 (RAG) 通常是许多 LLM 驱动解决方案的基础功能,在易于实施和对现实世界的影响之间取得平衡。通过结合 […]The post 使用 LLM 进行合成数据生成首先出现在 Towards Data Science 上。

高斯混合模型的矩估计量法

The Method of Moments Estimator for Gaussian Mixture Models

音频处理是数字信号处理 (DSP) 和机器学习最重要的应用领域之一。对声学环境进行建模是开发数字音频处理系统(例如:语音识别、语音增强、声学回声消除等)的重要步骤。声学环境中充满了背景噪音,这些噪音可能来自多个来源。例如,[…]The post The Method of Moments Estimator for Gaussian Mixture Models appeared first on Towards Data Science.

LLM 温度🔥🌡️ 综合指南

A Comprehensive Guide to LLM Temperature 🔥🌡️

在构建我自己的基于 LLM 的应用程序时,我发现了许多提示工程指南,但很少有用于确定温度设置的等效指南。当然,温度是一个简单的数值,而提示可能会变得非常复杂,因此作为产品决策,它可能感觉微不足道。尽管如此,选择合适的温度可以极大地改变 […]The post LLM 温度综合指南🔥🌡️ 首先出现在 Towards Data Science 上。

如何在 Microsoft PowerBI 中创建网络图可视化

How to Create Network Graph Visualizations in Microsoft PowerBI

Microsoft PowerBI 是最流行的商业智能 (BI) 工具之一,虽然它具有为整个企业的利益相关者创建动态分析报告所需的所有功能,但创建一些高级数据可视化更具挑战性。本文将介绍如何在 Microsoft PowerBI 中创建大型网络图可视化 […] 如何在 Microsoft PowerBI 中创建网络图可视化的文章首先出现在 Towards Data Science 上。

PyTorch 中的高效指标收集:避免 TorchMetrics 的性能陷阱

Efficient Metric Collection in PyTorch: Avoiding the Performance Pitfalls of TorchMetrics

指标收集是每个机器学习项目的重要组成部分,使我们能够跟踪模型性能并监控训练进度。理想情况下,指标的收集和计算不应给训练过程带来任何额外开销。然而,就像训练循环的其他组件一样,低效的指标计算可能会带来不必要的开销,增加训练步骤[…]PyTorch 中的高效指标收集:避免 TorchMetrics 的性能陷阱首先出现在 Towards Data Science 上。

Python 中最小成本流优化简介

Introduction to Minimum Cost Flow Optimization in Python

最小成本流优化将通过节点和边缘网络移动流量的成本降至最低。节点包括源(供应)和接收器(需求),具有不同的成本和容量限制。目的是找到在遵守所有容量限制的同时将容量从源移动到接收器的最低成本方法。应用 […]The post Introduction to Minimum Cost Flow Optimization in Python appeared first on Towards Data Science.

使用 AI 和 LLM,通过 Python 和 Streamlit 从简历到求职信

From Resume to Cover Letter Using AI and LLM, with Python and Streamlit

免责声明:使用 AI 制作求职信甚至简历的想法显然不是我首先提出的。很多人之前已经这样做过(非常成功),并根据这个想法建立了网站甚至公司。这只是一个关于如何使用 […] 构建自己的求职信 AI 生成器应用程序的教程。文章从简历到求职信,使用 AI 和 LLM,使用 Python 和 Streamlit 首次出现在 Towards Data Science 上。

ML 功能管理:实用演进指南

ML Feature Management: A Practical Evolution Guide

在机器学习的世界里,我们痴迷于模型架构、训练管道和超参数调整,却常常忽略了一个基本方面:我们的特征在其整个生命周期中如何生存和呼吸。从每次预测后消失的内存计算到几个月后重现精确特征值的挑战,我们处理特征的方式可能会 […] 文章 ML 特征管理:实用演进指南首次出现在 Towards Data Science 上。

展示和讲述

Show and Tell

使用 PyTorch 实现最早的神经图像标题生成器模型之一。文章“Show and Tell”首先出现在 Towards Data Science 上。

神经网络——直观且详尽的解释

Neural Networks – Intuitively and Exhaustively Explained

对现代人工智能中最基本架构的深入探索。文章“神经网络——直观而详尽的解释”首先出现在 Towards Data Science 上。

如何晋升为数据科学家

How to Get Promoted as a Data Scientist

不到 2 年内获得 2 次晋升的首席数据科学家的建议文章“如何晋升为数据科学家”首先出现在 Towards Data Science 上。

如何在时间序列中查找季节性模式

How to Find Seasonality Patterns in Time Series

使用傅里叶变换检测季节性成分文章“如何在时间序列中查找季节性模式”首先出现在 Towards Data Science 上。

😲 量化惊喜——数据科学家的信息理论入门——第 1/4 部分:基础

😲 Quantifying Surprise – A Data Scientist’s Intro To Information Theory – Part 1/4: Foundations

深入了解信息理论并掌握其在机器学习和数据分析中的应用。包含 Python 代码。🐍帖子 😲 量化惊喜 - 数据科学家的信息理论入门 - 第 1/4 部分:基础知识首先出现在 Towards Data Science 上。

🤷 量化不确定性——数据科学家的信息理论入门——第 2/4 部分:熵

🤷 Quantifying Uncertainty – A Data Scientist’s Intro To Information Theory – Part 2/4: Entropy

深入了解熵并掌握其在机器学习和数据分析中的应用。包含 Python 代码。🐍帖子 🤷 量化不确定性 - 数据科学家的信息理论入门 - 第 2/4 部分:熵首先出现在 Towards Data Science 上。