A Step-by-Step Guide to Build a Graph Learning System for a Movie Recommender
使用 PyTorch Geometric 和 MovieLens DataSet 构建继续阅读 Towards Data Science »
Market Basket Analysis Using High Utility Itemset Mining
在交易中寻找高价值模式在这篇文章中,我将提供一种替代流行的市场篮子分析技术的方法,它可以帮助从业者找到高价值模式,而不仅仅是最常见的模式。我们将对不同的模式挖掘问题有一些直观的了解,并看一个真实的例子。完整的代码可以在这里找到。所有图像均由作者创建。简介我已经写了一篇关于模式挖掘的更入门的文章;如果你不熟悉这里提到的一些概念,请先阅读那篇文章。简而言之,模式挖掘试图在数据中寻找模式(呃)。大多数时候,这些数据以(多)集或序列的形式出现。例如,在我的上一篇文章中,我研究了用户在网站上执行的操作序列。在这种情况下,我们会关心项目的顺序。在其他情况下,比如我们将在下面讨论的情况,我们不关心项目的顺序
Understanding Einstein’s Notation and einsum Multiplication
使用字符串符号执行高阶张量运算继续阅读 Towards Data Science »
Deep Learning for Crop Yield Prediction (Pt.1 — Model)
提高作物产量并优化灌溉:一种深度学习方法进行多元分析继续阅读 Towards Data Science »
How I’d Learn to Be a Data Analyst in 2024
...如果我可以重新开始。继续阅读 Towards Data Science »
Forecasting Germany’s Solar Energy Production: A Practical Approach with Prophet
使用 Python 进行分析和实施继续阅读 Towards Data Science »
Is Your User Base Growing or Shrinking?
如何通过跟踪客户细分和 KPI 揭示业务的真实健康状况继续阅读 Towards Data Science »
How to Create a Powerful AI Email Search for Gmail with RAG
了解如何使用 RAG 开发应用程序来搜索电子邮件继续阅读 Towards Data Science »
XPER: Unveiling the Driving Forces of Predictive Performance
一种分解您最喜欢的性能指标的新方法照片由 Sira Anamwong 在 123RF 上拍摄与 S. Hué、C. Hurlin 和 C. Pérignon 合著。I - 从解释模型预测到解释模型性能敏感 AI 系统的可信度和可接受性在很大程度上取决于用户理解相关模型或至少是其预测的能力。为了揭开不透明 AI 应用的面纱,可解释 AI (XAI) 方法(例如事后可解释性工具(例如 SHAP、LIME))如今被广泛使用,并且从其输出中产生的见解现在已被广泛理解。除了单个预测之外,我们在本文中展示了如何使用可解释性能 (XPER) 方法识别任何分类或回归模型的性能指标(例如 AUC、R2)的驱动因
To Care, or Not to Care: Using XmR Charts to Differentiate Signals from Noise in Metrics
创建和解释 XmR 图表以进行有效数据分析的分步指南继续阅读 Towards Data Science »
How Tiny Neural Networks Represent Basic Functions
通过简单的算法示例对机械可解释性进行简单介绍简介本文展示了小型人工神经网络 (NN) 如何表示基本功能。目标是提供有关 NN 工作原理的基本直觉,并作为机械可解释性的简单介绍——该领域旨在对 NN 进行逆向工程。我提供了三个基本函数的示例,使用简单的算法描述了每个函数,并展示了如何将算法“编码”到神经网络的权重中。然后,我探索网络是否可以使用反向传播来学习算法。我鼓励读者将每个示例视为一个谜语,并在阅读解决方案之前花一点时间。机器学习拓扑本文尝试将 NN 分解为离散操作并将其描述为算法。另一种方法可能更常见、更自然,即研究不同层中线性变换的连续拓扑解释。以下是一些有助于增强拓扑直觉的优秀资源:
Introducing NumPy, Part 1: Understanding Arrays
创建、描述和访问属性继续阅读 Towards Data Science »
All You Need Is Statistics to Analyze Tabular Datasets
要分析表格数据集,无需深度学习或大型语言模型继续阅读 Towards Data Science »
Can AI Agents Do Your Day-to-Day Tasks on Apps?
在应用程序和人的世界中对编码代理进行基准测试想象这样一个世界,其中 AI 代理可以充当您的个人助理,为您完成任务,例如设置亚马逊退货或根据您的电子邮件取消会议。这将需要代理在复杂的工作流程中以交互方式操作您的应用程序,并且实际上还没有很好的方法来对此类代理进行基准测试。直到现在。🤖 1. 个人应用程序的编码代理随着底层 AI 模型的改进,AI 助手(例如,我们手机上的助手)正在不断改进。几年前,他们很难正确回答简单的事实问题。今天,他们已经开始达到可以代表我们操作应用程序来执行基本任务的程度。例如,最近的 GoogleIO 和 Apple WWDC 活动大部分都是关于 AI 助手成为代表我们工
Linear Programming Optimization: The Simplex Method
第 3 部分:底层算法继续阅读 Towards Data Science »
Is Multi-Collinearity Destroying Your Causal Inferences In Marketing Mix Modelling?
因果 AI,探索因果推理与机器学习的整合照片由 NOAA 在 Unsplash 上拍摄本系列是关于什么的?欢迎来到我的因果 AI 系列,我们将探索因果推理与机器学习模型的整合。期望探索不同业务环境中的许多实际应用。在上一篇文章中,我们介绍了使用 CUPED 和双重机器学习为实验提供动力。今天,我们将重点转移到了解多重共线性如何损害您做出的因果推断,特别是在营销组合建模中。如果您错过了上一篇关于使用 CUPED 和双重机器学习为实验提供动力的文章,请在此处查看:使用 CUPED 和双重机器学习为实验提供动力简介在本文中,我们将探讨多重共线性的破坏性,并评估我们可以用来解决它的一些方法。将涵盖以下
Data Science at Home: Solving the Nanny Schedule Puzzle with Monte Carlo and Genetic Algorithms
让混乱变得有序,同时简化我们寻找完美保姆的过程作为数据科学领导者,我习惯于拥有一支能够将混乱变为清晰的团队。但是,当混乱是你自己家庭的保姆时间表时,即使是最好的计划也会出错。一想到工作会议、午睡时间和不可预测的轮班,我们的思绪就会陷入混乱——直到我意识到我可以使用解决业务问题的相同算法来解决非常个人的问题。借助蒙特卡罗模拟、遗传算法和一些父母的聪明才智,我开始了一场驯服我们疯狂时间表的旅程,每次调整一个算法。结果如何?好吧,我们只能说我们保姆的新时间表看起来非常合适。照片由 Markus Spiske 在 Unsplash 上拍摄设置舞台:伟大的时间表难题我们的家庭时间表看起来就像瓷器店里的公