Creating 3D Protein Structure Networks Using Python and the RING Server: Part 2
使用 RING 接触网络创建 3D PSN继续阅读 Towards Data Science »
Your eCommerce product performance reports are probably misleading you
为何单一指标不够完善以及加权综合评分如何转变您的业务洞察力单个指标评估的问题在电子商务领域,依靠单个指标来评估产品和品牌表现可能会产生误导。孤立的指标会给人一种虚假的成功感,导致对看似有利可图但实际上正在耗尽业务资源的产品进行过度投资,或者相反,低估具有未开发潜力的项目。要保持领先,您需要一个整体的视角——通过“毛收入”、“转化率”、“毛利率”、“客户获取成本”、“重复购买率”、“履行成本”和“退货率”等几个关键指标来评估产品和品牌的表现。以下是我的许多客户使用的电子商务数据的典型示例。为了保护客户机密性和确保隐私,此处显示的数据是使用 AI 生成的合成数据。尽管它包含各种重要指标,但团队通常
Reinforcement Learning for Physics: ODEs and Hyperparameter Tuning
使用 gymnasium 控制微分方程并优化算法超参数照片由 Brice Cooper 在 Unsplash 上拍摄如前所述,强化学习 (RL) 提供了一种强大的新工具来应对控制非线性物理系统的挑战。非线性物理系统的特点是行为复杂,输入的微小变化可能导致输出的剧烈变化,或者只有微小的输出变化可能来自大输入。解决方案可以分裂,相同条件可以产生不同的输出,甚至以路径依赖的形式具有“记忆”。我们介绍了两种将 RL 应用于非线性物理系统的不同方法:传统的基于神经网络的软演员评论家 (SAC) 和不常见的基于遗传算法的遗传编程 (GP) 方法。简而言之,SAC 使用两个神经网络,一个用于学习环境的行为方
How to Export a Stata “Notebook” to HTML
使用您的代码、输出和图表创建可共享的 HTML 文档继续阅读 Towards Data Science »
Why You Should Be Hiring Methodologists
“你需要做的就是开发你的思维。如果你深入思考,几乎所有事情看起来都很有趣。” — Oscar WildeDALL-E 图像生成器什么是方法学家?传统上,方法学家是研究定性和定量研究方法的人。现代方法学家(方法学家-分析师、方法学家-科学家和方法学家-工程师)是解决复杂问题的多种方法的掌握者。他们还熟悉可用于实施的工具和技术,尽管他们通常与这些领域的真正专家(如云架构师、软件开发人员或数据工程师)一起工作效果最好。我之前写过关于分析方法作为一门学科所涉及的创造性和系统性工作。凭借合适的个性和适当的技术或分析经验,方法学家可以成为组织中最具影响力的技术角色。那么,当您的组织急需数据工程师、数据科学
Autoencoders: An Ultimate Guide for Data Scientists
架构、Python 实现和未来展望的初学者指南继续阅读 Towards Data Science »
GraphMuse: A Python Library for Symbolic Music Graph Processing
是的,音乐和图表确实可以融合!在这篇文章中,我们将介绍我的最新论文和开源软件之一:GraphMuse Python 库。但在深入研究之前,让我先向您介绍一些符号音乐处理的基础知识。故事是这样的……符号音乐处理主要指从乐谱中提取信息。术语“符号”是指任何形式的乐谱或符号中存在的符号。乐谱可以包含除音符之外的各种元素。这些元素可能包括拍号、调号、发音标记、力度标记等。乐谱可以采用多种格式,例如 MIDI、MusicXML、MEI、Kern、ABC 等。近年来,图神经网络 (GNN) 越来越受欢迎,并在从生物网络到推荐系统再到音乐分析的许多领域取得了成功。在音乐分析领域,GNN 已用于解决和声分析、
A Critical Look at AI Image Generation
图像生成 AI 究竟能告诉我们关于这个世界的什么信息?照片由 Math 在 Unsplash 上拍摄我最近有机会对一个有趣的项目进行分析,而我要说的太多了,无法在一篇文章中全部涵盖,所以今天我将讨论我对它的更多想法。研究人员在这个项目中采用的方法是向不同的生成 AI 图像生成工具提供一系列提示:Stable Diffusion、Midjourney、YandexART 和 ERNIE-ViLG(由百度提供)。这些提示特别针对不同的世代——婴儿潮一代、X 世代、千禧一代和 Z 世代,并要求在不同背景下拍摄这些群体的图像,例如“与家人在一起”、“度假”或“在工作”。虽然结果非常有趣,也许揭示了一些
Fine-Tuning BERT for Text Classification
一个带有 Python 代码的可破解示例尽管当今的 100B+ 参数转换器模型是 AI 领域最先进的模型,但我们仍然可以使用较小的(<1B 参数)模型完成很多工作。在本文中,我将介绍一个这样的示例,即微调 BERT(1.1 亿个参数)以对网络钓鱼 URL 进行分类。我将首先介绍关键概念,然后分享示例 Python 代码。图片来自 Canva。微调微调涉及通过额外的训练将预训练模型调整到特定用例。预训练模型是通过无监督学习开发的,从而无需大规模标记数据集。然后,与从头开始训练相比,经过微调的模型可以利用预先训练的模型表示来显着降低训练成本并提高模型性能 [1]。微调大型语言模型 (LLM)将训练
Create Your Own Prompt Enhancer from Scratch
如何模拟 OpenAI 的系统提示生成器功能继续阅读 Towards Data Science »
Temporal-Difference Learning: Combining Dynamic Programming and Monte Carlo Methods for…
RL 的里程碑:Q 学习和双 Q 学习继续阅读 Towards Data Science »
A Novel Approach to Detect Coordinated Attacks Using Clustering
揭示隐藏的模式:对恶意行为进行分组聚类是无监督机器学习中的一种强大技术,它根据给定数据的固有相似性对其进行分组。与分类等依赖预先标记的数据来指导学习过程的监督学习方法不同,聚类对未标记的数据进行操作。这意味着没有预定义的类别或标签,相反,算法会在不事先知道分组应该是什么样子的情况下发现数据的底层结构。聚类的主要目标是将数据点组织成簇,其中同一簇内的数据点彼此之间的相似性高于不同簇中的数据点。这种区别使聚类算法能够形成反映数据中自然模式的组。本质上,聚类旨在最大化簇内相似性,同时最小化簇间相似性。这种技术在需要查找数据中隐藏的关系或结构的用例中特别有用,这使得它在欺诈检测和异常识别等领域很有价值
The Accuracy vs Interpretability Trade-off Is a Lie
为什么从更大的角度来看,黑盒模型并不更准确继续阅读《走向数据科学》»
How to Build a Multi-Target Regression Model for Macroeconomic Prediction
预测多项经济指标的分步指南。继续阅读 Towards Data Science »
The Science Behind AI’s First Nobel Prize
物理学和机器学习如何联手赢得 2024 年诺贝尔物理学奖继续阅读 Towards Data Science »
Marketing Mix Modeling (MMM): How to Avoid Biased Channel Estimates
了解在模型中应该考虑和不应该考虑哪些变量照片由 Fredrick Suwandi 在 Unsplash 上拍摄“在每个营销渠道上投资 X 美元将如何影响销售?”这是营销组合模型应该回答的因果问题,以指导公司决定未来如何分配其营销渠道预算。正如我们将看到的,这个问题的结果高度依赖于你考虑的变量:忽略重要变量或在模型中包含“错误”变量将引入偏差并导致错误的因果估计。这是一个巨大的问题,因为错误的因果估计最终会导致糟糕的营销决策和财务损失。在本文中,我想解决这个问题,并指导如何确定哪些变量应该和不应该在 MMM 中考虑,结构如下:在第 1 章中,我们将通过查看渠道估计值会根据您在模拟示例中考虑的变量
Bringing Structure to Your Data
使用路径模型测试假设在复杂的路径模型中,找到自己的路可能变得困难。照片由 Deva Darshan 在 Unsplash 上拍摄数据科学家经常收集大量变量并寻找它们之间的关系。在此过程中,对变量之间究竟如何相互关联做出假设和假设会很有帮助。学生为下一次考试学习的动力会影响他们的成绩吗?或者好成绩会激发学习的动力吗?激励人们表现出的行为模式究竟是什么,最终会带来好成绩?为了给上述问题提供一些结构,并提供一个工具来实证测试它们,我想在本文中解释路径模型,也称为结构方程模型 (SEM)。虽然在心理学等社会科学中路径模型很常用,但我觉得它们在数据科学和计算机科学等其他领域并不那么突出。因此,我想概述路
How to Perform A/B Testing with Hypothesis Testing in Python: A Comprehensive Guide
使用实用 Python 示例制定数据驱动决策的分步指南继续阅读 Towards Data Science »