高斯朴素贝叶斯解释:初学者的带有代码示例的可视化指南

分类算法钟形假设以获得更好的预测⛳️ 更多分类算法,解释:· 虚拟分类器 · K 最近邻分类器 · 伯努利朴素贝叶斯 ▶ 高斯朴素贝叶斯 · 决策树分类器 · 逻辑回归 · 支持向量分类器 · 多层感知器(即将推出!)基于我们之前关于处理二进制数据的伯努利朴素贝叶斯的文章,我们现在探索用于连续数据的高斯朴素贝叶斯。与二元方法不同,该算法假设每个特征都服从正态(高斯)分布。在这里,我们将看到高斯朴素贝叶斯如何处理连续的钟形数据(产生准确的预测),而无需深入研究贝叶斯定理的复杂数学。所有视觉效果:作者使用 Canva Pro 创建。针对移动设备进行了优化;在桌面上可能显得过大。定义与其他朴素贝叶斯变体一样,高斯朴素贝叶斯对特征独立性做出了“朴素”假设。它假设特征在给定类标签的情况下是条件独立的。然而,虽然伯努利朴素贝叶斯适用于具有二元特征的数据集,但高斯朴素贝叶斯假设特征服从连续正态(高斯)分布。尽管这种假设在现实中可能并不总是成立,但它简化了计算,并且常常得到令人惊讶的准确结果。伯努利 NB 假设二进制数据,多项式 NB 处理离散计数,高斯 NB 处理连续数据,假设一个

来源:走向数据科学

分类算法

高斯幼稚的贝叶斯,解释:一个带有代码示例的初学者的视觉指南

钟形假设,用于更好的预测

⛳️更多分类算法,解释了:·虚拟分类器·最近的邻居分类器·伯诺利(Bernoulli)幼稚的贝叶斯▶高斯幼稚贝叶斯·决策树分类器

虚拟分类器 K最近的邻居分类器 Bernoulli幼稚的贝叶斯 高斯幼稚贝叶斯 决策树分类器 逻辑回归 支持向量分类器

在我们上一篇关于处理二进制数据的文章上的文章上,我们现在探索高斯幼稚的贝叶斯以获取连续数据。与二进制方法不同,该算法假定每个特征都遵循正常(高斯)分布。

在这里,我们将看到高斯幼稚的贝叶斯如何处理连续的,钟形的数据 - 在准确的预测中响起 - 都没有进入贝叶斯定理的复杂数学。

而无需进入复杂的数学
所有视觉效果:使用Canva Pro创建的作者。针对移动设备进行了优化;可能会出现在桌面上。

定义

像其他天真的贝叶斯变体一样,高斯天真的贝叶斯也是特征独立性的“天真”假设。它假设特征在班级标签上是有条件独立的。

但是,尽管Bernoulli幼稚的贝叶斯适合具有二进制特征的数据集,但高斯天真的贝叶斯假设该特征遵循连续的正常(高斯)分布。尽管这种假设在现实中可能并不总是正确的,但它简化了计算,并且通常会导致出人意料的准确结果。

连续的正常(高斯)
bernoulli nb假定二进制数据,多项式NB可与离散计数一起工作,而高斯NB则使用正态分布的连续数据。

使用的数据集

列:“ Rainfallamount”(以毫米为单位),“温度”(在Celcius),“湿度”(以%),“ Windspeed”(以km/h为单位)和“ play”(是/否,目标特征)

主要机制

先生