平均深度关键词检索结果

机器学习“降临日历”第 8 天:Excel 中的隔离森林

The Machine Learning “Advent Calendar” Day 8: Isolation Forest in Excel

隔离森林可能看起来很技术性,但它的想法很简单:使用随机分割来隔离点。如果一个点很快被孤立,那么它就是一个异常点;如果需要多次分割,这是正常的。使用微小的数据集1、2、3、9,我们可以清楚地看到逻辑。我们构建几个随机树,测量每个点需要多少个分割,平均深度,并将它们转换为异常分数。短深度的分数接近 1,长深度的分数接近 0。Excel 的实现很痛苦,但算法本身很优雅。它可以扩展到许多特征,不对分布做出任何假设,甚至可以处理分类数据。最重要的是,隔离森林提出了一个不同的问题:不是“什么是正常的?”,而是“我能以多快的速度隔离这一点?”机器学习“降临日历”第 8 天:Excel 中的隔离森林帖子首先出