最近邻关键词检索结果

SpaceX Rocket推出了私人月亮着陆器和NASA“开拓者”来寻找月球水(视频)

SpaceX rocket launches private moon lander and NASA 'trailblazer' to hunt for lunar water (video)

SpaceX今天(2月26日)发起了双月任务,派遣了一个私人月球着陆器和一辆NASA轨道仪来寻找地球最近邻居的水迹象。

使用 PCA 进行异常值检测的简单示例

A Simple Example Using PCA for Outlier Detection

在异常值检测之前执行 PCA 转换可提高准确性、速度和内存使用率本文继续介绍使用 PCA(主成分分析)进行异常值检测的一系列应用,紧随其后的是使用 PCA 进行异常值检测。那篇文章描述了 PCA 本身,并介绍了使用 PCA 进行异常值检测的两种主要方法:评估重构误差,以及在 PCA 转换空间上运行标准异常值检测器。它还给出了第一种方法的示例,即使用重构误差,使用 PyOD 提供的 PCA 和 KPCA 检测器可以轻松完成。本文介绍了第二种方法,我们首先使用 PCA 转换数据空间,然后在此上运行标准异常值检测。正如上一篇文章所述,在某些情况下,这可能会降低可解释性,但在准确性、执行时间和内存使用

使用 PCA 进行异常值检测

Using PCA for Outlier Detection

一种识别数值数据中异常值的令人惊讶的有效方法PCA(主成分分析)通常用于数据科学,通常用于降维(通常用于可视化),但它实际上对于异常值检测也非常有用,我将在本文中描述它。本文延续了我的异常值检测系列,其中还包括关于 FPOF、计数异常值检测器、距离度量学习、共享最近邻和兴奋剂的文章。这还包括我书《Python 中的异常值检测》的另一段摘录。PCA 背后的想法是大多数数据集在某些列中的方差比其他列大得多,并且特征之间也存在相关性。其中一个含义是:为了表示数据,通常不需要使用尽可能多的特征;我们通常可以使用更少的特征(有时要少得多)很好地近似数据。例如,对于包含 100 个特征的数值数据表,我们可

高斯朴素贝叶斯解释:初学者的带有代码示例的可视化指南

Gaussian Naive Bayes, Explained: A Visual Guide with Code Examples for Beginners

分类算法钟形假设以获得更好的预测⛳️ 更多分类算法,解释:· 虚拟分类器 · K 最近邻分类器 · 伯努利朴素贝叶斯 ▶ 高斯朴素贝叶斯 · 决策树分类器 · 逻辑回归 · 支持向量分类器 · 多层感知器(即将推出!)基于我们之前关于处理二进制数据的伯努利朴素贝叶斯的文章,我们现在探索用于连续数据的高斯朴素贝叶斯。与二元方法不同,该算法假设每个特征都服从正态(高斯)分布。在这里,我们将看到高斯朴素贝叶斯如何处理连续的钟形数据(产生准确的预测),而无需深入研究贝叶斯定理的复杂数学。所有视觉效果:作者使用 Canva Pro 创建。针对移动设备进行了优化;在桌面上可能显得过大。定义与其他朴素贝叶斯

并非所有 HNSW 指数都是平等的

Not All HNSW Indices Are Made Equaly

并非所有 HNSW 索引都一样克服主要的 HNSW 挑战以提高 AI 生产工作负载的效率照片由 Talha Riaz 在 Pexels 上拍摄分层可导航小世界 (HNSW) 算法以其在大规模数据搜索中的效率和准确性而闻名,使其成为搜索任务和 AI/LLM 应用程序(如 RAG)的热门选择。但是,设置和维护 HNSW 索引本身也存在一系列挑战。让我们来探索这些挑战,提供一些克服它们的方法,甚至看看我们如何通过解决其中一个问题来一石二鸟。内存消耗由于其嵌入的分层结构,HNSW 的主要挑战之一是其高内存使用率。但很少有人意识到内存问题超出了存储初始索引所需的内存。这是因为,随着 HNSW 索引的修改

链接

Links

没有 CRISPR 的基因编辑?经济学中的 RCT。Claude 和 GTP4o 关于偏差调整的最近邻匹配。工人补偿中阿片类药物处方下降。自 2010 年以来,149 家乡村医院已经关闭。数字健康初创公司在 2024 年第一季度筹集了 11 亿美元。

用于噪声时间序列预测的 FNN-VAE

FNN-VAE for noisy time series forecasting

在这个关于使用假最近邻 (FNN) 损失进行预测的迷你系列的最后一部分中,我们用卷积 VAE 替换了上一篇文章中的 LSTM 自动编码器,从而实现了相同的预测性能,但训练时间明显缩短。此外,我们发现,当底层确定性过程被大量噪声所掩盖时,FNN 正则化会大有帮助。

使用 FNN-LSTM 进行时间序列预测

Time series prediction with FNN-LSTM

在最近的一篇文章中,我们展示了如何使用由假最近邻 (FNN) 损失正则化的 LSTM 自动编码器来重建非线性混沌动态系统的吸引子。在这里,我们探讨了同样的技术如何帮助进行预测。与容量相当的“原始 LSTM”相比,FNN-LSTM 可以提高一组非常不同的真实世界数据集的性能,尤其是对于多步预测中的初始步骤。