Machine Learning's Most Useful Multitool: Embeddings
嵌入是机器学习中最通用的技术之一,也是每个 ML 工程师工具箱中都应该拥有的关键工具。遗憾的是,我们中很少有人了解它们是什么以及它们有什么用处!问题可能在于嵌入听起来有点抽象和深奥:在机器学习中,嵌入是一种将数据表示为 n 维空间中的点的方式,以便相似的数据点聚集在一起。听起来无聊又不起眼?不要被愚弄。因为一旦您了解了这个 ML 多功能工具,您将能够构建从搜索引擎到推荐系统再到聊天机器人等所有内容。此外,您不必是具有 ML 专业知识的数据科学家即可使用它们,也不需要庞大的标记数据集。我是否已经说服您这些坏家伙有多棒了?🤞很好。让我们开始吧。在这篇文章中,我们将探索:什么是嵌入?它们有什么用?在
BanditPAM: Almost Linear-Time k-medoids Clustering via Multi-Armed Bandits
TL;DR想要比 \(k\)-means 更好的东西吗?我们最先进的 NeurIPS \(k\)-medoids 算法 BanditPAM 现已公开!\(\texttt{pip install banditpam}\),您就可以开始了!与 \(k\)-means 问题一样,\(k\)-medoids 问题是一个聚类问题,我们的目标是将数据集划分为不相交的子集。然而,在 \(k\)-medoids 中,我们要求聚类中心必须是实际数据点,这允许对聚类中心进行更好的解释。\(k\)-medoids 还可以更好地处理任意距离度量,因此如果您使用 \(L_1\) 之类的度量,您的聚类对异常值会更稳健。尽
BanditPAM: Almost Linear-Time k-medoids Clustering via Multi-Armed Bandits
TL;DR想要比 \(k\)-means 更好的东西吗?我们最先进的 NeurIPS \(k\)-medoids 算法 BanditPAM 现已公开!\(\texttt{pip install banditpam}\),您就可以开始了!与 \(k\)-means 问题一样,\(k\)-medoids 问题是一个聚类问题,我们的目标是将数据集划分为不相交的子集。然而,在 \(k\)-medoids 中,我们要求聚类中心必须是实际数据点,这允许对聚类中心进行更好的解释。\(k\)-medoids 还可以更好地处理任意距离度量,因此如果您使用 \(L_1\) 之类的度量,您的聚类可以对异常值更具鲁棒
Air Force releases alternate component fitness score charts
在 7 月宣布这些组成部分后,通过评估来自 23 个基地的约 2,000 名空军人员,收集了超过 9,000 个数据点以确定每个组成部分的点值。
Air Force releases alternate component fitness score charts
在 7 月份宣布这些组成部分后,我们收集了 9,000 多个数据点,通过评估 23 个部队的大约 2,000 名飞行员来确定每个组成部分的分值。
AFMC We Need initiative draws large feedback, widespread support
目前已经完成了4,000多次调查和近7,000次访谈,从而导致30,000多个评论和数据点进行审查。
Time Series Forecasting with Recurrent Neural Networks
在本文中,我们将回顾三种用于提高循环神经网络性能和泛化能力的高级技术。我们将在温度预测问题上演示这三个概念,您可以访问来自安装在建筑物屋顶上的传感器的时间序列数据点。
Новые алгоритмы ИИ смогут ускорить разработку лекарств
人工智能算法可以学习极其准确的信息识别,使它们能够区分照片中的人或屏幕上的医学图像,就像医生一样。但在大多数情况下,这些非凡的能力是基于涉及数千万亿数据点的学习。
Stuff for Healthcare Systems (PHMD2350)
医疗保健费用不足,当吸烟者退出,路透社的医疗保健数据点:医疗错误和不良事件,现代医疗保健特种药物支出增加了26%,早上咨询这篇文章是什么?在这里看。 @Afrakt The Healthcare Systems(PHMD2350)的帖子首先出现在偶然的经济学家中。
我们密切关注马萨诸塞州,因为它在ACA之前就实施了类似ACA的覆盖范围扩展法。天真地认为马萨诸塞州法律会在每个州都会散发出来的原因,但马萨诸塞州至少在可能的领域提供了一个数据点。出于类似的原因,我们应该支付[…]邮政对马里兰州的关注首次出现在偶然的经济学家身上。
Continuous improvement and accountability drive SWCS training development
美国陆军约翰·F·肯尼迪特种作战中心和学校依靠正式流程来保持课程开发步入正轨,并针对预定义的课程要求测量评估和数据点,以衡量其设计的优势和劣势。 。
罗宾·汉森(Robin Hanson)对我的帖子的回应很有趣。他写道,更有可能的是,医学平均在边缘没有用或有害。那是我最好的证据阅读。当我试图说服人们时,我从我们的单一最佳数据点,旧的兰德实验开始,然后人们抱怨它[…]帖子是什么令人信服的证据?首次出现在偶然的经济学家中。