走向数据科学领域信息情报检索---XiaoMi-AI

2024年7月3日 18:56

AutoML 与 AutoGluon：仅用四行代码即可转变您的 ML 工作流程

AutoML with AutoGluon: Transform Your ML Workflow with Just Four Lines of Code

AutoML 与 AutoGluon：仅用四行代码实现的 ML 工作流AutoGluon 如何主导 Kaggle 竞赛以及您如何击败它。用四行代码击败 99% 数据科学家的算法。由 DALL-E 生成的图像在两项热门的 Kaggle 竞赛中，AutoGluon 仅在对原始数据进行 4 小时的训练后就击败了 99% 的参赛数据科学家（AutoGluon 团队。“AutoGluon：用于文本、图像和表格数据的 AutoML。” 2020）这句话摘自 AutoGluon 研究论文，完美地概括了我们今天将要探索的内容：一个以最少的编码提供令人印象深刻的性能的机器学习框架。您只需要四行代码即可设置完整的

2024年7月3日 18:48

实践中的协作 AI 代理综合指南

A Comprehensive Guide to Collaborative AI Agents in Practice

定义，并组建一支代理团队来完善您的简历和求职信以用于工作申请继续阅读 Towards Data Science »

2024年7月3日 15:46

如何挑战自己的分析，以免他人质疑

How to challenge your own analysis so others won’t

掌握健全性检查的艺术，以提高您的工作质量作者图片您是否曾经创建过分析，却被经理驳斥？或者您是否曾在演示过程中遇到一个问题，让您想“我为什么不事先检查一下？”有时，您可能会觉得经理和高管有一种不可思议的能力，可以找到您工作中的一个弱点。他们是如何如此迅速地发现问题的，尤其是当他们第一次看到你的工作时？任何人都可以学到一种看似超能力的东西，这篇文章将向你展示如何做到这一点。通过定期对你的工作进行“健全性检查”，你可以主动识别薄弱环节，并确保结果在与更广泛的受众分享之前是合理的。我将介绍：什么是健全性检查以及它们为何重要健全性检查与大多数人检查其工作的方式有何不同如何进行健全性检查如何使用健全性检查

2024年7月3日 06:07

并非所有 HNSW 指数都是平等的

Not All HNSW Indices Are Made Equaly

并非所有 HNSW 索引都一样克服主要的 HNSW 挑战以提高 AI 生产工作负载的效率照片由 Talha Riaz 在 Pexels 上拍摄分层可导航小世界 (HNSW) 算法以其在大规模数据搜索中的效率和准确性而闻名，使其成为搜索任务和 AI/LLM 应用程序（如 RAG）的热门选择。但是，设置和维护 HNSW 索引本身也存在一系列挑战。让我们来探索这些挑战，提供一些克服它们的方法，甚至看看我们如何通过解决其中一个问题来一石二鸟。内存消耗由于其嵌入的分层结构，HNSW 的主要挑战之一是其高内存使用率。但很少有人意识到内存问题超出了存储初始索引所需的内存。这是因为，随着 HNSW 索引的修改

2024年7月3日 03:53

风险背后的数学 - 第 2 部分

The Math Behind Risk — Part 2

风险背后的数学 — 第 2 部分在世界征服游戏中，进攻方真的有优势吗？在第 1 部分中，我们讨论了世界征服游戏 Risk 中进攻方和防守方的相对机会。在第 1 部分的结尾，我们得出结论，进攻方赢得第一名士兵战斗的几率为 47.15%，我们想知道著名的征服者是如何在这些条件下取得成就的。我们将第二名士兵的讨论留到第 2 部分。照片由 Terry Vlisidis 在 Unsplash 上拍摄为了唤醒我们的记忆，在 Risk 中，进攻方最多掷 3 个骰子，而防守方最多掷 2 个骰子。比较两者的最高掷骰结果，失败者失去一名士兵，如果平局，防守方获胜。接下来，比较两者的第二高掷骰结果，再次，失败者失去

2024年7月3日 03:43

环保型 AI：如何减少 ML 模型的碳和水足迹

Eco-Friendly AI: How to Reduce the Carbon and Water Footprints of Your ML Models

模型训练和服务的可持续实践继续阅读 Towards Data Science »