Implementing Neural Networks in TensorFlow (and PyTorch)
构建神经网络的分步代码指南继续阅读 Towards Data Science »
TensorFlow Transform: Ensuring Seamless Data Preparation in Production
利用 TensorFlow Transform 扩展用于生产环境的数据管道照片由 Suzanne D. Williams 在 Unsplash 上拍摄数据预处理是任何机器学习管道的主要步骤之一。Tensorflow Transform 可帮助我们在分布式环境中通过庞大的数据集实现它。在进一步介绍数据转换之前,数据验证是生产管道流程的第一步,这已在我的文章《在生产管道中验证数据:TFX 方式》中介绍过。请阅读本文以更好地理解本文。我已在此演示中使用 Colab,因为配置环境更容易(也更快)。如果您处于探索阶段,我也会推荐 Colab,因为它可以帮助您专注于更重要的事情。ML 管道操作从数据提取和
NLP: Text Summarization and Keyword Extraction on Property Rental Listings — Part 1
NLP:房产租赁清单上的文本摘要和关键字提取 - 第 1 部分文本摘要、NER、主题建模和文本分类等 NLP 技术在租赁清单数据上的实际应用简介自然语言处理 (NLP) 可以显著增强租赁清单描述的分析和可用性。在本练习中,我们将探索文本摘要、命名实体识别 (NER) 和主题建模等 NLP 技术的实际应用,以提取见解并丰富东京 Airbnb 房源数据中的房源描述。使用公开可用的数据和 spaCy 和 SciKit-Learn 等工具,您可以跟着做,重现结果,或将这些技术应用于您自己的文本数据,只需进行最少的调整。代码库可在 GitHub 上找到,您可以 fork 并进行试验。本文演示了如何使用各
Is LLM Performance Predetermined by Their Genetic Code?
探索系统发育算法来预测大型语言模型的未来继续阅读 Towards Data Science »
Creative Canvas: Using AI to Paint, Edit, and Stylize Images
我探索了商业和开源照片编辑系统,以创造性地使用 AI 图像转换继续阅读 Towards Data Science »
How Many Cars Are in This Aerial Imagery? Let’s Count Them with YOLOv8 from Scratch!
从 A 到 Z 的分步指南,用于在自定义数据库上部署 YOLOv8 进行对象检测和计数。继续阅读 Towards Data Science »
Master This Data Science Skill and You Will Land a Job In Big Tech— Part I
我从与科技行业最优秀的人合作中学到的实验基础知识继续阅读 Towards Data Science »
Understanding and Implementing Medprompt
深入研究提示框架背后的细节Medprompt 策略各个组成部分的说明(图片取自 Medprompt 论文 [1] (https://arxiv.org/abs/2311.16452) 中的图 6)在我的第一篇博客文章中,我探讨了提示及其在大型语言模型 (LLM) 中的重要性。提示对于从 LLM 获得高质量的输出至关重要,因为它可以指导模型的响应并确保它们与手头的任务相关。在此基础上,尝试使用 LLM 解决用例时经常会出现两个关键问题:仅使用提示可以将性能提升到多远,以及何时您会咬紧牙关并决定微调模型可能更有效?在做出利用提示的设计决策时,需要考虑几个因素。像小样本提示和思路链 (CoT) [2
A Weekend AI Project: Object Detection with YOLO on PC and Raspberry Pi
在不同的硬件上运行最新的 YOLO v10 模型继续阅读 Towards Data Science »
Testing the Field Capabilities of the Unitree Go-1
宣传视频很棒,但将机器狗带到野外到底是什么感觉?继续阅读 Towards Data Science »
AI Training Simplified: The Essential Mathematics Explained
作者提供的图片人工智能训练中使用的数学逻辑的图解概述了解事物的工作原理总是有益的。在本文中,我将对训练人工智能模型中使用的基本数学逻辑进行非常简单的概述。我保证,如果您受过基础教育,以下示例将是可以理解的,并且您将对人工智能领域有更好的了解。创建用于销售预测的人工智能假设我们想要创建一个新的人工智能模型来预测公司的销售收入。我们有过去两个月的销售收入、广告费用和产品价格的数据。作者提供的图片换句话说,我们想要创建一个模型,告诉我们我们的销售收入如何取决于我们产品的价格和广告费用。例如,使用这样的工具,营销专家可以计算如果他们在广告上花费 50 欧元并将产品价格设定为 6 欧元,预期的销售收入。
Do you suffer from being an artist? You may be entitled to compensation
深入探讨人工智能、版权和“合理使用”的真正含义等当代问题。继续阅读 Towards Data Science »
LLM Alignment: Reward-Based vs Reward-Free Methods
LLM 对齐的优化方法上下文语言模型已经展示了根据用户提供的提示生成各种引人注目的文本的非凡能力。然而,定义什么是“好”文本具有挑战性,因为它通常取决于个人偏好和具体背景。例如,在讲故事时,创造力是关键;在制作信息内容时,准确性和可靠性至关重要;而在生成代码时,确保它正确运行至关重要。因此出现了“LLM 对齐问题”,它指的是确保大型语言模型 (LLM) 的行为方式符合人类价值观、意图和偏好的挑战。设计一个损失函数来捕捉我们在文本中重视的各种品质——比如创造力、准确性或可执行性——是非常复杂且通常不切实际的。像这样的概念是不可区分的,因此不能反向传播,也不能用简单的下一个标记生成来训练。想象一下
Principal Components Analysis (PCA) Through a Latent Variable Lens
概述 PPCA(经典 PCA 的扩展)及其通过 EM 算法应用于不完整数据照片由 Dhruv Weaver 在 Unsplash 上拍摄。随着 EM 算法的 E 和 M 步骤重复,该算法收敛到局部最大似然估计量。概率主成分分析 (PPCA) 是一种降维技术,利用潜在变量框架恢复数据中最大方差的方向。当噪声遵循各向同性高斯分布时,概率主成分将与经典主成分紧密相关,在缩放因子和正交旋转方面相同。因此,PPCA 可用于许多与经典 PCA 相同的应用,例如数据可视化和特征提取。PPCA 背后的潜在变量框架还提供了经典 PCA 所不具备的功能。例如,PPCA 可以轻松扩展以适应具有缺失值的数据,而经典
Time Series Forecasting in the Age of GenAI: Make Gradient Boosting Behaves like LLMs
使用标准机器学习模型应用零样本预测继续阅读 Towards Data Science »
Dealing with Cognitive Dissonance, the AI Way
语言模型如何处理其提示中的冲突指令?继续阅读 Towards Data Science »