将数据解锁到AI平台:多模式分析的生成AI

直接集成了AI驱动的SQL运算符,并支持对对象存储中使用诸如ObjectRef之类的机制中的任意文件引用,代表了我们与数据交互方式的基本变化。

来源:KDnuggets

赞助内容

传统数据平台长期以来在表格数据上的结构化查询中表现出色 - 想到“上个季度西部地区销售了多少个单位?”这个基本的关系基础是强大的。但是,随着多模式数据(例如图像,音频,非结构化文本)的日益增长和重要性,通过依靠传统的外部机器学习管道来回答细微的语义问题已成为一个重要的瓶颈。

考虑一个常见的电子商务方案:“确定与客户照片相关的高回报率的电子产品,显示到达时损坏的迹象。”从历史上看,这意味着将SQL用于结构化产品数据,将图像发送到单独的ML管道进行分析,并最终尝试结合不同的结果。多步,耗时的过程,其中AI基本上螺栓固定在数据流上,而不是本质地集成在分析环境中。

想象解决此任务 - 将结构化数据与从非结构化视觉媒体获得的见解相结合 - 使用单个优雅的SQL语句。通过将生成AI直接集成到现代数据平台的核心中,可以通过这种飞跃。它引入了一个新时代,可以通过熟悉的SQL进行复杂的多模式分析。

让我们探讨生成AI从根本上重塑数据平台,并允许从业者提供具有SQL多功能性的多模式见解。

关系代数符合生成ai

传统数据仓库从关系代数的基础中得出了权力。这为查询结构化的表格数据提供了数学定义且一致的框架,并在定义明确的情况下出色。

要充分欣赏这种演变,让我们首先探索能够实现这些功能的建筑组件。

动作中的生成AI

ai.generate ai.generate_table

非结构化文本分析

多模式分析

ObjectRef 手册 “作为output_schema) ); customer_reviews 不是 ai.if