对Snowflake的文档AI

或,我们如何使人手动检查10,000张流感射击文档。对雪花的文档AI的无偏见,首先出现在数据科学方面。

来源:走向数据科学

作为数据,我们对表格数据感到满意…

表格数据。作者的图像。

我们还可以处理单词,JSON,XML饲料和猫的图片。但是,一个装满这样的东西的纸板箱呢?

(Annie Spratt的图像,Unsplash)
Unplash

此收据上的信息非常希望在某个地方的表格数据库中。如果我们能扫描所有这些,将它们通过LLM运行并将结果保存在表中,那不是很好吗?

对我们来说幸运的是,我们生活在AI文件时代。 Document AI将OCR与LLMS结合在一起,使我们能够在纸世界和数字数据库世界之间建造桥梁。

文档AI

所有主要的云供应商都有这样的版本…

在这里,我将分享我对Snowflake的文档AI的想法。除了在工作中使用雪花之外,我与雪花无关。他们没有委托我写这篇文章,我也不是任何大使计划的一部分。所有这些都是说我可以对Snowflake的文档AI进行公正的评论。

雪花 公正 雪花的文件AI

什么是文档AI?

文档AI允许用户快速从数字文档中提取信息。当我们说“文档”时,我们的意思是用文字图片。 不要将其与利基Nosql的东西混淆。

niche nosql东西

产品结合了OCR和LLM型号,以便用户可以一次创建一组提示并执行这些提示。

雪花的文档AI(擦洗)简历。作者的图像。

llms和OCR都有错误的空间。 Snowflake通过(1)将他们的头撞到OCR上,直到它锋利为止 - 我见到您,雪花开发人员 - (2)让我对LLM进行微调。

微调雪花llm比某些崎to的户外冒险更像是宽松的。我查看20多个文档,点击“火车模型”按钮,然后冲洗并重复直到表现令人满意。我什至是数据科学家了吗?

闪光

为什么重要?

该产品很酷,原因有几个。

我们的用例 - 带来流感季节:

IntelyCare far 确定 那个