选择和实施拥抱脸模型

将预先训练好的模型从盒子中取出,用于您的用例照片由 Erda Estremera 在 Unsplash 上拍摄我最近在日常工作中尝试使用 Hugging Face 目录中的模型,从中获得了很多乐趣,我认为这可能是一个很好的时机来分享我所学到的知识,并为读者提供一些如何以最小的压力应用这些模型的提示。我最近的具体任务是查看大量非结构化文本数据(如备忘录、电子邮件、自由文本注释字段等)并根据与业务用例相关的类别对其进行分类。有很多方法可以做到这一点,我一直在尽可能多地探索,包括模式匹配和词典搜索等简单的东西,也扩展到使用预构建的神经网络模型来实现许多不同的功能,我对结果感到相当满意。我认为最好的策略是结合多种技术,以某种形式的集成,以获得最佳选择。我并不相信这些模型能够经常(而且绝对不会持续)正确地处理问题,因此无法单独使用它们,但当它们与更基本的技术相结合时,它们可以增强信号。选择用例对于我来说,正如我所提到的,任务只是获取通常由人类编写的、没有一致格式或架构的文本块,并尝试找出适用于该文本的类别。除了分析方法之外,我还采用了几种不同的方法

来源:走向数据科学

选择和实施拥抱面部模型

将预先训练的型号从包装盒中拔出您的用例

Erda Estremera Unplash

最近,我在日常工作中玩了很多乐趣,最近尝试了《拥抱面孔目录》中的模型,我认为这可能是分享我学到的东西的好时机,并为读者提供一些如何以最小的压力应用这些模型的技巧。

我最近的特定任务涉及查看非结构化文本数据的斑点(想想备忘录,电子邮件,免费文本注释字段等),并根据与业务用例相关的类别进行分类。您可以通过多种方法可以做到这一点,而且我一直在探索尽可能多的事情,包括模式匹配和词典搜索等简单的东西,但也扩展到使用预先构建的神经网络模型来用于多种不同的功能,并且我对结果非常满意。

我认为,最好的策略是以某种形式结合多种技术,以获得最佳选择。我不信任这些模型必须经常正确正确(并且绝对不够始终如一)独自使用它们,但是当与更基本的技术结合使用时,它们可以添加到信号中。

选择用例

对我来说,正如我所提到的,任务只是为了将通常由人类写的文本斑点,没有一致的格式或架构,并试图找出适用于该文本的类别。除了前面提到的分析方法之外,我采取了几种不同的方法,这些方法从非常低的努力到我的更多工作。到目前为止,这是我测试过的三种策略。

  • 要求模型选择类别(零摄像分类 - 我将在本文稍后以示例为例)
  • 使用指定的实体识别模型查找文本中引用的关键对象,并根据该
  • 查找模型

    https://huggingface.co/models 管道 代码示例 https://huggingface.co/models

    管道代码示例