为什么您的对话式人工智能需要良好的话语数据?

您是否想知道当您说“嘿 Siri”或“Alexa”时,聊天机器人和虚拟助手是如何被唤醒的?这是因为软件中嵌入了文本话语收集或触发词,一旦听到编程的唤醒词就会激活系统。然而,创建声音和话语的整个过程 […]

来源:Shaip 博客

话语并不总是格式良好的

大多数人都有在对话中使用碎片化句子的习惯。在与机器人打交道时,他们希望拥有同样的便利。这就是为什么你不仅应该在训练数据中包含完整的结构化句子,还应该添加错别字、拼写错误和松散的句子。

利用代表性术语和参考

在创建话语时,使用大多数人理解的标准术语和参考。请记住,你不必构建一个使用只有专家才能理解的复杂语言的伟大机器人。相反,专注于制定非常常见且每个人都能轻松理解的话语。

改变短语和术语

许多 AI 训练师经常犯的一个常见错误是他们使用各种句子,但不改变其中的关键词。例如,假设您创建了诸如“电视在哪个房间?”,“电视在哪里?”,“我在哪里可以找到电视?”之类的话语。

所有这些话语中的句子可能会发生变化,但词根“电视”保持不变。因此,您需要确保对输入的所有内容使用变体。因此,您可以使用单词的同义词而不是电视。

每个意图的示例话语

为您计划的每个意图分配了示例话语。大多数 AI 训练平台建议每个意图至少添加 10-15 个话语。幸运的是,大多数开发环境允许您添加话语,创建和测试模型,然后重新访问您的话语。

因此,正确提取实体和正确预测意图的最佳实践是首先添加一些话语,测试它们,然后添加其他输入。

在现实场景中测试和审查

测试,AI 模型对于其完善至关重要。但是,最好针对对项目不太了解的不同人群来测试模型。

结论

联系我们的 Shaip 团队

[另请阅读:对话式 AI 完整指南]