详细内容或原文请订阅后点击阅览
无需使用 AWS Lambda 即可加速 Amazon SageMaker Ground Truth 中的自定义标签工作流程
Amazon SageMaker Ground Truth 支持创建高质量、大规模的训练数据集,这对于在包括大型语言模型 (LLM) 和生成式 AI 在内的各种应用程序中进行微调至关重要。通过将人工注释者与机器学习相结合,SageMaker Ground Truth 显着降低了数据标记所需的成本和时间。无论是注释图像、视频还是 […]
来源:亚马逊云科技 _机器学习Amazon Sagemaker地面真相可以创建高质量的大规模培训数据集,对于跨广泛的应用程序进行微调至关重要,包括大语言模型(LLMS)和Generative AI。通过将人类注释与机器学习相结合,萨格人地面真相大大减少了数据标记所需的成本和时间。无论是注释图像,视频还是文本,SageMaker地面真相都可以使您能够在大规模维持人类的监督和反馈的同时构建准确的数据集。这种人类的循环方法对于将基础模型与人类偏好保持一致,增强了他们执行根据您的特定要求量身定制任务的能力。
Amazon Sagemaker地面真相为了满足各种标签需求,萨格人地面真相为图像分类,对象检测和语义细分等常见任务提供了内置的工作流。此外,它提供了创建自定义工作流程的灵活性,使您能够为专门的数据标记任务设计自己的UI模板,并根据您的独特要求量身定制。
以前,设置一个自定义标签作业,指定两个AWS lambda函数:一个预通量函数,该功能在将每个数据集对象发送给工人之前在每个数据集对象上运行,并在每个数据集对象的注释上运行一个通量后的函数,并在每个数据集对象的注释上运行,并合并多个工人的注释。尽管这些功能提供了有价值的自定义功能,但它们也为不需要其他数据操纵的用户增加了复杂性。在这些情况下,您将必须编写仅返回输入不变的功能,而开发工作不断增加,并且在将lambda函数与UI模板和输入清单文件集成时会产生错误的可能性。
aws lambda createlabelingjob api解决方案概述
当您省略自定义标签作业中的lambda函数时,工作流程简化:
无预通道功能来源
source-ref
“源”