Loading...
机构名称:
¥ 1.0

摘要 本文介绍了在开发最新版本的 Bicleaner(名为 Bicleaner AI)期间进行的实验,该工具旨在检测并行语料库中的噪声句子。该工具现在实现了一个新的神经分类器,使用基于预训练的基于 Transformer 的语言模型的最先进的技术,这些模型在二元分类任务上进行了微调。之后,执行并行语料库过滤,丢弃相互翻译概率较低的句子。我们的实验基于使用 Bicleaner AI 过滤的语料库对两种不同场景的神经机器翻译 (NMT) 进行训练,与之前基于极端随机树实现分类器的工具版本相比,翻译质量有显着提高。

Bicleaner AI

Bicleaner AIPDF文件第1页

Bicleaner AIPDF文件第2页

Bicleaner AIPDF文件第3页

Bicleaner AIPDF文件第4页

Bicleaner AIPDF文件第5页

相关文件推荐

2024 年
¥3.0
2020 年
¥4.0
2024 年
¥1.0
2021 年
¥9.0
2024 年
¥1.0
2021 年
¥1.0
2021 年
¥1.0
2020 年
¥1.0
2022 年
¥1.0
2024 年
¥1.0
2023 年
¥3.0
2024 年
¥1.0
2023 年
¥1.0
2024 年
¥1.0
2023 年
¥2.0
2023 年
¥1.0
2020 年
¥3.0
2024 年
¥1.0
2024 年
¥1.0
2024 年
¥1.0
2023 年
¥1.0
2024 年
¥1.0
2022 年
¥2.0
2021 年
¥1.0
2022 年
¥1.0
2023 年
¥1.0
2021 年
¥1.0
2022 年
¥1.0
2024 年
¥1.0