SberDevices 的语言模型已成为世界上理解俄语文本的最佳语言模型

Разработанная SberDevices текстовая модель ruRoberta-large Finetune стала лучшей по пониманию текста в соответствии с оценкой главного русск оязычного бенчмарка для оценки больших текстовых моделей Russian SuperGLUE,уступая по точности только человеку。 SberDevices 的 4 个版本:ruT5-large-finetune、ruBert-largefinetune、ruT5-base-finetune、ruBert-basefinetune。

来源:Robogeek新闻频道(关于机器人技术的俄罗斯与世界新闻)

根据评估大型文本模型 Russian SuperGLUE 的主要俄语基准的评估,SberDevices 开发的 ruRoberta-large Finetune 文本模型成为文本理解方面最好的模型,准确性仅次于人类。前六名中还包括来自 SberDevices 的另外 4 个模型:ruT5-large-finetune、ruBert-largefinetune、ruT5-base-finetune、ruBert-basefinetune。

成功训练 ruBERT 语言模型后,Sberbank 开始开发其更高级的版本 - ruRoBERTa。从架构上来说,这是相同的 BERT,在大型文本语料库上进行训练,仅用于恢复屏蔽标记的任务,在大批量上并使用来自 ruGPT-3 神经网络的 BBPE 标记器。在 Cristofari 超级计算机上训练模型花了三周时间,最终数据集(250 GB 文本)与 ruGPT-3 使用的数据集类似,但英语和部分“肮脏”的 Common Crawl 被从中删除。

俄语排行榜 SuperGLUE(通用语言理解评估)是第一个俄语神经网络评级。排名取决于神经网络在逻辑、常识、目标设定和理解文本含义方面的任务执行情况。这是一个开放项目,所有使用俄语神经网络的数据科学家都可以使用。

俄罗斯 SuperGLUE

对语言的一般理解的评估始于通过一组反映各种语言现象的测试(诊断数据集)进行评级。它反映了该语言的语言现象,并显示了 ruRoberta-large Finetune 模型对其某些特征的理解程度。高速(LiDiRus)表明该模型不仅仅是记忆任务或猜测结果,而是正在学习特征并掌握俄语的各种现象。