摘要:本文介绍了一种新颖的自然语言处理(NLP)模型,作为一种原始的情感分析方法,重点是理解重大灾难或冲突期间的情绪反应。该模型是专门针对克罗地亚人创建的,是基于umigrams的,但可以与任何支持N-gram模型并扩展到多个单词序列的语言一起使用。提出的模型生成的情感分数与离散和维情感模型,可靠性指标以及使用情感数据集的单个单词分数相符,扩展了ENEW和NRC WordMotion Association Lexicon。情感分析模型结合了不同的方法,包括基于词典的机器学习和混合方法。预处理的过程包括翻译,诱饵和数据改进,使用自动翻译服务以及南斯拉夫语言的clarin知识中心(ClassLA)库,并特别强调了变节标记校正和代币化。在最近影响克罗地亚的三个主要自然危机上对提出的模型进行了实验评估。该研究的发现表明,在Covid-19大流行期间,情绪维度发生了显着转变,尤其是降低的价,唤醒和优势,这与两个月的恢复期相对应。此外,2020年克罗地亚地震引起了各种各样的负面离散情绪,包括愤怒,恐惧和悲伤,休养时期的时间比COVID-19。这项研究代表了情感分析的进步,尤其是在语言特定的环境中,并提供了对主要社会事件形成的情感景观的见解。
主要关键词