学生们创建了一种算法来查找新闻中总统的名字

人文专家和程序员团队在俄罗斯唯一的语言黑客马拉松 LinguaHack 上创建了 IT 项目。获奖者开发了一种算法,可以在新闻文本中识别俄罗斯城市的名称、地区、地区和国家其他主体的总统和行政首长的姓名。

来源:Robogeek新闻频道(关于机器人技术的俄罗斯与世界新闻)

人文专家和程序员团队在俄罗斯唯一的语言黑客马拉松 LinguaHack 上创建了 IT 项目。获奖者开发了一种算法,可以在新闻文本中识别俄罗斯城市的名称、地区、地区和国家其他主体的总统和行政首长的姓名。

TSU 和 TUSUR 学生的五支队伍参加了 LinguaHack。在三天的时间里,他们解决了从新闻中提取指定信息、自动将文本分类为正面和负面以及创建聊天机器人来优化呼叫中心的案例。这些任务由黑客马拉松合作伙伴——塔斯社、MTS 和咨询公司 Perfect Art 提供。

NoName 获胜团队解决了在文本中识别俄罗斯城市名称、该国各实体总统和政府首脑姓名的问题。学生 Anfisa Sborshchikova 和 Victoria Shilova (FYA)、Ekaterina Atamasova (MMF)、Alexander Raushkin (TUSUR) 创建了包含所有必修科目列表的库以及分析它们是否出现在新闻文本中的算法。他们还提出了区分城市名称和名字或姓氏的规则,例如弗拉基米尔-弗拉基米尔。该程序将有助于新闻聚合商和媒体分析该地区当前的政治议程。

“我们的老师建议参加黑客马拉松。案例的主题是提前知道的,我们决定从文本中提取实体,”外国语学院的学生 Anfisa Sborshchikova 说。 – 当他们给我们案例本身时,我们认为这很容易做到。但当你开始深入挖掘时,你会发现一切并不是那么简单,每个类别中都有很多例外和特征,毕竟俄语非常丰富。解决这一切非常有趣。”

Perfect Art公司邀请了获得第二名的Pocket Coders团队继续合作进行文本分类项目,并授予他们特殊的文凭。