ii) 自然语言处理 (NLP):为了实现对所有语言和模态的准确语言理解,NLP 的研究需要在几个方向上取得进展。覆盖更多语言和模态取决于带注释的文本和口语数据资源的可用性。必须利用领域自适应,更一般地说,弱监督、多任务、多语言和迁移学习来推广到更多领域或类型。多模态语言处理是另一种提高鲁棒性的方法,它将输入信号与多媒体文档中的互补线索相结合。对话语、对话、文本和文档的更深入分析需要解决越来越复杂的语言现象,并将未指定的语义表示与大规模符号知识库或现实世界中的物理动作和感知联系起来。尤其是,对话代理需要分析问答和辩论中的长距离上下文,并处理社交非语言信号。此类系统还必须被赋予价值观和道德规范。这项研究在 LIMSI 尤为活跃。