所表达的观点纯粹是作者的观点,在任何情况下都不被视为陈述欧洲委员会的正式立场。我们感谢在欧洲委员会举行的41 ST国际预测,大数据和经济预测研讨会,在法国Banque de France举行的实时数据分析,方法和应用程序会议,拉脱维亚银行和BELGIUM的国民银行银行以及许多评论员的评论,这使得许多评论的人都在法国Banque de France举行的实时数据分析,方法和应用程序会议。,我们非常感谢欧洲委员会支持,鼓励和刺激环境的高级研究中心,同时从事Bignomics项目。作者感谢Susan Wang对主题建模任务的支持。电子邮件:luca.barbaglia@ec.europa.eu,sergio.consoli@ec.europa.eu和sebastiano.manzan@baruch.cuny.edu。
近年来,文本数据生产的增加意味着研究人员需要更快的文本分析技术和软件,以可靠地为科学 - 繁殖社区提供知识。自动文本数据分析为一个新的研究领域开放,结合了定性研究的典型分析深度以及定量研究所需的测量的稳定性。多亏了统计–Com推荐方法,它建议研究以自然语言生成的或多或少广泛的书面文本,以揭示词汇和语言世界,并为研究人员提取有用的有意义的信息。本文旨在提供此方法的概述,迄今为止,在护理社区中很少使用。- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Keywords Qualitative research • Automatic textual analysis • Multimethod approach • Multidimensional qualitative method • Rigour
我们使用机器学习技术对文本数据进行分析,以识别金融危机。危机的爆发和持续时间对实际经济活动有影响,因此可以成为宏观审慎、货币和财政政策的宝贵投入。学术文献和政策领域主要依靠专家判断来确定危机,而且往往存在滞后。因此,危机持续时间和脆弱性的积累阶段通常只能事后才能确定。虽然我们可以使用传统的计量经济学技术和现成的市场数据在不同程度上识别和预测全球部分危机,但我们发现文本数据有助于减少此类模型样本外测试中的假阳性和假阴性,尤其是当危机被认为更为严重时。建立一个跨国家、实时一致的框架可以使世界各地的政策制定者受益,尤其是当不同政府政策需要国际协调时。JEL 分类:C53;C55;G01 关键词:金融危机;机器学习;自然语言处理