摘要——人工智能在金融领域的应用越来越依赖于负责任的人工智能原则。这些原则——可解释性、公平性、隐私性、责任性、透明度和健全性构成了未来人工智能系统信任的基础。在本研究中,我们通过为深度神经网络提供解释来解决第一个原则,该网络在数字、分类和文本输入的混合上进行训练,用于金融交易分类。解释是通过 (1) 使用 Shapley 加性解释 (SHAP) 进行特征重要性分析和 (2) 文本聚类和决策树分类器的混合方法实现的。然后,我们通过将模型暴露于有针对性的逃避攻击来测试模型的稳健性,利用我们通过提取的解释获得的有关模型的知识。