过去几十年的技术革命可谓意义非凡,计算机和互联网是这场变革的先锋。计算机自 20 世纪中叶就已出现,但直到 20 世纪 90 年代才开始为大众所接受。随着个人计算机的兴起,人们不仅可以用它们进行数据处理,互联网也随之兴起。这一发展带来了前所未有的连接和信息共享,此后,这种连接和共享呈指数级增长。技术革命最重要的影响之一是搜索引擎的发展。20 世纪 90 年代末和 21 世纪初搜索引擎的发展让公众和专家既兴奋又担忧。虽然搜索引擎使人们能够以前所未有的轻松方式访问大量信息,但人们也担心隐私、安全和在线信息的准确性。1
本文探讨了基于主动推理和自由能原理开发人类可解释的人工智能 (AI) 系统的前景。我们首先简要概述主动推理,特别是它如何应用于决策、内省以及显性和隐性行为的生成。然后,我们讨论如何利用主动推理来设计可解释的 AI 系统,即通过允许我们建模“内省”过程的核心特征并生成有用的、人类可解释的决策过程模型。我们提出了一种使用主动推理的可解释 AI 系统架构。该架构突出了显式分层生成模型的作用,该模型的运行使 AI 系统能够跟踪和解释影响其自身决策的因素,其结构设计为可由人类用户解释和审核。我们概述了这种架构如何整合各种信息来源,以可审计的方式做出明智的决策,模仿或再现类似人类的意识和内省。最后,我们讨论了我们的研究结果对未来人工智能研究的影响,以及开发具有(出现)内省能力的人工智能系统的潜在伦理考虑。
简介γνῶθισεαυτόν:知道自己。这个著名的格言刻在德尔菲的阿波罗神庙的正音调上,我们将注意力引起了人们对人脑的非凡能力的关注:使我们意识到我们意识的最前沿的能力,而不仅仅是来自外部世界的感官信息,而且是我们内在的心理生活的各个方面。的确,智人智人的特征是我们有意识地有意识。弗拉基米尔·纳博科夫(Vladimir Nabokov)是一位才华横溢的画家,弗拉基米尔·纳博科夫(Vladimir Nabokov)在强烈的看法中抒情地总结了这镜子的迷人思考,看似转向了自己:意识到意识到自己……如果我不仅知道我是我,而且还知道我知道我,那我就属于人类。所有其余的都随之而来 - 思想的荣耀,诗歌,对统一的愿景。在这方面,猿和人之间的差距大于变形虫和猿之间的差距。意识如何工作?可以将其简化为大脑的操作吗?其神经生物学机制是什么?长期以来,这些问题被认为是认知心理学和神经科学的领域。意识被认为是不必要的术语。约翰·布罗德斯·沃森(John Broadus Watson)有力地拒绝了心理学科学的内省和意识,他在1913年在他的1913年宣言中概述了行为主义者的观点:心理学作为行为主义者认为这是自然科学的纯粹客观经验。其理论目标是对行为的预测和控制。内省没有其方法的重要组成部分,其数据的科学价值也不取决于他们在意识方面的准备就绪。尽管认知科学拒绝了行为主义,但反感染的观点留下了持久的标记。在认知革命(大约1960年至1990年)中,几乎没有提到意识,甚至没有研究(除了一些主要例外,例如Bisiach,Luzzatti和Perani,1979年;弗里斯(Frith),1979年; Libet,Alberts,Wright和Feinstein,1967年;马塞尔(Marcel),1983年; Posner,Snyder,Balota和Marsh,1975/2004; Shallice,1972年; Weiskrantz,1986)。