Mei, Xie, Yuan & Jackson (2023)。图灵测试:人工智能聊天机器人的行为与人类相似吗? (SSRN 学术论文 4637354)。https://doi.org/10.2139/ssrn.4637354
2024 年 6 月 8 日 — 第一批聊天机器人(最著名的是 Eliza,由 Joseph Weizenbaum 于 1966 年发明)能够尝试图灵测试。基本的模式匹配技术...
作者:A Burke · 2020 年 · 被引用 11 次 — 英国国防科学技术实验室 (Dstl) 和国家网络安全中心 (NCSC) 委托艾伦图灵研究所 (Turing) 定义...
大约四十年前(1980 年),美国哲学家约翰·塞尔在他的论文《思想、大脑和程序》(Searle:1980)中发表了他对他所谓的强人工智能(人工智能)论题的著名驳斥,塞尔声称“经过适当编程的计算机确实具有认知状态,程序因此可以解释人类认知”(Searle:1980,417)。正如他所写,塞尔的论文的直接收件人是 R. Shank 和 R. Abelson 的研究(Shank,Abelson:1977,248),他们的作者声称他们设法创建了一个能够理解人类故事含义的计算机程序。例如,关于一个故事:“一个人去一家餐馆点了一个汉堡包;当汉堡包送来时发现它被烧焦了,这个人愤愤不平地离开了餐馆,没有付钱。”问题是:“他吃了汉堡包吗?”“适当”编程的计算机回答很可能没有。在他的文章中,Searle 既没有分析 Shank 和 Abelson 使用的测试计算机的程序,也没有分析他们程序的运行原理。他提出了一个问题,当计算机没有相应的视觉、嗅觉和味觉体验时,是否可能谈论理解,因为计算机无法知道“汉堡包”、“烧焦”等词的含义。正如 Searle 所相信的,Shank 和 Abelson 进行的人工智能研究遵循了 A. Turing 众所周知的测试范式,根据该测试,计算机对“人类答案”的令人满意的模仿与人的合理答案相似。在图灵测试中,扮演专家角色的人以硬拷贝格式提出问题,并以同样的方式从两个他看不见的对话者那里得到答案,其中一个是人,另一个是专门编程的计算机。根据图灵的说法,令人满意地通过测试的标准是,专家在五分钟的调查后,在不超过 70% 的情况下识别出计算机(图灵:1950,441),图灵认为这可以相信计算机具有思考能力。
人工智能简介在《计算机与智能》1中,图灵在论证机器无法通过图灵测试时,揭露了一些常见的谬误。特别是,他解释了为什么“询问者只需向他们提出一些算术问题,就可以区分机器和人类”,因为“机器会因为其致命的准确性而被揭穿”这一信念是错误的。事实上,机器“不会试图给出算术问题的正确答案。它会故意引入错误,以混淆询问者。”因此,机器会通过给出错误的答案,或者简单地说它无法计算答案来隐藏其超人的能力。人工智能在某些任务上取得了超越人类的表现,例如算术或游戏;在本文中,我们认为有时人工智能的能力可能需要受到人为的限制。这种刻意的限制被称为人工智能愚蠢。通过限制人工智能完成任务的能力,以更好地匹配人类的能力,人工智能可以变得更安全,即其能力不会超过人类能力几个数量级。这里的总体趋势是,人工智能在达到人类水平后,往往会迅速达到超越人类的表现水平。例如,对于围棋游戏,在几个月内,最先进的水平从强大的业余选手,到弱小的专业选手,再到超越人类的表现。从那时起,为了让人工智能通过图灵测试,或者让它的行为像人类一样,人工智能设计师必须刻意限制它的能力。
• 20 世纪 50 年代:阿兰·图灵发表了“图灵测试”,对计算机和机器智能进行测试,以确定这种智能是否与人类智能难以区分;“人工智能”一词首次被提出 • 20 世纪 80 年代:“深度学习”技术得到开发,使计算机能够从错误中学习并做出独立决策 • 20 世纪 90 年代:人工智能进入日常生活(Roomba、语音识别软件);深蓝击败人类国际象棋冠军 • 21 世纪 20 年代:常用人工智能激增:虚拟助手、搜索引擎;深度学习和大数据的出现 • 2020 年:OpenAI 推出 GPT,它使用深度学习创建几乎与人类创建的内容难以区分的内容
一个 — — 也许很肤浅 — — 原因是通过研究如何使用量子力学系统进行计算来满足我们的好奇心,并挑战自己找到比经典算法更快的算法。研究量子计算也可能揭示出处理信息的新方法的深刻见解。例如,它可以为我们提供以安全方式处理数据的想法(尽管这些笔记中没有讨论量子密码学)。更好地理解量子计算可能导致理解自然的计算极限:这个世界上可以计算什么?用经典计算机可以计算什么?例如,由于经典计算和量子计算研究的相互作用,许多新的经典算法已经被发明(即量子机器学习算法的反量化、吉布斯采样的新经典算法、量子电路的经典模拟等)。这反过来又提高了我们对物理学的理解,并最终提高了对世界本身的理解。研究量子算法的最后一个原因(计算机科学家肯定能理解)是量子计算机对扩展的丘奇-图灵论题构成了重大挑战,该论题指出,任何“合理”的计算模型都可以在概率图灵机上有效模拟。然而,有很多物理过程我们不知道如何在传统计算机上有效模拟,但我们有有效的量子算法!这有力地证明了强丘奇-图灵论题可能是错误的!
艾伦图灵研究所的公共政策项目于 2018 年 5 月成立,旨在开发研究、工具和技术,帮助政府利用数据密集型技术进行创新并改善人们的生活质量。我们与政策制定者一起探索数据科学和人工智能如何为公共政策提供信息并改善公共服务的提供。我们认为,只有将道德和安全考虑放在首位,政府才能从这些技术中获益。请注意,本入门指南是一份动态文档,将随着用户、受影响的利益相关者和相关方的意见而不断发展和改进。我们需要您的参与。请通过 policy@turing.ac.uk 与我们分享反馈。这项研究部分由 ESRC(ES/T007354/1)的资助和使图灵公共政策项目成为可能的公共基金资助。https://www.turing.ac.uk/research/research-programmes/public-policy
图灵测试是一种看似简单的方法,用于确定机器是否能够表现出人类智能:如果机器可以与人类进行对话而不会被检测出是机器,则它已经表现出人类智能。
13:30-14:20 北野宏明,系统生物学研究所所长,冲绳科学技术研究生院教授,山口大学医学院客座教授 “诺贝尔图灵挑战赛:打造科学发现的引擎”