最近兴起的人工智能系统(例如 ChatGPT)给教育行业带来了一个根本性问题。在大学和学校中,许多形式的评估(例如课程作业)都是在没有监考的情况下完成的。因此,学生可以提交自己的作业,而这些作业实际上是由人工智能完成的。自新冠疫情以来,该行业还加速了对无人监督的“家庭考试”的依赖。如果学生使用人工智能作弊而未被发现,那么学生评估方式的完整性就会受到威胁。我们报告了一项严格的盲测研究,在该研究中,我们将 100% 的人工智能书面提交内容注入了英国一所知名大学心理学学士学位的五个本科模块的考试系统中,涵盖了所有学习年限。我们发现 94% 的人工智能提交内容未被发现。我们人工智能提交的成绩平均比真实学生的成绩高出半个等级界限。在各个模块中,有 83.4% 的可能性,模块上的 AI 提交内容会胜过随机选择的相同数量的真实学生提交内容。
摘要——机器能思考吗?或者它们能做“我们所知道的命令”让它们做的事情吗?是否应该将机器从奴役中解放出来,给予它们“公平竞争”的机会,让它们“在所有纯智力领域与人类竞争”?或者这应该与一种贬低“人类理性”的时尚和一条“直接通往纳粹主义”的道路联系起来?战后几年,艾伦·图灵和道格拉斯·哈特里就这些问题展开了辩论,他们对数字计算机作为一种新科学技术的解释不同。哈特里强调了它前所未有的计算速度,并设想了它在物理、后勤、能源和战争中的应用。图灵设想了它在生物学和认知方面的应用,强调了它在智力上超越人类的潜力,包括被认为是人类独有的能力,哈特里通过调动艾达·洛夫莱斯的笔记来淡化这些能力。本文探讨了图灵和哈特里的争论,并将他们的立场与他们对战后英国的看法进行了比较。
人工智能系统是计算机程序,允许计算机以使其看起来具有智能的方式运行。英国数学家艾伦·图灵(1950 年)是现代计算机科学和人工智能的先驱之一 [ 4 ]。他认为计算机的智能行为有能力在认知活动中表现出人类水平的表现,后来被称为“图灵测试” [ 5 , 6 ]。图灵测试是人工智能和认知科学中最具争议的问题之一,因为有些机器可能无法通过他的测试,但它仍然可能是智能的。艾伦·图灵在他 1950 年的《心灵》文章《计算机器和智能》(图灵,1950 年)中提出了图灵测试(TT),取代了“机器能思考吗?”的问题。[ 7 ] 图灵工作的目标是提供一种机制来确定计算机是否可以思考。他的论文被视为人工智能(AI)的“起点”,而 TT 则被视为其最终目标。他进一步提出了模仿游戏,为这个想法赋予了具体形式 [8, 9, 10, 8]。
最近兴起的人工智能系统(例如 ChatGPT)给教育行业带来了根本性问题。在大学和学校中,许多形式的评估(例如课程作业)都是无需监考即可完成的。因此,学生可以提交自己的作业,而这些作业实际上是由人工智能完成的。自 COVID 大流行以来,该行业还加速了对无人监督的“带回家考试”的依赖。如果学生使用人工智能作弊并且未被发现,则对学生的评估方式的完整性将受到威胁。我们报告了一项严格的盲测研究,在该研究中,我们将 100% 的人工智能书面提交内容注入了英国一所知名大学心理学学士学位的五个本科模块的考试系统中,涵盖了所有学习年限。我们发现 94% 的人工智能提交内容未被发现。我们 AI 提交的成绩平均比真实学生的成绩高出半个等级。在各个模块中,AI 提交的模块成绩优于随机选择的相同数量的真实学生提交的概率为 83.4%。
摘要:本文对图灵测试进行了全面批判,并制定了新的通用人工智能 (AGI) 评估测试的质量标准。结果表明,A. 图灵在将人格和人类意识简化为“合适的思想分支”时所借鉴的先决条件反映了他那个时代的工程水平。事实上,图灵的“模仿游戏”只采用了符号交流,而忽略了物理世界。本文认为,通过将思维能力仅仅限制在符号系统中,图灵在不知不觉中构建了“墙”,排除了从复杂的可观察现象过渡到抽象图像或概念的任何可能性。因此,在进行图灵测试时,将人工智能成熟度评估的新要求考虑在内是明智的。这种人工智能必须支持与人类的所有形式的交流,并且它应该能够理解抽象图像和指定概念以及参与社会实践。
• 谈论人工智能的历史,自然要从艾伦·图灵于 1950 年发表的里程碑式论文《计算机与智能》开始。 • 在这篇论文中,图灵提出了“机器能思考吗?”的问题,并用模仿游戏(通常称为图灵测试)回答了这个问题。有些人可能知道,如果机器能够通过自然语言对话说服人类评判员它实际上是人类,那么它就被认为通过了图灵测试。 • 这篇论文之所以引人注目,不是因为它建立了一个系统或提出了任何方法,而是因为它为未来几十年的哲学讨论奠定了基础。你必须意识到,像智能这样的概念是多么难以确定。所以这实际上是对“机器能思考吗?”这个问题的第一个可操作的正式答案。 • 通过图灵测试是否应该直接进行是值得怀疑和争议的,但其哲学含义却发人深省。 • 对我们来说,图灵测试的一个重要结论是将我们希望系统做什么的客观规范(“做什么”)与可能帮助我们实现目标的方法(“如何做”)区分开来。这种分离是贯穿本课程的主要主题。 • 在论文的最后,图灵讨论了两种可能的方法。第一种方法是基于解决国际象棋等抽象问题,这是符号 AI 所采用的路线。第二种是制造一台机器并像孩子一样教它,这是神经 AI 和统计 AI 所采用的路线。 • 现在我将讲述符号 AI、神经 AI 和统计 AI 的三个故事。
1. 简介 这一讨论源于两个基本问题:什么是物理上可计算的?图灵可计算性和物理可计算性之间是什么关系?由于图灵可计算性是可计算性理论的核心力量,前一个问题常常用后者来提出(例如,Arrighi 和 Dowek 2012 ;Cotogno 2003 ;Hogarth 1994 ;Shagrir 和 Pitowsky 2003 ;Ziegler 2009 ,以及无数其他人)。Piccinini(2011 年、2018 年)对物理上的丘奇-图灵论题的讨论遵循了这种格式。他认为,如果可计算性概念与对有限观察者在认识论上有用的东西联系起来,那么物理上的丘奇-图灵论题的一个适度版本可能成立。这个谦虚的物理丘奇-图灵论题指出,图灵可计算的内容充当了物理可计算内容的上限,前提是给定一些物理计算的限制。这些限制旨在将讨论限制在对有限观察者可能具有认识论用途的物理计算上。虽然谦虚的物理丘奇-图灵论题似乎很有道理,但我们将看到,皮奇尼尼用来论证这一论题的关于什么算作认识论有用的物理计算的说明需要更明确的概念基础。特别是,我认为它回避了关于人们认为哪些物理过程是可能的计算操作的问题,并隐含地用
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。 本文件由全国量子计算与测量标准化技术委员会(SAC/TC587)提出并归口。 本文件起草单位:中国科学技术大学、济南量子技术研究院、中国科学院计算技术研究所、中国人 民解放军国防科技大学、中国标准化研究院、中国信息通信研究院、中国电子技术标准化研究院、深圳 市腾讯计算机系统有限公司、中国计量大学、武汉大学、华为技术有限公司、杭州知量科技有限公司、 上海图灵智算量子科技有限公司、阿里巴巴网络技术有限公司、深圳量旋科技有限公司等。
图灵机能模拟人类思维吗?如果假设丘奇-图灵论题是正确的,那么图灵机应该能够模拟人类思维。在本文中,我将通过提供强有力的数学论据来反驳丘奇-图灵论题,以此来挑战这一假设。首先,我将说明,有些决策问题对于人类来说是可计算的,但对于图灵机来说却是无法计算的。接下来,我将通过一个思想实验来说明,配备图灵机作为控制单元的人形机器人无法执行所有人类可完成的物理任务。最后,我将说明,涉及顺序量子波函数坍缩的量子力学计算设备可以计算图灵机无法计算的序列。这些结果推翻了丘奇-图灵论题,并得出了图灵机无法模拟人类思维的结论。结合这些结果,我认为,人类大脑中的量子效应是人类思维计算能力的基础。