在过去的几年中,新的人工智能(AI)应用程序称为“生成AI”已变得有用和流行。这些AI模型因其从文本提示中获得文本,图像和视频的能力而闻名。生成模型是机器学习模型(特别是基于变压器的深神经网络),对数据进行了培训,以学习关键模式和关系,并生成具有相似特征的输出。常见应用程序涉及用户以自然语言输入提示以生成外数。其中包括来自大语言模型(LLM)的文本输出,包括Openai's Chatgpt,Anthropic的Claude,Google的Bard,Microsoft的Copilot和Meta的Llama,以及Open AI的Dall-E,稳定的稳定扩散和Midjourney的图像输出。这些新的生成AI应用程序提出了许多原始内容提供商的版权问题。具体来说,这些疑虑考虑了在培训数据中使用受复制保护内容的使用。一个关键问题是,在版权法中,是否使用这种拷贝性保护的材料在培训中使用公平使用规定,或者必须在版权所有者许可的许可下获得许可。AI提供者认为,这种许可将非常昂贵,尤其是考虑到可能涉及的交易成本。内容提供者认为,如果没有这样的保护,他们将因其内容创建而获得不足的回报。生成AI模型的另一个方面使这些版权问题复杂化。换句话说,示例与纯复制不同。在2023年的诉讼中,《纽约时报》指控Openai未经许可在培训其GPT LLMS的情况下使用其拷贝性保护的内容。它已要求法院采取措施,以防止培训其内容和/或法定损害损害的模型的可用性。《纽约时报》的证据表明,在某些提示的情况下,Chatgpt和Bingchat(许可Openai的GPT)都可以从《纽约时报》中逐字复制文章。图像生成模型中类似的提示可以产生伦敦拥有的字符和数字资产的相似性(Marcus and Southen,2024)。Openai回应说,他们没有故意在时间上训练自己的模型,而是这些例子是“反流”的证据。 1这种情况,由于某些文本在公共站点上可用,因此大型AI模型可以从统计上复制该文本(T'Anzer等,2021)。2,如果可以使用AI模型重现原始内容,则此“泄漏”可能会对
集体展示厅邀请观众在迅速变化的世界中定义我们的社区意识的不断发展的景观。“我们很高兴在今年的迈阿密艺术周上揭露“影响力的空间:在现代世界中塑造社区”,”艾伦·菲纳(Alan Faena)说。“这个雄心勃勃的展览汇集了塞巴斯蒂安·埃尔祖里斯(Sebastian Errazuriz)对技术,设计和社区的开创性探索,这证明了Faena Art致力于拥护当今最重要的创意思维。与他一起,我们很荣幸展示当地艺术家凯利·布雷兹(Kelly Breez)的作品,她以她充满活力和真实的致敬迈阿密独特的社交结构吸引了我们。我们也很自豪能够与Digital Artist Beeple的reefline合作,这是一项重要的雕塑,突出了气候变化的威胁。总的来说,他们的装置是一种引人入胜的镜头,我们可以通过它来探索和庆祝现代世界中社区不断发展的动态。”于12月5日开放,今年的迈阿密艺术周节目的核心将是艺术家,设计师和激进主义者塞巴斯蒂安·埃尔祖里兹(Sebastian Errazuriz)的新委托和巨大的迷宫装置(b。1977年,智利圣地亚哥)位于Faena Beach。 使用流行的人工智能(AI)平台Midjourney和Dalle2设计的,这是一个被覆盖的迷宫迷宫:Maze:通过算法自我邀请访客探索其错综复杂的途径。 开创性的装置邀请游客反思AI越来越多地塑造世界的方式,以及随后对“ IRL”人类和社区互动的紧迫性。1977年,智利圣地亚哥)位于Faena Beach。使用流行的人工智能(AI)平台Midjourney和Dalle2设计的,这是一个被覆盖的迷宫迷宫:Maze:通过算法自我邀请访客探索其错综复杂的途径。开创性的装置邀请游客反思AI越来越多地塑造世界的方式,以及随后对“ IRL”人类和社区互动的紧迫性。Erraruiz敦促观众考虑社区互动将帮助人类驾驶AI带来的道德复杂性和潜在偏见的方式,以确保技术为人类服务,而不是相反。同时,Errazuriz将释放一本名为AI迷宫的新书,可以通过迷宫中的QR码访问。本书深入研究了AI对当代生活的各个方面的变革性影响,从教育和医疗保健到经济和战争。AI迷宫的每一页都具有独特的QR码,鼓励读者参与度,并就AI的社会含义收集了众包观点。Errazuriz的目标是双重的:通过迷宫来逃脱自我发现,并为我们快速数字化的世界建立一个公共平台。“这是第一个旨在迷失的迷宫,而是找到自己,”艺术家Sebastian Errazuriz说。“一个小的绿洲,可以暂时逃脱,断开并重新连接重要的东西。在社会即将面临的技术和环境挑战上进行对话的地方。公共装置将与一本书《 AI迷宫》的发行并行开幕,该书AI迷宫可以帮助社会想象我们未来与人工智能互动。公共艺术装置和书籍将伴随一系列有关AI的小组演讲,并在创意产业中进行了变革性的作用。”此外,Errazuriz的新大理石雕塑(标题为企业国家之战)将于2023年12月5日至2024年3月30日在Faena Hotel大教堂举行。居民将进化和这项作品在史诗般的斗争中幽默地铸造了Tech Moguls Elon Musk,Mark Zuckerberg和Jeff Bezos,让人联想到像Michelangelo这样早期意大利文艺复兴时期艺术家所描绘的大神话斗争。同样在Faena Cathedral中也将是数字艺术家蜂鸣器的开创性雕塑S.2122(2023)的艺术家证明,由Faena Art与Reefline合作提出。动力学雕塑涵盖了区块链技术,数字视频和三维雕塑形式,可提供有关气候变化的科幻启发的冥想,以及我们在想象中的未来中的位置。这项工作描绘了将来的一个腐烂的建筑物综合体,随着催眠无人机圆形的头顶逐渐被埋在水下。为提高人们对气候变化和海平面上升的认识,蜂鸣声将每五年提高工作中的水位,直到建筑物被完全淹没为止。“很像礁石,它桥接了与艺术的海洋保护领域一样,我计划了S.2122的演变:每5年,这个虚拟生态系统内的水位将增加四分之一,导致整个结构在25年内被吞噬。
从 2025 年底开始出版 兴趣表达截止日期:2025 年 1 月 1 日 论文提交截止日期:2025 年 7 月 1 日 2022 年 11 月 30 日,OpenAI 推出了 ChatGPT,这是一个由大型语言模型驱动的类人聊天机器人,可以理解和生成人类语言。ChatGPT 几乎立即走红,引发了全球范围内的爆炸式增长。在发布后的前五天内,超过 100 万人使用了 ChatGPT,仅两个月后就有超过 1 亿用户注册。除了 ChatGPT,还有其他自然语言处理聊天机器人目前可供公众使用,包括 Gemini、Copilot 和 Claude。人工智能图像生成器,例如 Midjourney 和 DALL-E 3,可以创建从超现实主义到超现实主义的图像,并且可以提示模仿特定艺术家的风格。同样,像 Sora 和 Suno 这样的视频和音乐生成器可以创建如此逼真的内容,以至于数百万人相信它是真实的。 Research Rabbit 和 Jenni AI 等 AI 工具可以协助学术研究和写作,生成研究综合、摘要和释义,并提供自动写作反馈等。尽管人工智能几十年来一直是我们日常生活的一部分,但自 2022 年以来,生成人工智能 (GenAI) 应用程序的公开可用已经动摇了整个社会和教育领域的实践、惯例、原则、信念和基本概念。一些 GenAI 应用程序通常是付费的,专门针对教师(例如 SchoolAI teach 和德国平台 To-teach 和 Fobizz)。这些 GenAI 应用程序可用于创建个人(差异化)任务、信息文本、工作表、课程计划和教学单元。因此,它们提出了关于教育工作者对教师职业和角色以及教学本身的理解的重要问题。教育工作者和教育机构以各种方式回应了 GenAI。一些人采取了技术乐观的立场,并提倡将 GenAI 整合为改变教学和学习历史的一种手段。技术乐观主义教育家们讨论了将 GenAI 融入教学实践的方法,例如为书面作业创建大纲、参与聊天机器人与模拟历史人物的对话,或与聊天机器人进行历史辩论。他们认为,GenAI 可以让学生与先进的、具有情境感知能力的人工智能系统互动,增强批判性思维,提供探索复杂问题的工具
* Paul Gilbert和Riccardo Tremolada是Cleary Gottlieb Steen&Hamilton LLP的律师。本文中表达的观点是个人的,不归因于公司或其客户。所有错误,遗漏和观点都是作者自己的。1 See Regulation 2024/1689 of the European Parliament and of the Council of 13 June 2024 laying down harmonised rules on artificial intelligence and amending Regulations 300/2008, 167/2013, 168/2013, 2018/858, 2018/1139 and 2019/2144 and Directives 2014/90/EU, 2016/797 and 2020/1828 (人工智能法),PE/24/2024/REV/1 OJ L,2024/1689,2024年7月12日,Refitals 99和105。2,例如,AI改善了财务预测和股票市场的预测。 它还为语音识别,流媒体平台上的建议系统提供动力,智能停车系统和个性化的购物建议。 3 FMS是深度学习模型,经过对非结构化的,未标记的数据训练,可用于开箱即用的多种任务或通过微调适应特定任务。 参见P. Lorenz,K。Perset和J. Berryhill,“生成人工智能的初步政策注意事项” 2023 OECD Publishing,No. 1,经合组织人工智能论文,巴黎第6页。 4根据Openai当时的Openai首席执行官Greg Brockman的说法。 5 T. Oeyen和Y. Yargici,“未知领域:生成AI,合并控制和Microsoft-Open AI Saga”,档案,人工智能和反果实,同意2-2024,第18页。 6参见,例如,E。Mollick,“ Chatgpt是AI的转折点”,《哈佛商业评论》(2022年12月14日)。2,例如,AI改善了财务预测和股票市场的预测。它还为语音识别,流媒体平台上的建议系统提供动力,智能停车系统和个性化的购物建议。3 FMS是深度学习模型,经过对非结构化的,未标记的数据训练,可用于开箱即用的多种任务或通过微调适应特定任务。参见P. Lorenz,K。Perset和J. Berryhill,“生成人工智能的初步政策注意事项” 2023 OECD Publishing,No.1,经合组织人工智能论文,巴黎第6页。4根据Openai当时的Openai首席执行官Greg Brockman的说法。5 T. Oeyen和Y. Yargici,“未知领域:生成AI,合并控制和Microsoft-Open AI Saga”,档案,人工智能和反果实,同意2-2024,第18页。6参见,例如,E。Mollick,“ Chatgpt是AI的转折点”,《哈佛商业评论》(2022年12月14日)。7公司活跃在Genai领域中,例如,例如Aleph Alpha,Bloom(拥抱面),Claude(Anthropic),Cohere,Gemini和Gemma和Gemma(Google),拐点AI,Llama(Meta),各种版本的Mistral AI,Midjourney,Midjourney,sentability AI和Titan(titan)和Titan(Amazon)。8 See M. Heikkilä, “AI is at an inflection point, Fei-Fei Li says”, MIT Technology Review , 14 November 2023, available at: https://www.technologyreview.com/2023/11/14 /1083352/ai-is-at-an-inflection-point-fei-fei-li-says/ .9 Polaris, “Generative AI Market Share, Size, Trends, Industry Analysis Report, By Component (Software and Services); By Technology; By End-Use; By Region; Segment Forecast, 2023—2032”, 2023, available at: https://www.polarismarketresearch.com/industry-analysis/generativeai-market .10实际上,经济的每个部门都将从Genai中受益。Genai已经在整个经济体中许多部门都在改变商业实践和生产力。它在科学研究中也越来越有价值,从而实现了扩展科学家能力的复杂模型。参见,例如,Z.另请参见J. Seo等人,“避免使用深度增强学习的融合等离子体撕裂的不稳定性”,626自然,746-751(2024)。高盛在2023年进行的研究估计,Genai工具有可能在未来10年内向GDP增加7%,这相当于大约7万亿美元。11参见McKinsey,“生成AI的经济潜力:下一个生产力边界”,2023年,第24页,可在以下网址获得:https://www.mckinsey.com/~/~/~/mmedia/mckinsey/mckinsey/business %20functions/mckinsey%20digital/our%20insights/the%20economic%20potential%20of%20generative%20ai%20the%20next%20productivity%20frontier/the-economic -potential-of-generative-ai-the-next-productivity-frontier.pdf .参见高盛(Goldman Sachs),“生成AI可以将全球GDP提高7%”,2023年4月5日,网址为:https://www.goldmansachs.com/insights/Articles/generative-generative-generative-could-could-raise-glaise-global-global-global-gdp-by-7-percent.html。12 Genai行业应被理解为“ Genai模型的价值链”,其中可能包括以下市场:筹码制造,云基础设施的提供,数据许可,特定类型的AI劳动力的供应,生产力的供应,生产力的供应,供应特定的CHATBOT服务,特定手机助理服务的供应,供应特定的手机数字助理服务等。请参阅欧洲委员会,“生成AI和虚拟世界中的竞争”,竞争政策简介第3/2024号,网址:https://competition-policy.ec.europa.europa.euu/document/document/download/c86d461f-062e--062e--062e--4dde-4dde-4dde-a662-1522222222856ca。13虽然竞争执法在维护竞争性的Genai市场中的作用很重要,但应注意的是,与这些技术有关的市场动态和竞争的发展方式很容易受到许多其他因素的影响,包括对与竞争不同的政策方面的监管,例如AI安全,数据和版权法。请参阅欧洲委员会,“生成AI和虚拟世界中的竞争”,竞争政策简介第3/2024号,网址:https://competition-policy.ec.europa.europa.euu/document/document/download/c86d461f-062e--062e--062e--4dde-4dde-4dde-a662-1522222222856ca。
简介 生成式人工智能 (AI) 工具已发展到可以生成越来越逼真、越来越难以与人类知识产权区分的内容的地步。其中一些工具 1 可以有效地生成各种类型的文本(例如 ChatGPT、Jasper、GPT、Google 的 Bard、Bing AI)、计算机代码(例如 GitHub Copilot)、方程式(例如 Wolfram)、带有参考文献的科学论文(例如 Elicit)或图像(例如 DALL-E、Midjourney、Stable Diffusion)。虽然目前有许多不同的生成式 AI 模型在运行,但 ChatGPT 在全球范围内获得了最多的关注,因为它可以免费向公众开放,具有简单、用户友好的界面,并且能够解释自然语言提示并根据已训练的预测模型生成独特的响应。ChatGPT 等生成式 AI 工具的输出质量和有效性可能有很大差异,具体取决于给出的提示和算法的训练方式。 ChatGPT 偶尔会生成听起来令人信服但包含事实错误和虚构信息 2 的文本(例如,不存在的参考文献、虚构的定义等)(Arya,2023 年)。此外,生成的文本通常是公式化的(温莎大学,2023 年)。随着模型的训练和获得更多不同的数据集,这种情况会越来越好。截至 2023 年 3 月,ChatGPT 可以访问训练数据以外的信息,包括访问互联网的能力(它已经集成到 Bing 搜索引擎中)、具有新的插件功能,并可以运行它编写的代码(Blain,2023 年;Hachman,2023 年)。微软宣布将很快将 ChatGPT 集成到其 Word、PowerPoint 和 Outlook 等 Office 应用程序中(Borup,2023 年)。尽管如此,重要的是要知道 ChatGPT“不会创造高级知识或整体概念;相反,它只是根据概率猜测下一个单词应该是什么,就像电子邮件客户端中现在很常见的自动完成功能一样”(Arya,2023 年)。 对教育的影响 这些最新的人工智能发展为高等教育机构提供了机遇和挑战。一方面,它们可能为教学创新、重新思考现有的教学和评估实践、创建定制的学习活动以及为学生和教师节省时间提供机会(Terwiesch & Mollick,2023 年)。此外,生成式人工智能工具迫使我们考虑它们对就业市场的影响,我们的毕业生需要哪些类型的技能和能力,以便他们为就业做好准备并保持竞争力,并重新审视课程和学位/项目层面的教学目标和学习成果(Arya,2023 年)。另一方面,生成式人工智能工具引起了与学术诚信标准相关的合理担忧和焦虑,因为生成式人工智能工具创建的作品可能更难检测,而使用检测工具并不是一个可行的策略。大学课程和学位深深植根于学生培养精确写作和批判性思维技能。如果不谨慎对待人工智能的诱惑,可能会削弱学生的写作和批判性思考能力。随着生成式人工智能工具的不断发展,关于它们对教育影响的讨论仍在继续。然而,在加拿大的背景下,许多教育工作者同意,与其试图禁止
扩散概率模型 扩散概率模型是一类潜在变量模型,常用于图像生成等各种任务(Ho 等人,2020 年)。正式而言,扩散概率模型通过对数据点在潜在空间中扩散的方式进行建模来捕获图像数据,这是受统计物理学启发的。具体来说,它们通常使用经过变分推理训练的马尔可夫链,然后逆转扩散过程以生成自然图像。一个值得注意的变体是稳定扩散(Rombach 等人,2022 年)。扩散概率模型也用于 DALL-E 和 Midjourney 等商业系统。生成对抗网络 GAN 是一类具有自定义对抗学习目标的神经网络架构(Goodfellow 等人,2014 年)。GAN 由两个以零和博弈形式相互竞争的神经网络组成,从而生成特定分布的样本。正式来说,第一个网络 G 称为生成器,用于生成候选样本。第二个网络 D 称为鉴别器,用于评估候选样本来自期望分布的可能性。得益于对抗性学习目标,生成器学习从潜在空间映射到感兴趣的数据分布,而鉴别器则将生成器生成的候选样本与真实数据分布区分开来(见图 2)。(大型) 语言模型 (大型) 语言模型 (LLM) 是指用于建模和生成文本数据的神经网络,通常结合了三个特征。首先,语言模型使用大规模、顺序神经网络(例如,具有注意力机制的 Transformer)。其次,神经网络通过自我监督进行预训练,其中辅助任务旨在学习自然语言的表示而不存在过度拟合的风险(例如,下一个单词预测)。第三,预训练利用大规模文本数据集(例如,维基百科,甚至多语言数据集)。最终,语言模型可以由从业者使用针对特定任务(例如,问答、自然语言生成)的自定义数据集进行微调。最近,语言模型已经发展成为所谓的 LLM,它结合了数十亿个参数。大规模 LLM 的突出例子是 BERT(Devlin 等人,2018 年)和 GPT-3(Brown 等人,2020 年),分别具有 ∼ 3.4 亿和 ∼ 1750 亿个参数。提示是语言模型的特定输入(例如,“这部电影很精彩。从人类反馈中进行强化学习 RLHF 从人类反馈中学习顺序任务(例如聊天对话)。与传统强化学习不同,RLHF 直接从人类反馈中训练所谓的奖励模型,然后将该模型用作奖励函数来优化策略,该策略通过数据高效且稳健的算法进行优化(Ziegler 等人,2019 年)。RLHF 用于 ChatGPT(OpenAI,2022 年)等对话系统,用于生成聊天消息,以便新答案适应之前的聊天对话并确保答案符合预定义的人类偏好(例如长度、风格、适当性)。提示学习 提示学习是一种 LLM 方法,它使用存储在语言模型中的知识来完成下游任务(Liu 等人,2023 年)。一般而言,提示学习不需要对语言模型进行任何微调,这使其高效且灵活。情绪:“),然后选择最可能的输出 s ∈{“positive”,“negative”} 而不是空间。最近的进展允许更复杂的数据驱动提示工程,例如通过强化学习调整提示(Liu et al.,2023)。seq2seq 术语序列到序列(seq2seq)是指将输入序列映射到输出序列的机器学习方法(Sutskever et al.,2014)。一个例子是基于机器学习的不同语言之间的翻译。此类 seq2seq 方法由两个主要组件组成:编码器将序列中的每个元素(例如,文本中的每个单词)转换为包含元素及其上下文的相应隐藏向量。解码器反转该过程,将向量转换为输出元素(例如,来自新语言的单词),同时考虑先前的输出以对语言中的模型依赖关系进行建模。seq2seq 模型的思想已得到扩展,以允许多模态映射,例如文本到图像或文本到语音的映射。Transformer Transformer 是一种深度学习架构(Vaswani 等,2017),它采用自注意力机制,对输入数据的每个部分的重要性进行不同的加权。与循环神经网络 (RNN) 一样,Transformer 旨在处理顺序输入数据(例如自然语言),可用于翻译和文本摘要等任务。但是,与 RNN 不同,Transformer 会一次性处理整个输入。注意力机制为输入序列中的任何位置提供上下文。最终,Transformer(或一般的 RNN)的输出是文档嵌入,它呈现文本(或其他输入)序列的低维表示,其中相似的文本位于更近的位置,这通常有利于下游任务,因为这允许捕获语义和含义 (Siebers et al., 2022)。变分自动编码器 变分自动编码器 (VAE) 是一种神经网络,它被训练来学习输入数据的低维表示,方法是将输入数据编码到压缩的潜在变量空间中,然后从该压缩表示中重建原始数据。VAE 与传统自动编码器的不同之处在于,它使用概率方法进行编码和解码过程,这使它们能够捕获数据中的底层结构和变化,并从学习到的潜在空间中生成新的数据样本 (Kingma and Welling, 2013)。这使得它们不仅可用于异常检测和数据压缩等任务,还可用于图像和文本生成。零样本学习/小样本学习 零样本学习和小样本学习是指机器学习处理数据稀缺问题的不同范例。零样本学习是指教会机器如何从数据中学习一项任务,而无需访问数据本身,而小样本学习是指只有少数特定示例的情况。零样本学习和小样本学习在实践中通常是可取的,因为它们降低了建立 AI 系统的成本。LLM 是小样本或零样本学习器(Brown 等人,2020 年),因为它们只需要一些样本即可学习一项任务(例如,预测评论的情绪),这使得 LLM 作为通用工具具有高度灵活性。
在当今快节奏的世界中,人工智能已成为一个广泛讨论的话题,它已从科幻小说中的概念转变为影响我们日常生活的现实。人们对人工智能及其将想象力融入日常生活的能力着迷。本文旨在探讨人工智能的概念、发展历程、各种类型的人工智能、训练模型、优势以及其多样化应用的案例。人工智能是指开发能够执行需要人类智能的任务的计算机系统。它通过机器学习、自然语言处理、计算机视觉和机器人技术等技术,帮助处理大量数据、识别模式并根据收集的信息做出决策。人工智能涵盖学习、推理、感知、解决问题、数据分析和语言理解等能力。人工智能的最终目标是创造出能够模拟人类能力并以更高的效率和精度执行各种任务的机器。人工智能领域有可能彻底改变我们日常生活的各个方面,例如虚拟个人助理、自动驾驶汽车、医疗诊断和治疗、推荐系统和欺诈检测。人工智能已融入众多行业和日常生活,展现出其多样化的应用。Siri、Google Assistant 和 Amazon Alexa 等虚拟个人助理利用人工智能进行自然语言处理和机器学习,从而提供更精准的响应。自动驾驶汽车使用人工智能算法分析传感数据,并进行实时驾驶决策。医疗保健专业人员利用 IBM Watson for Health 和 Google DeepMind 等平台,将人工智能算法应用于医疗诊断和治疗。Netflix、Amazon 和 Spotify 等在线平台利用人工智能根据用户行为和偏好提供个性化推荐。金融机构利用人工智能通过分析数据的算法实时检测欺诈活动。人工智能 (AI) 是一个复杂的决策过程,在某些领域超越了人类的能力。人工智能机器的一个关键特性是重复学习,这使它们能够从现实生活中的事件中学习并与人类互动。这种学习过程被称为机器学习,是人工智能的一个子领域。由于缺乏准确性和热情,人类难以完成重复性任务。相比之下,人工智能系统在其任务中表现出卓越的准确性。人工智能在医疗保健、零售、制造和银行等各个领域都有广泛的应用。人工智能主要分为两类:弱人工智能(Narrow AI)和强人工智能(General AI)。弱人工智能是指专为特定任务或特定范围的任务而设计的人工智能系统。这些系统在其指定领域表现出色,但缺乏广泛的认知能力。其特征包括专业化能力、应用范围有限以及缺乏意识。狭义人工智能的例子包括虚拟个人助理、推荐系统、图像识别软件、聊天机器人和自动驾驶汽车。而广义人工智能则旨在全面模拟人类智能,包括推理、解决问题、学习和适应新情况的能力。广义人工智能的特征包括类似人类的认知能力、适应性以及在各种任务和领域中概括知识的能力。目前,狭义人工智能是人工智能最常用的形式,广泛应用于各行各业。狭义人工智能的例子包括Siri和Alexa等虚拟个人助理、推荐系统、图像识别软件、聊天机器人和自动驾驶汽车。随着研究人员不断突破人工智能的界限,他们提出了不同级别的人工智能能力。广义人工智能就是这样一个概念,它被认为具有自我意识、意识和主观体验。然而,达到这一水平仍然是一个理论挑战。广义人工智能的发展仍是一个持续研究的领域。另一个极端是超级人工智能,也称为人工智能超级智能 (ASI)。这种类型的人工智能几乎在各个方面都超越了人类智能,并对社会和人类的未来产生重大影响。超级人工智能的特点包括认知优势、快速学习和适应能力,这些特点可以推动各个领域的快速发展。超级人工智能的发展也引发了人们对其潜在社会影响的担忧,包括与控制相关的风险、与人类价值观的契合度以及对人类生存的威胁。尽管目前还处于理论阶段,但研究人员正在积极探索其发展带来的影响和挑战。相比之下,反应式机器是最基本的人工智能类型,纯粹是反应式的。它们不会形成记忆,也不会利用过去的经验来做出决策。例如,IBM 的“深蓝”国际象棋超级计算机在 1997 年击败了国际象棋大师加里·卡斯帕罗夫。这些机器可以感知世界并采取行动,而无需存储任何记忆。而记忆有限的机器可以回顾过去,并根据观察结果做出决策。一个常见的例子是自动驾驶汽车,它会观察其他车辆的速度和方向,并相应地进行调整。这需要在特定时间内监控车辆的驾驶情况。这些信息不会存储在机器的经验库中。基于心智理论的机器可以理解人类的信念、情绪、期望等,并做出情绪化的反应。索菲亚就是这类人工智能的典型例子,尽管该领域的研究仍在进行中。换句话说,先进的机器正在被开发,它们对世界及其实体(包括人类和动物)有着更深入的理解。这些机器将能够回答简单的“假设”问题,并具备同理心,从而更好地理解他人的观点。更重要的飞跃是创造出具有自我意识的机器,它们能够意识到自身身份并预测他人的感受。这种智能水平将代表人工智能研究的重大突破。人工智能 (AI) 的工作原理是通过算法、计算能力和来自各种来源的数据来利用海量数据。该过程包括收集相关数据,对其进行预处理以确保其清洁度和结构化,根据任务需求选择合适的算法,使用标记或未标记数据训练模型,评估其性能,并将其部署到生产环境中执行实际任务。人工智能功能广泛而多样,涵盖各种随时间推移进行调整和改进的技术。这使得模型能够通过持续学习在动态环境中保持相关性和准确性。在线学习、迁移学习和强化学习等技术有助于从经验和反馈中获取新知识。在推理过程中,经过训练的人工智能模型会运用其学习到的模式和表征,对新数据进行预测或决策。此过程包括将输入数据输入模型,并根据模型的内部工作原理获得输出预测或分类。人工智能系统依靠数据、算法和计算能力从经验中学习、做出决策并自主执行任务。人工智能系统的具体功能取决于其架构、算法以及其设计目标任务的性质。人工智能的应用领域广泛,已被广泛应用于医疗保健、金融、零售、制造、交通运输、教育、市场营销、游戏、安全和自然语言处理等各个行业。这些应用包括诊断、患者预后预测、个性化治疗方案、信用评分、欺诈检测、客户服务、需求预测、供应链优化、智能游戏角色、面部识别、入侵检测、机器翻译、情绪分析等等。人工智能的未来很可能涉及机器学习、自然语言处理和计算机视觉的进一步发展,从而为各种应用和行业带来功能日益强大、集成度更高的系统。人工智能的潜在增长领域包括医疗保健、金融、交通、客户服务、刑事司法决策、招聘、教育以及其他涉及道德考虑的敏感领域。人工智能 (AI) 是一种使计算机和机器能够模拟人类学习、解决问题和决策等能力的技术。AI 应用程序和设备可以识别物体、理解人类语言、从新信息中学习,并向用户和专家提供建议。AI 研究的最新焦点是生成式 AI,它可以创建文本、图像和视频等原创内容。生成式 AI 依赖于机器学习 (ML) 和深度学习技术。深度学习彻底改变了机器学习领域,它使算法能够在无需人工干预的情况下从大量未标记数据集中进行预测。这项技术尤其适用于自然语言处理、计算机视觉以及其他需要在海量数据中识别复杂模式和关系的任务。因此,深度学习为我们日常生活中的大多数 AI 应用提供支持。深度学习还支持多种先进技术,包括半监督学习,它结合了监督学习和非监督学习,可以在标记数据和未标记数据上训练模型。此外,自监督学习从非结构化数据中生成隐式标签,而强化学习则通过反复试验和奖励函数进行学习。迁移学习允许将从一个任务或数据集获得的知识应用于另一个相关任务或不同的数据集。生成式人工智能是指能够根据用户的提示或请求创建复杂原始内容(例如文本、图像、视频或音频)的深度学习模型。这些模型对其训练数据的简化表示进行编码,然后从该表示中提取数据以生成与原始数据相似但不完全相同的新作品。生成式人工智能的最新进展促成了复杂的深度学习模型类型的发展,包括变分自编码器 (VAE)、扩散模型和变换器。变换器是许多备受瞩目的生成式人工智能工具的核心,例如 ChatGPT 和 GPT-4、Copilot、BERT、Bard 和 Midjourney。生成式人工智能的运作分为三个阶段:训练、调整和生成。该流程始于基础模型,这是一种深度学习模型,可作为多种不同类型生成式人工智能应用的基础。基础模型可以针对特定任务进行定制,例如文本或图像生成,并且通常基于海量数据进行训练。深度学习算法处理海量非结构化数据(TB级或PB级的文本、图像或视频),并使用基础模型根据提示自主生成内容。这一训练过程计算密集、耗时且成本高昂,需要数千个GPU和数周的处理时间,总计数百万美元。像Meta的Llama-2这样的开源基础模型项目使开发人员能够绕过这一步骤及其成本。为了针对特定的内容生成任务对模型进行微调,开发者可以使用诸如标记数据微调或人工反馈强化学习 (RLHF) 等技术。这需要向模型输入特定于应用的问题或提示以及正确答案。开发者定期评估其生成式 AI 应用的输出,进一步调整模型以提高准确性或相关性。另一种方法是检索增强生成 (RAG),它通过整合训练数据以外的相关来源来扩展基础模型,从而优化参数以提高准确性或相关性。生成式 AI 为各行各业和应用带来了诸多优势,包括重复性任务的自动化、更快地从数据中获取洞察、增强决策能力、减少人为错误、全天候可用以及降低物理风险。AI 可以自动化日常任务,使人类能够专注于创造性工作。它能够做出更快、更准确的预测和可靠的决策,使其成为决策支持或全自动决策的理想选择。AI 通过引导人们完成流程、标记潜在错误以及在无人干预的情况下自动执行任务来减少人为错误,尤其是在医疗保健等精准度至关重要的行业。随着机器学习算法接触更多数据并从经验中学习,其准确性不断提高,错误也随之减少。人工智能始终在线,全天候提供一致的结果。人工智能可以通过使用聊天机器人或虚拟助手来简化客户服务或支持的人员需求。它还可以简化生产流程,保持一致的产出水平,并自动执行那些可能危及人类工人的危险任务。例如,自动驾驶汽车可以降低乘客受伤风险。人工智能的实际应用包括通过聊天机器人改善客户服务、检测欺诈交易、个性化客户体验以及简化招聘流程。此外,人工智能代码生成工具可以加速应用程序开发,而预测性维护模型可以防止设备故障和停机。人工智能的快速应用带来了诸多好处,但也带来了挑战和风险。人工智能系统依赖的数据集可能容易受到篡改、偏见或网络攻击,从而损害其完整性和安全性。为了降低这些风险,组织必须在从开发到部署的整个人工智能生命周期中保护数据完整性。威胁行为者会针对人工智能模型进行盗窃、逆向工程或未经授权的操作,这可能会损害模型的架构、权重或参数。此外,还存在诸如模型漂移、偏差和治理结构崩溃等运营风险。如果不加以解决,这些风险可能会导致系统故障和网络安全漏洞,而威胁行为者可能会利用这些漏洞。为了优先考虑安全和道德,组织必须开发透明、可解释、公平的人工智能系统,包容、稳健、安全且可问责。人工智能伦理是一个多学科领域,旨在优化人工智能的有益影响,同时降低风险。人工智能伦理的原则包括可解释性、公平性和透明性。可解释的人工智能使人类用户能够解读算法产生的结果和输出。公平性和包容性要求在数据收集和模型设计过程中最大限度地减少算法偏差。建立多元化的团队对于创建包容性的人工智能系统至关重要。稳健的人工智能能够处理异常情况而不会造成损害,能够抵御有意和无意的干扰,并防止漏洞。问责制要求对人工智能的开发、部署和结果建立明确的责任和治理结构。与人工智能伦理相关的共同价值观包括可解释性、公平性、包容性、稳健性、安全性、问责制、透明性和责任感。用户必须了解人工智能的开发方式、功能、优势和劣势。提高透明度可以为人工智能模型和服务的创建提供宝贵的见解。确保隐私和合规性至关重要,因为像《通用数据保护条例》(GDPR)这样的监管框架要求组织保护个人信息。这包括保护可能包含敏感数据的人工智能模型,并开发能够适应不断变化的法规的适应性系统。研究人员根据人工智能的复杂程度对其进行了分类:弱人工智能(狭义人工智能)执行特定任务,而强人工智能(通用人工智能,AGI)则具有理解、学习和应用知识处理各种任务的能力,超越人类智能。具有自我意识的人工智能系统的概念仍是一个有争议的话题。人工智能发展的关键里程碑包括:- 1950 年:艾伦·图灵出版了《计算机器与智能》,提出了“机器能思考吗?”的问题,并提出了图灵测试。- 1956 年:约翰·麦卡锡在达特茅斯学院的第一次人工智能会议上提出了“人工智能”一词。- 1967 年:弗兰克·罗森布拉特制造了 Mark 1 感知器,这是一台基于通过反复试验进行学习的神经网络的计算机。- 1980 年:使用反向传播算法的神经网络在人工智能开发中得到广泛应用。 1995年,斯图尔特·罗素和彼得·诺维格出版了《人工智能:一种现代方法》,这是一本关于人工智能的权威教科书,探讨了人工智能的四个潜在目标或定义。大约在同一时期,IBM的“深蓝”国际象棋系统在一场对决中击败了世界冠军加里·卡斯帕罗夫。大数据和云计算时代到来,使企业能够管理用于训练人工智能模型的大型数据资产。21世纪初,人工智能取得了重大进展,包括约翰·麦卡锡在其2004年的论文《什么是人工智能?》中对人工智能的定义。数据科学开始成为一门热门学科,IBM Watson击败了《危险边缘!》冠军肯·詹宁斯和布拉德·鲁特。2015年,百度的 Minwa 超级计算机使用卷积神经网络识别图像的准确率高于人类。同年,在 DeepMind 的 AlphaGo 程序击败世界围棋冠军李索孛后,谷歌以 4 亿美元收购了 DeepMind。2020 年代,大型语言模型 (LLM) 兴起,例如 OpenAI 的 ChatGPT,它们显著提高了人工智能性能和推动企业价值的潜力。生成式人工智能实践使深度学习模型能够在大型数据集上进行预训练。截至 2024 年,人工智能趋势表明它将持续复兴,多模态模型通过结合计算机视觉和 NLP 功能提供更丰富的体验。IBM 强大的人工智能战略:推进值得信赖的人工智能以获得竞争优势一种利用人工智能力量的全面方法,包括创造竞争优势、在整个业务中扩展人工智能以及推进值得信赖的人工智能。