摘要 在当今世界,多语言已成为常态,单语者是少数,学术研究一直未能适应这一现实。这一现象凸显了人类大脑掌握多种语言的能力,无论是母语 (L1)、第二语言 (L2) 还是第三语言 (L3),这要求重新评估传统范式。本研究旨在挑战认知语言学的传统方法,特别是与语言习得、语言选择和潜在的大脑过程相关的方法。研究问题包括:个人如何在不同的认知和社会背景下在多种语言之间导航,这对我们理解人类的认知能力有何影响?所采用的方法结合了使用脑成像、心理语言学测试和多语言使用者的社会语言学调查的实验分析。研究结果表明,双语和多语不仅可以提高认知灵活性,还可以提高多元文化环境中的解决问题的能力和适应能力。总之,本研究表明,多语言能力不仅仅是多种语言系统的习得,而是一种影响认知、社交互动和大脑结构的复杂现象。通过重新定义我们对认知和语言过程的理解,本研究提出了在全球化背景下研究语言的新范式。
视觉 - 语言变压器(VLT)最近显示出巨大的成功,但同时伴随着大量的计算成本,其中主要原因可以归因于大量的视觉和语言令牌。存在用于压缩VLTS的令牌修剪研究主要遵循基于单模式的方案,但忽略了对齐不同模态来指导令牌修剪过程的关键作用,从而导致重要的代币在另一个模态分支中错误地修剪一个模态。同时,现有的VLT修剪作品也缺乏基于不同输入样本动态压缩每一层的灵活性。为此,我们提出了一个名为M Ultodal的新颖框架,用于加速变化VLT的木质制成d ynamic t ynamic t oken p Runing(MADTP)。具体来说,我们首先引入了精心设计的多模式对齐指导(MAG)模块,该模块可以使相同语义概念的特征与不同的模式相结合,以确保修剪的代币对所有模式都不太重要。我们进一步设计了一种新型的dy-namic令牌修剪(DTP)模块,该模块可以根据不同的输入实例自适应地调节每个层中的令牌压缩比。对各种基准测试的广泛实验表明,MADTP可以显着确定多种模型的计算复杂性,同时保留竞争性能。值得注意的是,当将MADTP应用于NLVR2数据集中的BLIP模型时,可以将GFLOPS降低80%,而性能降低少于4%。该代码可在https://github.com/double125/madtp上找到。
解决复杂的,暂时扩展的任务是控制学习(RL)的长期问题。我们假设解决此类问题的一个关键要素是组成性的概念。具有学习概念和子技能的能力,这些概念和子技能可以构成解决更长的任务的能力,即层次RL,我们可以获取时间扩展的行为。但是,为层次RL获取有效但一般的抽象是极具挑战性的。在本文中,我们建议将语言用作抽象,因为它提供了独特的组合结构,实现了快速学习和组合概括,同时保持了极大的灵活性,使其适合各种问题。我们的方法学习了一个遵循指令的低级政策和高级政策,该政策可以在本质上重复跨任务的抽象,从而允许代理人使用结构化语言进行推理。为了研究组成任务学习,我们介绍了使用Mujoco物理引擎和CLEVR引擎构建的开源对象相互作用环境。我们发现,使用我们的方法,代理可以学会求解各种暂时扩展的任务,例如对象排序和多对象重排,包括来自原始像素观测值。我们的分析表明,语言的组成性质对于学习各种亚技能和系统地推广到新的亚技能至关重要,与使用相同监督的非复合抽象相比,语言的构成性质至关重要。2
无缝的人类机器人相互作用(HRI)需要机器人对人类的多模式输入的熟练处理,包括语音,凝视和面部表情,以准确评估人类的影响并相应地提供帮助。同时,机器人必须通过多模态输出渠道清楚地将自己的意图清楚地传达给人类,包括语音,手势和凝视。传统上,在机器人系统中实现此功能通常需要复杂的设计。在意图估计的领域中,以前的研究通常合并意图识别模块,以基于多模式输入[3,17]对人类意图进行分类。一些系统还具有用于检测人类情感状态的专用模块,对于建立社会细微差别的互动至关重要[10,16,18]。但是,这些方法的缺点在于它们耗时且昂贵的培训过程。在输出方面,许多先前的系统集成了情绪状态[8,11]模块,以控制人形输出提示,例如音调,凝视或面部表情,增强了向人类反馈的透明度和生动性。关于运动产生,提出了多种方法,包括预先建立的运动集的混合和图表[19,25],以及使用运动捕获数据[5,9,15]。值得注意的是,这涉及与特定状态相关的每种输出模式的动作手动设计。通过利用文本理解,推理和计划的能力,在短时间内提出了许多机器人应用[7,12,14,20,21,28]。例如,Zhang等人。大型语言模型(LLM)的最新进展,诸如聊天机器人,数据过程和代码生成之类的域中的表现令人印象深刻的功能正在揭示其在机器人技术领域的潜在应用。其中一个通常的例子是“ Saycan”机器人[1],它能够解释人的自然语言命令,分析环境并生成具体的可执行操作序列,以通过使用LLMS来满足人类的要求。但是,机器人和人之间的互动提示仅限于语音命令,即使没有语音输出。最近,一些研究人员还试图将这种技术应用于HRI领域。利用LLM来估计人类有多少信任机器人[30]; Yoshida等人,使用LLMS生成低级控制命令来推动人形机器人运动以进行社会表达[29],而不是用于实践援助。Baermann等人,部署了LLM不仅遵循人类的言语命令,而且还通过人类的自然语言反馈来纠正其错误[2]。然而,通信主要依赖语音相互作用,而较少关注多模式感应和表达能力。ye等。[27]驱动了一个LLM驱动的机器人系统,该系统能够与人类在VR环境中的组装任务中合作。,但是该系统仅限于处理人类语言输入并控制虚拟空间中的单臂。通常,与快速
人工智能(AI)已经在日常交流中广泛使用,但是尽管担心AI对社会的负面影响,但在很大程度上尚未探索使用它的社会后果。我们研究了最普遍的AI应用程序之一,算法响应建议(“智能答复”)的社会后果,这些建议每天发送数十亿条消息。两个随机实验提供了证据,表明这些类型的算法推荐系统会改变人们在亲社会和反社会方式上互相互动和感知的方式。我们发现,使用算法响应会改变语言和社会关系。更具体地说,它增加了沟通速度,积极的情感语言的使用,并且对话伙伴相互评估,以更接近和更合作。然而,与对AI的不利影响的共同假设一致,如果怀疑他们使用算法响应,对人们的评估更为负面。因此,即使AI可以提高沟通速度并改善人际观念,但AI的主要反社会含义会破坏这些潜在的好处,如果使用公开使用。
简介 AI文案和AI改写是利用人工智能(AI)创建和处理文本内容的过程[1]。这些过程包括使用机器学习算法和神经网络来生成可用于文案、营销、新闻、宣传、博客、教育等各个领域的文本 [2]。在技术和营销快速发展的背景下,人工智能文案和人工智能改写变得越来越重要,因为它们可以显著加快内容创作过程并提高其质量 [3]。现代人工智能技术使我们能够创建质量不逊于人类编写的文本的文本。这为商业开辟了新的机会,因为它降低了内容创作的成本并提高了其有效性[4]。然而,尽管人工智能在文案撰写和改写中的应用有诸多优势,但也引发了许多与所创作文本的语言特征有关的问题,以及对文案撰写的新挑战 [1]。本研究旨在分析人工智能生成文本的语言特征并确定文案写作面临的新挑战。在
我们建议在短期内采用多种合规途径来实施建筑规范,并逐步实施更严格的减排要求。这项建议在环境和经济节约与可行性之间取得平衡,为教育和培训留出更多时间。建议的方法(情景 P.7)将使华盛顿州新建筑的碳排放量比正常情况减少 16%,或在 2025-2050 年期间节省 570 万公吨二氧化碳当量(节省约 7.7 亿美元的社会成本)。这一估计的碳节约量与华盛顿州 2022 年通过的备受赞誉的商业电气化规范估计的 810 万公吨二氧化碳当量节约量处于同一数量级(Kocher & Gruenwald,2022 年)。如果设定的目标比 WBLCA 减少 30% 更严格,那么可以实现比本报告中显示的更大的节约量。
