摘要 — 学龄前儿童的言语障碍影响深远,影响他们的沟通能力、社交互动和整体发展。本研究旨在分析基于人工智能的干预措施对患有言语障碍的学龄前儿童的心理语言学发展的影响。为了实现这一目标,这项研究包括一项为期五个月的实验研究。它以人工智能工具的干预和进展评估为基础。参与者被提供了一个旨在提高言语技能的计划。该计划包括与言语治疗师的课程和基于人工智能应用程序(Fluency SIS、Articulation Station Pro 和 Apraxia Farm)的课程。其他方法包括与父母和言语治疗师进行焦点小组的半结构化访谈,以及对获得的数据进行统计分析。研究参与者是 170 名 3-5 岁患有言语障碍的儿童,以及 20 名父母和 6 名独立言语治疗师。Shapiro-Wilk 检验测量了研究中获得的数据的正态性。测试结果为 0.97 (p = 0.23),表明数据呈正态分布。中等效应量 (0.47) 表明干预后两组得分之间存在中等差异。这一结果证实了基于人工智能的干预措施有助于显著改善的假设。这些发现可以成为将人工智能干预措施纳入学龄前言语治疗实践的科学合理建议的基础。这项研究可以帮助根据这个年龄组的具体需求开发和修订人工智能应用程序。关键词 — 失用症、移动应用程序、特殊教育、言语和语言病理学、语言流畅性
注意会失去什么?对 ChatGPT、人工智能和写作指导价值的批判性思考 Nicholas R. Werse 贝勒大学 DOI:10.37514/DBH-J.2023.11.1.07 自 2022 年 11 月推出以来,ChatGPT 引发了社论风暴,警告这可能是目前大学写作实践的终结(例如,Heilweil,2022 年; Marche,2022 年; Rosenblatt,2022 年; Shrivastava,2022 年; Stone,2022 年)。ChatGPT 由 OpenAI 制作,是一种文本生成人工智能 (AI),可在模仿各种写作风格的同时为基于用户的问题生成原始答案。虽然 OpenAI 已经研究这个程序一段时间了,但 ChatGPT 3.5 生成的文本的流畅性、可读性和连贯性已经引发了人们对文本依赖型行业未来的大量评论(除了之前提到的行业,参见 Vanian,2022 年)。对于高等教育,ChatGPT 能够对各种问题生成连贯的答案(包括引文和参考文献),这引起了一个非常现实的担忧,即学生可能很快就会(如果不是现在)提交人工智能生成的论文而不会被发现(Heilweil,2022 年; Marche,2022 年; Rosenblatt,2022 年; Shrivastava,2022 年; Stone,2022 年)。虽然很多讨论都集中在 ChatGPT 对抄袭的影响上,但在本文中,我想考虑一下呼吁将这项新技术作为研究和写作助手(而不是替代品)不那么邪恶地使用的影响。我认为,过度依赖这项技术来外包和加速写作过程,可能会忽视写作所公认的价值之一:批判性思维和理解深度的发展。
大型语言模型(LLMS)显着增强了机器生成的文本的流畅性和多样性。然而,这一进展在检测给定文本的起源方面也提出了重大挑战,并且有关检测方法的当前研究滞后于LLM的快速发展。传统的基于培训的方法在灵活性方面存在局限性,尤其是在适应新领域时,并且通常缺乏解释性的能力。为了解决这一差距,我们提出了一种新型的无训练检测策略,称为d ivergent n-gram a nalysis(DNA-gpt)。给定文本,我们首先将其截断在中间,然后仅将上述部分作为LLMS输入以重新生成新的剩余部分。通过在黑盒中分析原始部分和新的部分之间的差异,或者在白框中的概率差异,我们在机器生成的文本的分布与人类写入的文本的分布之间公布了显着差异。我们对Openai最先进的LLM进行了广泛的实验,包括Text-Davinci-003,GPT-3.5-Turbo和GPT-4,以及诸如GPT-Neox-20B和Llama-13b之类的开源模型。的结果表明,我们的零射击方法在区分四个英语和一个德国数据集的人类和GPT生成的文本方面表现出最先进的表现,表现优于Openai自己的分类器,该分类器对数百万文本进行了培训。另外,我们的方法提供了合理的解释和证据来支持我们的主张,这是可解释检测的独特特征。代码可从https://github.com/xianjun-yang/dna-gpt在修订后的文本攻击下,我们的方法也很强,可以另外解决模型采购。
Bentin, S., Mouchetant-Rostaing, Y., Giard, MH, Echallier, JF, & Pernier, J. (1999). 不同心理语言学水平上处理印刷文字的 ERP 表现:时间进程和头皮分布。认知神经科学杂志,11 (3),235 – 260。https://doi.org/10. 1162/089892999563373 Binder, JR, Desai, RH, Graves, WW, & Conant, LL (2009). 语义系统在哪里?对 120 项功能神经影像学研究的批判性回顾和荟萃分析。大脑皮层,19 (12), 2767 – 2796。https://doi.org/10.1093/cercor/bhp055 Boersma, P., & Weenink, D. (2018)。Praat:用计算机进行语音学研究。检索自 http://www.praat.org/ Brysbaert, M., Buchmeier, M., Conrad, M., Jacobs, AM, Bölte, J., & Böhl, A. (2011)。词频效应:回顾德语中频率估计选择的最新发展及其影响。实验心理学,58 (5), 412 – 424。https://doi.org/10。 1027/1618-3169/a000123 Cattaneo, Z.、Pisoni, A. 和 Papagno, C. (2011)。经颅直流电刺激布罗卡区可改善健康个体的语音和语义流畅性。神经科学,183,64 – 70。https://doi.org/ 10.1016/j.neuroscience.2011.03.058 Chouinard, PA、Whitwell, RL 和 Goodale, MA (2009)。侧枕叶和下额叶皮层在命名视觉呈现的物体时发挥着不同的作用。 Human Brain Mapping,30 (12),3851 – 3864。https://doi.org/10.1002/hbm.20812 Costafreda, SG、Fu, CHY、Lee, L.、Everitt, B.、Brammer, MJ 和 David, AS (2006)。对言语流畅性的 fMRI 研究的系统评价和定量评估:左下额叶回的作用。Human Brain Mapping,27 (10),799 – 810。https://doi.org/10.1002/hbm.20221 de Zubicaray, GI 和 Piai, V. (2019)。研究言语产生的空间和时间成分。《牛津神经语言学手册》。牛津:牛津大学出版社。 Devlin, JT、Matthews, PM 和 Rushworth, MFS (2003)。左下前额皮质的语义处理:功能性磁共振成像和经颅磁刺激相结合的研究。认知神经科学杂志,15 (1),71 – 84。https://doi.org/ 10.1162/089892903321107837 Duecker, F. 和 Sack, AT (2013)。刺激前假 TMS 有助于目标检测。PLoS One,8 (3),e57765。https://doi.org/10.1371/journal.pone.0057765 Epstein, CM、Lah, JJ、Meador, KJ、Weissman, JD、Gaitan, LE 和 Dihenia, B. (1996)。磁脑刺激侧向言语抑制的最佳刺激参数。神经病学,47 (6),1590 – 1593。https://doi.org/10.1212/WNL.47.6.1590 Epstein, CM, Meador, KJ, Loring, DW, Wright, RJ, Weissman, JD, Sheppard, S., … Davey, KR (1999)。经颅磁刺激期间言语停止的定位和特征。临床神经生理学,110 (6),1073 – 1079 https://doi.org/10.1016/S1388-2457(99)00047-4 Fiez, JA (1997)。语音学、语义学和左下前额皮质的作用。人脑映射,5,79 – 83 https://doi.org/10. 1002/(SICI)1097-0193(1997)5:2<79::AID-HBM1>3.0.CO;2-J Flitman, SS, Grafman, J., Wassermann, EM, Cooper, V., O'Grady, J., Pascual-Leone, A., & Hallett, M. (1998)。重复经颅磁刺激过程中的语言处理。神经病学,50 (1),175 – 181。https://doi.org/10.1212/WNL.50.1.175 Gough, PM、Nobre, AC 和 Devlin, JT (2005)。通过经颅磁刺激分离左下额叶皮质的语言过程。神经科学杂志,25,8010 – 8016。https://doi.org/ 10.1523/JNEUROSCI.2307-05.2005 Grogan, A.、Green, DW、Ali, N.、Crinion, JT 和 Price, CJ (2009)。第一和第二语言中语义和音位流畅能力的结构相关性。大脑皮层,19,2690 – 2698。https://doi.org/10。 1093/cercor/bhp023 Groppa, S., Werner-Petroll, N., Münchau, A., Deuschl, G., Ruschworth, MFS, & Siebner, HR (2012). 一种新颖的双位点经颅磁刺激范式,用于探测来自同侧的快速促进输入
图 1 短期训练 (STT) 和长期发展 (LTD) 研究概述以及 STT 的行为结果。 (A) STT 和 LTD 样本。在当前的研究中,我们将为期 4 周的训练研究 (STT) 中的训练诱导学习与 Schwartz 等人 (2021) (LTD) 中的儿童和青少年之间的神经发育差异进行了比较。 (B) STT 研究设计。首先,通过 Woodcock-Johnson-III (WJ-III;Woodcock 等人,2001) 的数学流畅性子测试评估儿童的算术流畅性。在另一天,孩子们接受了 fMRI 扫描,在此期间他们必须确定两个数量(以点阵 [或阿拉伯数字] 表示,用于非符号 [或符号] 条件)中的哪个更大。完成 fMRI 扫描后,儿童在导师的指导下接受了为期 4 周的一对一强化数字感知训练,重点是提高非符号和符号数值表示之间的映射。训练每周进行三次,每次约 60 分钟。训练结束后,儿童接受第二次 fMRI 扫描,并完成第二次 WJ-III 数学流畅度子测试。(C)fMRI 任务。在 fMRI 会话中,参与者在不同的运行中执行非符号和符号数字比较任务。该图描绘了非符号比较任务的示例试验。参与者在数量对呈现开始后和试验间隔结束前回答哪一侧的数量较大。计算了非符号和符号数字比较任务中数字距离效应(近—远距离)的大脑反应模式之间的神经表征相似性 (NRS)(详见方法)。(D)响应 STT 的行为表现改善。在非符号 (Nonsym) 和符号 (Sym) 格式的数字比较任务中,都观察到了更高的性能效率。性能效率是通过将准确度除以平均反应时间来衡量的,分数越高表示效率越高。p *** < 0.001。
认知功能是一个广泛且多维的术语,包括集中和注意力,精神运动效率,学习和记忆,视觉空间能力,口头流畅性,解决问题,手动灵活性和心理灵活性(Ryan等,1987)。听力损失影响认知功能的程度在过去十年中引起了人们的兴趣。Loughrey等。(2018)在他们的综述和荟萃分析中得出结论,听力损失是认知障碍和痴呆症的潜在危险因素。最近,Marinelli等。(2022)在一项前瞻性人群的研究中表明,随着时间的推移,听力损失与认知功能差有关。目前,助听器是主要的治疗选择;这些会放大声音以获得更好的听力。Yeo等。 (2023)在文献综述中表明,听力困难的人使用助听器和人工耳蜗植入物与长期认知下降的风险下降了9%,并且认知测试的改善3%,这些测试在短期内衡量了全球认知功能。 然而,还有其他文献综述研究,辩论了使用助听器对认知功能的积极作用(例如,Sanders等,2021; Dawes和Völter,2023)。 例如, Dawes和Völter(2023)指出,助听器使用后,只有不到一半的先前研究报告了认知功能的表现更好。 此外,大多数先前的研究持续时间很短(从几周到18个月)。 由于认知能力下降是一个逐步的过程,因此需要进行更长的干预持续时间的试验。Yeo等。(2023)在文献综述中表明,听力困难的人使用助听器和人工耳蜗植入物与长期认知下降的风险下降了9%,并且认知测试的改善3%,这些测试在短期内衡量了全球认知功能。然而,还有其他文献综述研究,辩论了使用助听器对认知功能的积极作用(例如,Sanders等,2021; Dawes和Völter,2023)。Dawes和Völter(2023)指出,助听器使用后,只有不到一半的先前研究报告了认知功能的表现更好。此外,大多数先前的研究持续时间很短(从几周到18个月)。由于认知能力下降是一个逐步的过程,因此需要进行更长的干预持续时间的试验。因此,尚不清楚助听器使用是否可以保护听力损失患者的认知能力下降。
暑期学生,5-9 年级 卡罗尔学校的有针对性的认知干预 (TCI) 是什么? 在卡罗尔学校,我们的内部测试显示,大多数患有语言学习障碍的卡罗尔学校学生在一个或多个认知领域存在弱点。 阅读流畅性、阅读理解和数学素养等重要的学术技能依赖于潜在的认知能力,例如反应时间、处理速度、工作记忆和执行功能。后测数据分析表明,通过对这些认知领域进行个性化的计算机培训,可以提高儿童的阅读能力。 为什么在夏季选择 TCI? TCI 不教授特定内容,而是培养学生访问将遇到的任何内容所需的认知能力。 通过提高大脑有效运作的能力,TCI 帮助学生开发一个认知“工具箱”,帮助他们完成学术生涯。 与其他市售的大脑训练计划不同,TCI 研究分布在整个大脑中的各种网络,以针对每个学生的个人弱点并改善认知和学术成果。我们如何确定您的孩子需要练习的认知技能?在 Summer@Carroll 开始前单独安排的会议中,我们会进行评估,测量以下认知领域:反应时间、工作记忆、执行功能和处理速度。然后,我们会根据学生的分数生成认知概况。根据此概况,每个学生都会被分配到一个特定的计划,该计划由旨在针对其最薄弱领域的活动组成。 TCI 专家会监控您孩子在每项活动中的进度,分析数据并提供指导。 TCI 结束时,我们会进行后测,以确定哪些认知领域从 TCI 中得到了改善,以及它们发生了多大的变化。结果将在计划结束时分享。 我的孩子在 TCI 期间会做什么?在 TCI 期间,学生将完成基于计算机的练习,以加强大脑中的特定连接,从而实现更快、更高效的学习。您的孩子将进行针对其特定弱点(反应时间、工作记忆或执行功能)设计的一系列活动。整个夏天,学生都会反思他们的工作并设定个人目标。更多信息:Patty Muldoon pmuldoon@carrollschool.org
2023 年初,对话式人工智能出现了颠覆性的发展:ChatGPT。大型语言模型技术突然可供数百万用户使用。底层 GPT-3.5 语言模型拥有 1750 亿个参数,经过 3000 亿个单词的训练,并根据人类反馈进行了微调,显示出流畅性、风格迁移和思维链推理等突发行为。此外,其数千个标记的上下文窗口支持一种对话训练形式:通过提示进行实时监督(尽管不稳定)训练。从对话的角度来看,ChatGPT 具有跨会话的对话记忆,使其能够从对话中获取先前的交互。2023 年 3 月,GPT-4 取代了 GPT-3.5,具有更大的上下文窗口,据报道在处理事实问题方面具有更高的准确性,并将图像分析与基于语言模型的交流互动联系起来。鉴于这些重大进展,人们可能倾向于认为对话式人工智能已经成熟。然而,仍存在大量未解决的问题和研究问题。关键的争论围绕着大型语言模型的社会影响和 NLP 的未来、训练机制的环境影响以及大规模采用、偏见的影响和预防以及训练数据可能存在的版权侵权。对话式人工智能领域的核心研究主题在很大程度上与底层技术(包括大型语言模型)正交。本前沿研究主题涉及许多这样的主题:人类对对话代理的感知以及对话代理表现出的社交线索对人类的影响、信息呈现在混合对话系统中的作用、除了原始文本观察数据之外使用精心注释的数据,以及人机之间交流模式的出现。Blomsma 等人的论文。解决了人类对话者对具身对话代理所表现出的性格特征的感知。这些作者通过比较人与人之间和人与人工智能之间的互动,表明动态社交反馈线索(尤其是点头)与人类感知的性格特征相关。随着对话式人工智能变得越来越多模式化和嵌入式,这些发现将对行业具有实际意义,并可能有助于人类与人工智能之间更自然的互动模式。Wieland 等人的论文与这些结果相关——这些作者研究了聊天机器人通过头脑风暴产生想法的适用性,同时考虑到聊天机器人呈现的静态社交线索(姓名、身份、图片)。他们发现,与聊天机器人进行头脑风暴可以让参与者产生越来越多样化的想法
新兴证据表明心房颤动与认知功能障碍有关,与中风无关,但其潜在机制仍不清楚。在这项来自瑞士心房颤动研究 (NCT02105844) 的横断面分析中,我们研究了血清神经丝轻蛋白(一种神经元损伤生物标志物)与心房颤动患者的 (i) CHA 2 DS 2 -VASc 评分(充血性心力衰竭、高血压、年龄 65-74 岁或 > 75 岁、糖尿病、中风或短暂性脑缺血发作、血管疾病、性别)、临床和神经影像学参数和 (ii) 认知测量之间的关联。我们使用超灵敏单分子阵列分析技术在 1379 名心房颤动患者(平均年龄 72 岁;女性,27%)的样本中测量了血清中的神经丝轻蛋白。通过脑 MRI 评估缺血性梗塞、小血管疾病标志物和标准化脑体积。认知测试包括蒙特利尔认知评估、连线测试、语义语言流畅性和数字符号替换测试,并使用主成分分析进行总结。使用单变量和多变量线性回归分析结果。神经丝光与 CHA 2 DS 2 -VASc 评分相关,每单位 CHA 2 DS 2 -VASc 增加,神经丝光平均增加 19.2% [95% 置信区间 (17.2% , 21.3%)]。在调整年龄和 MRI 特征后,这种关联仍然存在。在多变量分析中,与神经丝光相关的临床参数包括年龄较高[每 10 年神经丝增加 32.5 % (27.2 % , 38 %)]、糖尿病、心力衰竭和外周动脉疾病[分别为 26.8 % (16.8 % , 37.6 %)、15.7 % (8.1 % , 23.9 %) 和 19.5 % (6.8 % , 33.7 %) 的神经丝较高]。平均动脉压与神经丝呈曲线关联,有证据表明存在反线性和 U 形关联。与神经丝相关的 MRI 特征是白质病变体积和大面积非皮质或皮质梗塞体积[相应病变对数体积每增加一个单位,神经丝分别增加 4.3%(1.8%,6.8%)和 5.5%(2.5%,8.7%)],以及标准化脑体积[每 100 cm3 神经丝数量较多,脑体积较小,分别为 4.9%(1.7%,8.1%)]。单变量分析显示,神经丝光与所有认知指标呈负相关。调整临床和 MRI 变量后,效应大小减小,但与第一个主成分的关联仍然明显。我们的结果表明,在心房颤动患者中,通过血清神经丝光测量的神经元丢失与年龄、糖尿病、心力衰竭、血压和血管性脑病变有关,并与标准化脑容量和认知功能呈负相关。
咨询项目的成功因素:制作“有效的地图” Stan Lester 1 Stan Lester Developments,英国。发表于《基于工作学习》国际电子期刊,12(2)第 1-16 页,2024 年。保留作者版权。作者是一名顾问,在教育、培训和专业监管领域从事项目工作超过 30 年,他反思了成功干预和可持续项目成果的因素。确定了七个关键因素:(1)实质性和方法论意义上的知识可信度;(2)一致且明确的道德观点;(3)全面丰富地描绘实践环境;(4)使用“实现”或“共同创造”方法确保客户社区拥有对项目的所有权;(5)开发有效的系统架构;(6)能够充当宪法仲裁者,以保持目的的一致性和恒定性; (7) 将项目视为一个研究过程,既在内部建立持续的审查和发展,在外部提供批评并将其与该领域的平行发展联系起来。方法论流畅性的重要性也得到了强调,以开发适合上下文的方法,同时告诫不要使用过于形式化的方法和流程。咨询;项目;实践作为研究;实践方法;成功因素。介绍我作为顾问和研究员从事与工作相关的教育和培训系统的工作,包括专业会员和注册机构使用的框架和监管系统。我曾与专业机构、大学、政府机构、专家和行业团体、项目伙伴以及(在较小程度上)公共、私人和志愿部门的雇主合作,项目范围从短期专家意见或报告到长期项目,以建立或审查和修改主要系统和框架。我也是密德萨斯大学执业博士 (DProf) 的早期毕业生,2002 年我基于长期咨询关系的初始阶段完成了该学位(下表 1 中的“B”)。2022 年,我被要求主持一场针对专业博士候选人的智力领导力研讨会,以及我从事私人执业 30 周年纪念日和关于退休前如何组织工作的思考,这些促使我思考我的工作中哪些做得好,哪些做得不好。自 1993 年以来,我与大约一百名客户或项目合作伙伴合作完成了近 300 项独立工作,从简短的评论和评论到跨越数年的研究和开发项目。规模较大的项目(涵盖至少一个完整的活动周期并允许审查其效果的项目)是最有价值的评估和反思对象。我选择了七个项目作为反思的主要对象,这些项目从 1998 年到 2022 年,历时 2 至 9 年,包括欧盟资助的开发项目和为客户开展的工作(表 1)。从这些项目中,我确定了有助于他们成功的关键主题,然后返回到每个项目中,挑选出与每个主题相关的更多细节;五个主题出现在所有项目中,一个主题(实践作为研究)出现在六个项目中,一个主题(宪法仲裁者)出现在五个项目中。最后,我结合我的整体工作(包括两件不太成功的作品)反思了每个主题,以确定任何其他值得注意的点。结果说明了什么对我有用;我将它们提供出来供大家考虑和进一步探索,而不是作为对其他人的处方。1 s.lester@devmts.co.uk ;作者的部分作品可在 www.devmts.co.uk 找到