3 Paivio, A.、Rogers, TB 和 Smythe, PC (1968)。为什么图片比文字更容易回忆?心理科学,11(4),137-138。Madigan, S. (2014)。图片记忆。图像、记忆和认知,65-89。4 Highfield, T. 和 Leaver, T. (2016)。Instagrammatics 和数字方法:研究视觉社交媒体,从自拍和 GIF 到模因和表情符号。传播研究与实践,2(1)。5 然而,儿童性虐待 (CSA) 的录音和文字描述的存在也可能给 CSA 受害者和其他接触者带来痛苦。目前,关于网上 CSA 录音和文字描述的普遍性的研究很少。网上还存在其他与 CSA 有关的危害,这些危害不是基于图像的(例如诱骗)。
视觉感知冲突和错觉 Leonard A. Temme Melvyn E. Kalich Ian P. Curry Alan R. Pinkus H. Lee Task Clarence E. Rash 视觉可以说是战士最重要的人类感官。视觉处理的目的是获取有关我们周围世界的信息并理解它(Smith and Kosslyn,2007);视觉涉及光的感知和解释。视觉感官器官是眼睛,它将传入的光能转换为电信号(参见第 6 章,人眼的基本解剖和结构)。但是,这种转变并不是完整的视觉。视觉还涉及对视觉刺激的解释以及感知和最终认知的过程(参见第 10 章“视觉感知和认知表现”和第 15 章“认知因素”)。视觉系统已经进化到可以从自然场景中获取真实信息。它在大多数任务中都非常成功。但是,可见光源中的信息通常是模棱两可的,为了正确解释许多场景的属性,视觉系统必须对场景和光源做出额外的假设。这些假设的一个副作用是我们的视觉感知并不总是值得信赖的;视觉感知的图像可能具有欺骗性或误导性,尤其是当场景与过去推动视觉系统进化的场景截然不同时。因此,存在“眼见为实”的情况,即所感知到的不一定是真实的。这些错误感知通常被称为错觉。Gregory (1997) 确定了两类错觉:具有物理原因的错觉和由于知识误用而导致的错觉。物理错觉是由于物体和眼睛之间的光线干扰或由于眼睛感官信号的干扰而导致的错觉(也称为生理错觉)。认知错觉是由于大脑错误地运用知识来解释或读取感官信号而导致的。对于认知错觉,区分物体的具体知识和体现为规则的一般知识很有用(Gregory,1997)。所有幻觉的一个重要特征是必须有某种方法来证明感知系统在某种程度上犯了错误。通常这意味着场景的某些方面可以用不同于视觉感知的方式来测量(例如,可以用光度计、光谱仪、尺子等来测量)。重要的是要认识到这些“错误”实际上可能是视觉系统在其他情况下的有用特征,因为幻觉背后的相同机制可能会在其他情况下产生真实的感知。只有当“错误”可以通过其他方式检测到时,幻觉才是幻觉。虽然幻觉可能会欺骗作战人员,但视觉系统还有其他限制,可能导致在执行任务期间出现错误。这些包括视觉掩蔽(通过呈现第二个短暂刺激(称为“掩蔽”)来降低或消除一个短暂刺激(称为“目标”)的可见性)、双眼竞争(呈现给每只眼睛的不同图像之间的无意识交替)和空间定向障碍(作战人员对位置和运动的感知与现实不一致的情况)。视觉掩蔽 视觉掩蔽通常是指一种视觉刺激对另一种视觉刺激出现的影响,其中一种或两种刺激都是短暂的。因为,正如本讨论将明确指出的,视觉掩蔽
本研究的主要目的是描述一种通过分裂四元数实现的新型白平衡算法。该算法的独特之处在于,它与最近开发的色彩感知数学模型 [9, 7] 相一致。该模型提供了一种替代 CIE(国际照明委员会)的色彩描述方法,即通过比色空间中的三个坐标(例如 RGB、HSV、CIELab 等)描述色彩。它还强调了这样一个事实:感知色彩应被描述为(感知)测量过程的结果。测量方程是所提算法的基石,它使用量子信息工具并表达所谓的 L¨uders 运算的结果。对这种关于色彩感知的新范式的完整数学描述超出了本文的范围。为了保持自洽,本模型的基本概念将在第 2 部分回顾,对更多细节感兴趣的读者可以参阅以下论文 [9, 7, 4, 6, 8, 5]。我们认为值得一提的是,本模型能够:内在地调和三色视觉与赫林对立 [4, 6];形式化牛顿色盘 [4];单独提出希尔伯特-克莱因双曲度量作为自然的感知色距 [5];解决将无限感知色锥限制为感知色凸有限体积立体这一长期存在的问题 [4, 9];预测色对立的不确定性关系 [8],并给出感知色感知属性的连贯数学定义 [7]。正如我们将在第 2 节中更详细地强调的那样,颜色测量方程发生在代数 H (2 , R ) 中,该代数由 2 × 2 对称矩阵组成,具有实数项。为了获得有意义的
本文的主要目的是全面概述和分析物质制品与具身心智之间的各种关系。本文的第二个目标是确定制品设计和使用中的一些趋势。首先,根据其功能特性,我确定了具身心智所采用的四类制品,即 (a) 具身制品、(b) 感知制品、(c) 认知制品和 (d) 情感制品。这些类别可以重叠,因此一些制品属于多个类别。我还确定了我们在与制品交互时使用的一些技术(或技能)。确定这些制品和技术类别使我们能够绘制出具身心智与制品世界之间关系的图景。其次,在确定了人工制品和技术的类别之后,本文概述了人工制品设计和使用的一些趋势,重点关注神经假体、脑机接口和个性化算法,引导用户走向特定的信息消费认知路径。
扩展现实 (XR) 技术为飞机乘客带来了激动人心的可能性,使他们能够摆脱有限的客舱空间。使用附近的物理表面可以与现实世界建立联系,同时通过触摸改善 XR 体验。但是,可用的表面可能位于尴尬的位置,从而降低了舒适度和输入性能,并限制了它们的长期使用。我们探索了不同方向上的被动触觉表面的可用性,评估了它们对输入性能、用户体验和舒适度的影响。然后,我们通过使用感知操纵技术来克服由狭窄空间引起的人体工程学问题,这些技术重新映射物理表面的位置和旋转以及用户运动,评估它们对任务工作量、舒适度和存在感的影响。我们的结果表明,受限座位环境带来的挑战可以通过
在一个上下文中似乎很明显的话,如果该上下文发生变化,则可以具有完全不同的含义。11尽管已经广泛研究了与上下文相关的推论,但一个基本问题仍然存在:12大脑如何同时推断感觉输入的含义和基本的13个上下文本身,尤其是当上下文在变化时?在这里,我们研究了灵活的感知分解14个 - 能够迅速适应而无需反复试验的上下文转移的能力。我们在动态环境中引入了15个新颖的变更检测任务,需要跟踪潜在状态和16个上下文。我们发现,小鼠表现出对潜在上下文的第一审判行为适应,而不是推理而不是奖励反馈。通过在可观察到的马尔可夫决策过程中得出贝叶斯最佳政策,我们表明,快速适应从内部信念状态的顺序19个更新中出现。此外,我们还表明,通过20枚强化学习训练的人工神经网络实现了近距离的性能,从而在其复发性动态中实现了类似贝叶斯推理的21种机制。这些网络开发了灵活的内部代表 - 22个tations,可以实时调整推理模型。我们的发现建立了灵活的23感知推断,作为认知灵活性的核心原理,为在不确定环境中的适应性行为提供了计算和24个机械性见解。25
感知是在大脑中形成图形-地面分割和以物体为中心的表征之后产生的。研究表明,注意力在忽视中起着关键作用,研究表明颞顶交界处受损的患者无法将注意力从同侧空间转移到对侧空间(Friedrich、Egly、Rafal & Beck,1998;Posner、Walker、Friedrich & Rafal,1984),即使对于出现在同侧半视野内的目标也是如此(Ladavas,1990;Ladavas、Del Pesce & Provinciali,1989)。与对侧注意力受损相比,对同侧空间的注意力实际上可能会增强(D'Erme、Robertson、Bartolomeo、Daniele & Gainotti,1992;Ladavas,1990;Ladavas、Petronio & Umilta,1990)。这可能是由于右半球受损后优势左半球的抑制作用减弱所致(Cohen、Romero、Servan-Schreiber & Farah,1994;Kinsbourne,1977、1993)。使用经颅磁刺激 (TMS) 暂时扰乱右顶叶皮质处理的研究也为这种半球竞争解释忽视提供了证据(Blankenburg et al.,2008;Seyal、Ro & Rafal,1995;Szczepanski & Kastner,2013)。或者,如果右半球负责注意空间的两个半部,而左半球只负责注意空间的右侧,那么右半球损伤更有可能导致忽视(Heilman & Valenstein,1979;Heilman & Van Den Abell,1979,1980)。此外,右半球损伤后,同侧半球也可能出现注意力缺陷(Vuilleumier & Rafal,2000),忽视还可能出现时间注意力缺陷(Husain、Shapiro、Martin & Kennard,1997)。这些关于忽视的半球不对称解释表明,感知处理可能在大脑损伤同一侧(同侧)的视觉空间中受到影响,这与该领域的普遍观点(同侧空间不受影响)相反。为了验证这一想法,在本研究中,我们使用元对比掩蔽范式评估了忽视患者对侧和同侧空间的空间和时间处理差异,其中短暂呈现的目标刺激在元对比掩蔽之前以不同的延迟呈现。在神经健康的受试者中,当目标刺激在周围元对比掩蔽之前约 30 毫秒的相同位置呈现时,目标刺激经常被错过,并且只感知到元对比掩蔽(Breitmeyer,1984;Breitmeyer & Ogmen,2000;Ogmen,Breitmeyer,& Melvin,2003)。有人假设这种掩蔽是由于视觉皮层中掩蔽的反馈处理中断了目标刺激的前馈处理(Enns,2004;Ro,Breitmeyer,Burton,Singhal,& Lane,2003)。重要的是,研究之前已经表明,正常受试者的元对比掩蔽的幅度和持续时间受到内源性注意力的影响(Boyer & Ro,2007;Ramachandran & Cobb,1995)。通过操纵这些目标和掩蔽刺激在空间中的位置和时间中呈现,我们评估了忽视如何影响两名忽视患者对侧和同侧半场的元对比掩蔽。为了进行比较,我们还在一组神经健康、年龄匹配的受试者中使用相同的范例测量了元对比掩蔽的空间和时间范围
人工智能 (AI) 在音乐领域能做什么和不能做什么是音乐研究人员和人工智能专家都感兴趣的重要话题之一。本研究在人工智能技术在音乐创作中日益重要的作用及其对创作过程的影响的背景下提供了重要的分析。它通过将人工智能定位为作曲家创造力的补充工具并增强对文化适应过程的理解,为文献做出了贡献。该研究旨在确定人工智能和作曲家作品之间的感知差异,研究这些差异的音乐和文化基础,并揭示影响听众体验的因素。在研究设计中,采用了混合方法,结合了定性和定量研究方法。在定量阶段,采用双盲实验设计,以确保参与者公正地评价作曲家和人工智能作品。在定性阶段,收集参与者的意见。参与者是 10 名年龄在 19 至 25 岁之间的人,具有不同的文化和教育背景;6 人接受过正规音乐教育,4 人是普通听众。数据收集工具包括结构化访谈表和音乐作品感知因素评估量表。在研究过程中,每位参与者在 20 分钟的标准化聆听环节中评估了两部人工智能和两部作曲家作品。所有聆听环节均使用专业音频设备进行。分析显示,作曲家作品在所有类别中的得分明显高于人工智能作品(p <.05)。观察到了显著的差异,特别是在情感深度(X 作曲家 = 4.6,X AI = 3.1)和记忆性(X 作曲家 = 4.4,X AI = 3.2)类别中。研究得出结论,作曲家作品在情感深度、结构连贯性和文化共鸣方面比人工智能作品更有效。此外,文化背景和音乐教育成为影响感知差异的重要因素。未来的研究应扩大参与者范围并结合神经认知数据,以促进对感知机制的更深入了解。此外,音乐人工智能系统的发展应包括融合基于Transformer和RNN的高级学习模型、实现传统音乐理论原理、增强情感表达能力、提高文化适应能力、完善实时交互机制等。
机器学习模型需要提供对比性解释,因为人们经常试图理解为什么会出现令人费解的预测而不是某些预期的结果。当前的对比性解释是示例或原始特征之间的基本比较,由于缺乏语义含义,因此仍然难以解释。我们认为解释必须与其他概念、假设和关联更相关。受认知心理学感知过程的启发,我们提出了 XAI 感知处理框架和 RexNet 模型,用于具有对比显着性、反事实合成和对比线索解释的可关联可解释 AI。我们研究了语音情绪识别的应用,并实现了一个模块化多任务深度神经网络来预测和解释语音中的情绪。从出声思考和受控研究中,我们发现反事实解释很有用,并且可以通过语义线索得到进一步增强,但不是显着性解释。这项工作为提供和评估用于感知应用的可关联对比可解释 AI 提供了见解。
几何声学 - GA - 建模技术假设表面相对于感兴趣的波长较大。对于给定场景,实践者通常会创建一个具有大而平坦表面的单个 3D 模型,该模型在很宽的频率范围内满足假设。这种几何近似会导致模拟声场的空间分布出现错误,因为影响反射和散射行为的几何细节被忽略了。为了补偿近似,建模者通常会估计表面的散射系数,以随机地解释反射方向性中实际的、波长相关的变化。一种更确定性的方法可以考虑一系列几何细节不断增加的模型,每个模型都在相应的频带上进行分析,以满足大表面尺寸的要求。因此,为了提高 GA 模拟的宽带空间精度,我们提出了一种多分辨率建模方法。使用波纹墙的比例模型测量、我们的方法与非 GA 技术的比较以及一些简单的听力测试,我们将展示