本学期,该课程将集中在这些动画系统的生物学启发的动画系统和可穿戴性能控制系统上的探索和创建。我们将从特殊效果生产和研究公司(Legacy Effects,Festo,Jim Henson的生物商店,迪士尼研究等)中调查艺术动画和控制系统的状态。,并且,在仿生研究中的课程之后,直接寻找生物系统,以获取我们自己设计的结构和物质灵感。物理结构(形式和材料)将被视为一种计算形式,以及传统的电子和数字逻辑。本课程的主要可交付成果将是功能动画和控制系统。可能会组织成品的最终画廊展览。在
2018; Saffran等。,1996)。以前的研究044表明,语言模型可以有效地模拟语言获取方面的方面,例如音素分类(Lavechin 047等人。,2023),单词获取预测(Chang 048和Bergen,2022)和语法发展049(Evanson等人。,2023; Lavechin等。,2023; Pan-050 Nitto和Herbelot,2020)。然而,这些研究051主要集中于定性分析-052 SES,通常缺乏与Real-053 World人类数据的详细比较。054对于对语言获取的模拟的更定量方法,我们建议在两个方面符合056的学习环境和057的结果度量。首先,尽管058的社会经济因素和文化环境有所不同(Hart 059等人,1997; Cristia等。,2019年),目前的估计060表明,美国英语学习的儿童061每年收到300至1,000小时的演讲时间062输入,到三岁时总计3000万个单词063。与现代Lan-064的Guage模型相反,经过数万亿个单词的训练(Hart 065等人,1997; Cristia等。,2019年),我们在发育合理的输入上训练mod-066 EL,与067的数量匹配,与儿童暴露于068的输入相匹配。第二,语言mod-069 EL的评估方法应与可用表格070人类数据集一致。,2007年)。,2017年)或Grammat- 078 ICal可接受性判断(Warstadt等人目前,人类行为数据071主要源自儿童的言语生产-072(例如,Childes)或父母报告(Com-073 Muninicative Developting Contingries,此后Hu-074 Man CDI)(MacWhinney and Snow,1985年; Fenson 075等; Fenson 075等。相比之下,语言模型评估 - 076通常涉及零射击探测任务,例如077 Sote-the-the-the-the-word(Le Godais等人。,2019年),079,尽管受到心理语言甲基元素的启发,但与生产-081的人类数据本质上不同,并且通常依赖于仔细的082设计的探测集。083要解决这些问题,我们介绍了机器-084
类人机器人具有与Humans相似的形态,具有执行人类在日常生活中可以完成的各种任务和动作的潜力。,由于高维状态空间和控制性的综合性,发展具有人类类似人类的行为,从而限制了其现实世界的应用仍然具有挑战性。随着大规模Human运动数据集的可用性不断增长[4,45],一种解决这一挑战的实用方法是通过跟踪和模仿人类动作来复制多功能运动[8,20,23,24]。但是,在考虑硬件时,人形机器人和人类仍然完全不同,这阻碍了机器人完全复制人类运动的能力。这提出了一个令人信服的研究问题:鉴于它们的身体局限性,我们如何在保持其稳定性和稳健性的同时,追求人形机器人的表现力,类人类的能力?在本文中,我们引入了先进的表达全身控制(Exbody 2),这是一个有效的框架,可最大程度地揭示人形机器人对可行的全身运动的表现力。该框架属于SIM2REAL管道,该政策将采用参考运动运动作为输入,并输出控制真实类人动物以在现实世界中进行运动的动作。我们培训一项单一的政策,该政策跨越了不同的输入信息。我们确定了四种技术设计以实现这一目标:(i)构建可行且多样化的培训数据集。一些作品通过完善数据集解决了这一点。我们系统地分析数据集人类运动数据集(如Amass [45])通常包含超出机器人物理帽的复杂运动,从而使跟踪过于挑战和降低表现。前[8],例如,通过模棱两可的描述(例如“舞蹈”)仍然可以包含不合适的动作,从而滤除了使用语言标签的不可行动作。其他AP-PARACHES,例如H2O [24]和OmniH2O [24],采用SMPL模型来模拟虚拟类人动物并滤除复杂运动。但是,SMPL化身可以执行真正的机器人无法执行的操作,从而在模拟和现实世界可行性之间造成差距,从而仍会影响训练有效性。
旨在引发同理心的界面为 HCI 提供了实现重要亲社会成果的机会。最近的研究表明,感知富有表现力的生物信号可以促进情感理解和与他人的联系,但这项工作主要局限于视觉方法。我们提出,听到这些信号也会引起同理心,并通过听见心跳来检验这一假设。在一项基于实验室的受试者研究中,参与者(N = 27)在不同心跳条件下完成了一项情绪识别任务。我们发现,听到心跳会改变参与者的情感视角,并提高他们报告的“感受他人感受”的能力。从这些结果来看,我们认为听觉心跳非常适合作为一种共情干预,并且由于其音乐和非视觉性质,可能对某些群体和使用环境特别有用。这项工作为共情听觉界面建立了基线,并提供了一种评估未来设计效果的方法。
摘要 - 表达文本到语音(TTS)的目的是通过不同的口语风格综合语音,以更好地反映人类的语音模式。在这项研究中,我们试图使用自然语言作为一种提示,以控制合成语音中的样式,例如,“充满悲伤的情绪中的叹气语调,并有些无助的感觉”。考虑到没有现有的TTS语料库适合基于这项新型任务,我们首先构建了语音语料库,其语音样本不仅用内容转录,而且还具有自然语言的样式描述。然后,我们提出了一种表现力的TTS模型,名为Constructtts,该模型在以下方面是新颖的:(1)我们充分利用了自我监督的学习和跨模式公制学习,并提出了一种新颖的三阶段训练程序,以获得一种可有效地嵌入良好的句子模型,可以有效地从样式中捕获促进语音和对照式的演讲风格,从而有效地捕获语义信息。(2)我们建议在离散的潜在空间中对声学特征进行建模,并训练一种新型的离散扩散概率模型,以生成载体定量(VQ)声音令牌,而不是常用的MEL频谱图。(3)我们在声学模型培训期间共同应用共同信息(MI)估计和最小化,以最大程度地减少扬声器和样式的MI,避免使用样式提示中可能的内容和扬声器信息泄漏。已经进行了广泛的客观和主观评估,以验证指令的有效性和表现力。实验结果表明,指令可以通过控制口语样式的样式来合成高层和自然语音。
1引言生成建模在机器学习和人工智能领域起着重要作用,因为它提供了一种能够理解,解释以及在我们数据丰富世界中存在的复杂模式的功能工具包。通过将概率理论作为捕获给定数据集中固有不确定性的原则方法,这些模型旨在近似负责生成数据的基础分布或随机过程。因此,概率生成模型具有解决各种问题的潜力,包括生成新的数据示例,进行观察给出的推理,估计事件的可能性以及有关不确定信息的推理。但是,从数据中学习分布是一个挑战问题,通常需要在建模灵活性和概率推断的障碍之间进行权衡。早期生成模型的优先级优先考虑可牵引推理,通常是通过图形模型的形式将概率结构施加在random变量上[Koller and Friedman,2009]。因此,他们缺乏对复杂分布进行建模的挠性。自那以后,提出的可进行的概率模型(TPM)的领域随后发生了,并提出了端流的参数化和学习范式,从而在概率电路的统一概念下产生了广泛而流行的模型类别。从障碍性的角度设计,这些模型可以有效地推断和精确的概率推理,使其适合于要求快速准确计算的任务。但是,
对虚幻刺激的反应。未经适当的治疗,幻觉会导致患者失控。可以给予的非药物疗法之一是表达性写作疗法。目的:本研究旨在确定表达性写作疗法(EWT)在减少听觉幻觉症状中的应用。方法:本研究使用了案例研究设计。数据收集是通过访谈和观察完成的。干预措施进行了9天的治疗和2天的观察。结果:从干预结果中,发现表达性写作疗法(EWT)可以将听觉幻觉量表从24分(在测试前基线值)中降低到测试后的19分。结论:表达性写作疗法(EWT)可以是一种非药物疗法之一,可以作为幻觉患者进行自我表达和幻觉控制的努力。关键字:听觉幻觉,表达写作疗法,精神分裂症
摘要 - 表达机器人行为对于在社交环境中广泛接受机器人至关重要。学习的腿部运动控制器的最新进展已实现了更具动态和多功能的机器人行为。,确定在各种情况下与不同用户互动的最佳行为仍然是一个挑战。当前方法要么依赖于自然语言输入,这是有效但低分辨率的,要么从人类的偏好中学习,尽管高分辨率却是效率低下的样本。本文介绍了一种新的方法,该方法利用了预先训练的LLMS产生的先验,并在偏好学习的精确度上。我们的方法称为语言引导的偏好学习(LGPL),使用LLMS生成初始行为样本,然后通过基于偏好的反馈来完善这些样本,以学习与人类期望紧密相符的行为。我们的核心见解是,LLM可以指导偏好学习的抽样过程,从而实现样本效率的实质性提高。我们证明,LGPL可以快速学习精确和表现力的行为,只有四个查询,既优于纯语言参数模型和传统的偏好学习方法。带有视频的网站:此HTTP URL。
在数字时代,了解网络中信息传播和意见形成的动态至关重要。这项研究介绍了一个创新的框架,该框架通过自动化计划的战略性范围来确定意见动力学的原则。据我们所知,我们已经开发了有史以来第一个用于意见动态的数字PDDL。我们的工具使用户能够可视化复杂的网络,模拟观点的演变,并从战略上影响实现特定外观的进化。通过利用自动化计划技术,我们的框架提供了一种细微的方法,可以设计用于将网络从其当前意见格局转变为所需状态的一系列动作序列。这种整体方法为网络中各个节点的复杂相互作用提供了见解,并为有针对性的Interventions铺平了道路。此外,该工具促进了人类的集合,使用户不仅能够了解信息传播,而且还制定了实用策略,以减轻从中产生的有害结果。演示视频链接-https://tinyurl.com/3k7bp99h
摘要:近年来,研究人员和制造商已开始研究使自动驾驶汽车(AV)与附近的行人互动的方法,以补偿缺乏人类驾驶员的情况。这些努力中的大多数侧重于外部人机界面(EHMI),使用不同的模式,例如光模式或公路预测,以传达AV的意图和意识。在本文中,我们研究了通过EHMIS传达情绪的情感界面的潜在作用。迄今为止,关于情感界面可以在支持AV-Pedestrian相互作用中扮演的角色知之甚少。但是,从家庭同伴到户外空中机器人的许多较小的社会机器人都采用了情绪,以无人机的形式使用。为了为情感AV-Pedestrian界面建立基础,我们回顾了2011年至2021年发表的25篇文章中非人类机器人的情感表达。根据审查的发现,我们提出了一系列设计情感AV-Pedestrian界面的考虑因素,并突出了在未来的研究中调查这些机会的途径。