对话角色对语音 AI 和人类对话者语音对齐的影响 标题:角色和对话者影响对齐 Georgia Zellou、Michelle Cohn 和 Tyler Kline 语音实验室,加利福尼亚大学戴维斯分校语言学系 469 Kerr Hall,One Shields Ave.,戴维斯,CA 95616,美国 通讯作者电子邮件:gzellou@ucdavis.edu 摘要 两项研究调查了对话角色对人类和语音 AI 对话者语音模仿的影响。在单词列表任务中,给予者指示接收者将单词放在两个列表中的哪一个上;这个对话任务类似于用户与语音 AI 系统进行的简单口头交互。在地图任务中,参与者与对话者一起完成填空工作表,这是一项更复杂的交互任务。参与者与两个对话者完成了两次任务,一次作为信息提供者,一次作为信息接收者。通过相似性评级评估语音对齐,并使用混合效应逻辑回归进行分析。在单词列表任务中,参与者在更大程度上仅与人类对话者保持一致。在地图任务中,仅作为给予者的参与者更多地与人类对话者保持一致。结果表明,语音对齐由对话者的类型介导,并且对话角色的影响因任务和对话者而异。关键词:语音对齐、语音-AI、人机交互、对话角色
作者:WC Wells · 2023 年 — 但她对这一点进行了反复阐述,在整本书中经常重申自己的论点,以反驳一个假设的对话者 — — 这个对话者可能并不存在……
我们的工作是在自动说话人识别的背景下。我们认为该领域的研究可以分为两类。第一组包括在自动语音识别背景下开发或验证的技术的实现,例如动态规划、隐马尔可夫模型或神经网络。这些方法隐式地使用了对话者可变性。第二类包括试图从语音信号中提取最能描述说话者的声学和语音参数的研究。这些研究试图明确地利用对话者之间的差异和说话者自身的差异。我们的工作属于后一类。
良好的沟通是指说话者传达的信息得到对话者的认可,并且说话者和对话者都对他们共同做的事情感到满意。因此,礼貌和语言是密不可分的。礼貌不仅体现在举止上,也体现在语言的使用上。人们在交流过程中通常采用积极和消极的礼貌策略。通过了解这两种策略,人们能够更好地在社会中互动。本研究调查了电影《每一次觉醒的呼吸》中的角色如何实施积极礼貌和消极礼貌策略,以及主要采用哪些策略。数据取自角色的话语。我们使用了记录和观察方法,并借助笔记技术来获取数据。使用混合方法来呈现分析。结果表明,角色(即阿比盖尔/莉兹、马克和索菲)采用了九种类型的积极礼貌策略。主要使用的积极礼貌策略是策略 4:[使用团体内身份标记]。另一方面,我们确定了角色所采用的五种消极礼貌策略。本研究的结论是,在总共 24 句话语中,有 17 句(70,83%)采用了积极礼貌策略,而 8 句(29,17%)则反映了消极礼貌策略。积极礼貌策略的占主导地位表明电影中对话者之间的社会关系密切且团结一致。
在文献中,已经开发了几个项目来可视化大脑活动,并且已经提出了许多基于行为特征预测 fMRI 信号的工作(Mitchell 等人,2008 年;Huth 等人,2016 年;Knops 等人,2009 年)。但是,我们没有找到提供工具来一起显示非控制对话的大脑活动预测、此预测中使用的原始材料以及用于这些预测的特征的工作。在本文中,我们解决了这个问题,并提出了一种用于预测和可视化对话期间局部大脑活动的新工具。它由两个模块组成,第一个模块用于根据对话的原始行为数据生成预测。它包括参与者和对话者的音频、对话者的视频和参与者的眼球运动记录。第二部分用于根据获得的预测可视化对话过程中大脑区域的激活情况。
1 本元分析研究中的感知是指对来源、信息和互动的感知。2 Sundar 和 Lee (2022) 的原始类型学包括四个类别:创作者、策展人、对话者和合著者。合著者类别涉及人工智能和人类作者之间的合作(例如自动完成)。本研究比较了人工智能和人类在独立履行沟通者角色时的说服力。合著者类别是
1 本元分析研究中的感知是指对来源、信息和互动的感知。2 Sundar 和 Lee (2022) 的原始类型学包括四个类别:创作者、策展人、对话者和合著者。合著者类别涉及人工智能和人类作者之间的合作(例如自动完成)。本研究比较了人工智能和人类在独立履行沟通者角色时的说服力。合著者类别是
摘要。社会机器人在公共服务环境中变得越来越可感知。对于让人们在自然环境中吸引人们进行平稳的社交互动以及用户接受是未来成功的人类机器人互动(HRI)的重要问题。口头交流的类型在这里具有特殊的意义。在本文中,我们研究了与标准语言相比,非标准 /区域语言的口语品种的影响。更确切地说,我们将人类对话与人形社会机器人胡椒粉进行了比较,一方面,机器人用高德语回答,另一方面用低德国人回答,这种区域语言是一种被理解的区域语言,在德国北部仍在某种程度上说。机器人所说的内容在两个变体中保持不变。我们对这两种不同的机器人谈话方式对人类对话者的影响感兴趣,这些对话者或多或少地熟悉了低熟悉的德国人,以感知的温暖,能力和可能的不适感在与文化认同背景的对话中。为了衡量这些因素,我们使用机器人社会属性量表(ROSA)对17名参与者的年龄范围从19至61岁。我们的结果表明,在低调的对话中,人们可以看到更高的温暖感。