“自然语言处理,数字人文科学和语料库语言学的学术社区将受益于对彼此领域的更深层次的互动和意识”(Jenset和McGillivray 2017:125,137)
抽象的说话者使用韵律来解决歧义,但是如果韵律不能做出区分,该怎么办?我们探讨了(1)说话者如何采用韵律和手势提示来处理含义模棱两可的句子,以及(2)对歧义性提供有关交流效率和努力的视听性解决方案的见解。三十二名中国人被要求阐明22个模棱两可的普通话句子。一半可以使用韵律在语义上进行区分,而一半则不能。首先,参与者自发地阐明了所有模棱两可的句子,并向同盟国提供了解释,并揭示了他们的主要解释。其次,参与者每次都以暗示不同含义的提示指导,参与者两次表达了相同的模棱两可的句子。参与者的韵律提示和手势进行了编码和分析。结果表明,对于可以韵律区分的模棱两可的句子,参与者采用了各种韵律提示,例如暂停,音调,压力和口语率。此外,有51.85%的句子伴随着参考(标志性的指向)手势,而17.33%的句子伴随着非援助(Beat;互动)手势。然而,当韵律提示无法标记歧义时,参与者采取了更多的参考手势(97.30%),但非指南的手势却更少(1.28%)。总而言之,说话者采用多模式的方法来提高交流效率,而模式之间存在权衡。索引术语:韵律,手势,中文,权衡假设,多模式歧义,沟通效率和努力
第14081号行政命令“推进生物技术和生物制造创新,以实现可持续,安全和安全的美国生物经济”(E.O.14081)认识到支持安全创新的监管过程的重要性。E.O.第8节 14081要求在监管过程中需要清晰和效率,并要求其第一步,即农业部长,环境保护署的管理人员和食品药品监督管理局的专员确定在2017年在2017年更新以更新的监管框架的领域,以供大约人法规的协调框架进行更新。 与科学技术政策办公室(OSTP)协商的三个机构选择开始该过程,并向公众索取信息(RFI),从2022年12月15日至2023年2月3日开放。。E.O.第8节14081要求在监管过程中需要清晰和效率,并要求其第一步,即农业部长,环境保护署的管理人员和食品药品监督管理局的专员确定在2017年在2017年更新以更新的监管框架的领域,以供大约人法规的协调框架进行更新。与科学技术政策办公室(OSTP)协商的三个机构选择开始该过程,并向公众索取信息(RFI),从2022年12月15日至2023年2月3日开放。具体来说,RFI要求所有有关方面回答七个关键问题:
数据不平衡,也称为数据的长尾分布,是数据驱动模型的重要挑战。在“意义上的歧义”(WSD)任务中,单词感官分布的长尾现象更为普遍,这使得很难有效地表示和识别长尾感官(LTSS)。因此,探索不严重依赖训练样本量的表示形式是对抗LTSS的重要方法。考虑到许多新状态,即叠加状态,可以从量子力学中的几个已知状态构建,因此超级态态提供了从从较小的样本量中学到的下较低表示中获得更准确的表示的可能性。受量子叠加状态的启发,提出了一种在希尔伯特空间中的表示方法,以赋予对大样本量的依赖性,从而使LTSS对抗。理论上证明了该方法的正确性,并在标准WSD评估框架下验证其有效性并获得最新性能。fur-hoverore,我们还测试了构建的LT和最新的跨语言数据集,并取得了令人鼓舞的结果。
在高峰时段,一名行人穿过一条街道,经常看起来并听潜在的危险。当他们听到几个不同的角时,他们将鸣喇叭的汽车定位,并决定是否需要修改其运动计划。行人如何使用此听觉信息在视觉空间中挑选相应的汽车?这样的分布式表示形式的集成称为分配问题,必须解决它以在跨感觉模态范围内整合不同的表示形式。在这里,我们识别并分析了分配问题的解决方案:在相关大脑区域成对的一个或多个常见刺激特征(例如,在视觉和听觉系统中都表示对汽车空间位置的估计。我们表明该解决方案的可靠性如何取决于刺激集的不同特征(例如,集合的大小和刺激的复杂性)以及分裂代表的细节(例如,每个刺激表示的精度和重叠信息的量和重叠信息的量)。接下来,我们在生物学上合理的接收场代码中实现了该解决方案,并显示该代码使用的神经元和尖峰数量的约束迫使大脑在局部和灾难性错误之间进行权衡。我们表明,当有许多尖峰和神经元可用时,尽管有分配错误的风险,但在多个大脑区域中代表单个感觉方式的刺激可以更可靠地完成。最后,我们表明,即使以两种不同的表示格式接收输入,馈送神经网络也可以学习对分配问题的最佳解决方案。我们还讨论了有关人类工作记忆文献中分配错误的相关结果,并表明我们理论的几个关键预测已经得到支持。
心理语言学研究使用眼动追踪来表明多义词与同音词的消歧方式不同,歧义动词的消歧方式与歧义名词不同。组合分布语义学的研究使用余弦距离来表明动词在主语和宾语的上下文中比单独使用时更有效地消歧。这两个框架都一次关注一个歧义词,都没有考虑包含两个(或更多)歧义词的歧义短语。我们借用了量子信息论、默认语境性框架和语境影响程度的方法和指标,并研究英语的歧义主谓和动宾短语,其中主语/宾语和动词都是歧义的。我们表明,可以使用上下文影响程度的平均值来建模歧义动词和歧义名词的处理差异,以及同音词和多义词和动词的不同歧义程度之间的差异。