自动语音识别(ASR)系统近年来见证了显着的进步。上下文化的ASR任务需要识别语音不是孤立的话语,而是在更广泛的情况下。常规方法经常采用第二通范式来重新排列初始转录,但它们有可能在候选假设中遇到预测错误,从而损害了识别精度。在这项研究中,我们引入了一个新颖的框架,该框架与典型的第二频繁撤退方法不同。给出了n-最佳假设,我们利用大型语言模型来提示上下文化的第二通过。除了追求更高的准确性外,我们还旨在探索性能边界,而无需实质上改变潜在的预培训的语言和语言模型。我们通过零拍的提示和战略性的低级适应调整来提高所提出的范式的有效性。在多个价值的口语阅读理解基准基准SRC上,促使模型和微调模型的表现优于1好的ASR假设,分别达到了13.6%和45.9%的明显相关性单词错误率(WER)改善。结果表明,提出的方法增强了转录准确性和上下文理解。
(1)有限的现实世界上下文。现有系统通常支持链接到AR中虚拟对象的动作触发器,但缺乏对现实世界上下文信息的支持(例如,,一种虚拟玩具机器人,穿越木材,地毯或玻璃等多样化的室内表面。(2)有限的交互规范。现有系统仅提供预定义的交互触发器,例如“ TAP”和“接口输入”。这限制了创建者在提供的选项之外指定交互的能力,尤其是涉及环境环境的选项(例如,用户在现实世界中“幻灯片”虚拟粉笔在现实世界黑板上滑动)。(3)有限的声音来源。现有系统受其图书馆中可用的声音资产的限制以及在线合适的声音资源的稀缺性。因此,AR的作者努力为不同的AR事件找到适当的声音(例如,复制虚拟蜻蜓的翅膀颤动或模拟虚拟恐龙的饮食声音)。
我们目前正在见证迷幻研究的复兴;如此之多,以至于这样的短语开始感觉到铂。有些人将目前的复兴称为“第三波”(Austin等人2017),因为这不是第一次迷幻的心理学和精神病学领域(Carhart-Harris and Goodwin,2017年),而某些本地文化(最著名的是在美洲)自古以来就庆祝了它们的影响(Labate,2014年; Labate和Cavnar,2016年)。鉴于当前迷幻研究的氛围的有前途的性质,引起人们对潜在陷阱的关注是明智的,以防止它们。本文的主要假设是,迷幻的动作从根本上依赖于心理和环境意义上的上下文。有人认为,忽视上下文可能会使迷幻的经历不仅在临床上无效,而且可能有害 - 部分会计,部分原因是仍然会束缚这些药物的负面污名(Erritzoe等人,2017年; Erritzoe和Richards,2017年)。1
摘要。背景意识和场景理解是计算机辅助和机器人手术中智能系统开发的组成部分。尽管大多数系统主要利用视觉数据进行场景理解,但最新的概念证明已展示了声学的大量,用于检测和分析与典型的噪声排放相关的手术活动。但是,尚未有效地用于手术中的定位任务,这对于获得对场景的全面理解至关重要。在这项工作中,我们介绍了可以揭示声学活动及其在手术领域的位置的新型声源定位概念(SSL),因此提供了对患者和医疗设备的外科手术人员的相互作用的见解。我们通过在两个概念验证本地化任务中使用声学摄像头解释声音活动热图,表明了这一概念的潜力。对于对象检测任务,我们以86.07%的0.5 IOU实现AP,平均欧几里得距离为13。70±14。65个PX在图像分辨率为1100x825 PX的图像分辨率,用于关键点检测任务。基于这些结果,我们认为声学事件的本地化具有外科手术理解的巨大潜力,为未来手术室中的多模式感应解决方案打开了许多新的研究方向。据作者的最佳知识,这是在医学背景下利用SSL的第一项作品。
我们感谢ERGA SSP委员会的所有成员和委员会的会议参与者40对SSP和ERGA任务的支持。尤其要感谢Copo的Alice Minotto和Felix 41 Shaw,Ebi/Embl的Josephine Burgin和Joana Pauperio,以及Luisa 42 Marins(Leibniz动物园和野生动物园研究所),以帮助实施43 ERGA宣言。我们感谢Darwin Life Project的样本工作组,以在元数据收集和标准上进行44次富有成果的交流。我们感谢Erga的数据分析45委员会访问图1中使用的问卷数据。我们承认ERGA PILOT项目协调47团队的成员Giulio Formenti和Alice Mouton的基本工作,通过为这项工作做出贡献,以构建必要的样本元数据48收集基础设施,包括ERGA SUPTEST 49 PROCEST 49 PROCTEST GITHUB ESTERTER ERATER ERATER ERATER ERATER ERATER ERATER ERISTA和ER ERATER ERATER ERATER ER ORERATER ER ORFORT ER ORERATER ER ERISTARES以及他们的ERS努力提供努力,从而使这项工作成为可能。我们特别感谢Erga Chairs 51在ERGA建立阶段的富有成果的交流及其持续的支持。52 R. Oomen was supported by the James S. McDonnell Foundation 21st Century Postdoctoral 53 Research Fellowship, the Natural Sciences and Engineering Research Council of Canada 54 Postdoctoral Research Fellowship, and the Research Council of Norway (Earth BioGenome 55 Project Norway; Project no.326819)。R.Fernández认可以下56个资金来源的支持:RamónY Cajal奖学金(授予协议号 948281)。R.Fernández认可以下56个资金来源的支持:RamónY Cajal奖学金(授予协议号948281)。RYC-2017-22492由McIn/AEI/AEI/10.13039/501100011033和ESF资助57,ESF和“未来投资”),PID2019-58 108824GA-I00资助了McIn/10.13039/501100011033,在欧洲欧盟的20日,由MCIN/AEI/AE IN CORMINE COUNTING MCIN/AEIS INCOM INCOR IER CORNION(ERC)。和创新60计划(授予协议号O. Vinnere Pettersson得到RFI/VR和61 Science for Sweden的Science。S. McTaggart was supported by the Biotechnology and 62 Biological Sciences Research Council (BBSRC), part of UK Research and Innovation, through 63 the Core Capability Grant BB/CCG1720/1 and the Earlham Institute Strategic Programme 64 Grant Decoding Biodiversity BBX011089/1 and BBS/E/ER/230002B.J. Melo-Ferreira 65承认FCT,FCT,FUNDAçãoParaaciênciae a tecnologia 66(2021.00150.Ceecind合同和Project HybridChange,ptdc/bia-evl/bia-evl/1307/2020T. H. Struck承认挪威68研究委员会的资金(项目编号300587)。69A.Böhne感谢德国研究基金会DFG的支持(赠款数字70 DFG 497674620和DFG 492407022)和莱布尼兹协会。71A.Böhne,R。Monteiro,R。Oomen,T。Struck,R。Fernandez,S。Mctaggart,J。Melo-Ferreira,J.72 A. Leonard和O. Vinnere Pettersson由Horizon Europe在生物多样性,73循环经济和环境下资助(Rea.B.3);由瑞士国家秘书处共同资助了74份教育,研究与创新(SERI)的合同编号22.00173;并由英国75研究与创新(UKRI)在商业,能源和工业76战略的Horizon Europe担保计划下。72 A. Leonard和O. Vinnere Pettersson由Horizon Europe在生物多样性,73循环经济和环境下资助(Rea.B.3);由瑞士国家秘书处共同资助了74份教育,研究与创新(SERI)的合同编号22.00173;并由英国75研究与创新(UKRI)在商业,能源和工业76战略的Horizon Europe担保计划下。我们还要承认生物多样性基因组学计划的77个贡献,这些计划贡献了有关其78
摘要。利用大型视觉模型(VLM)的有效表示来完成各种下游任务,引起了人们越来越多的关注。在该研究领域中,软提示学习已成为有效地适应VLM(例如剪辑)的代表性方法,例如图像分类。但是,大多数现有的及时学习方法都学习无法解释的文本令牌,这些文本令牌无法满足医疗保健等高风险场景中可解释的人工智能(XAI)的严格解释性要求。为了解决这个问题,我们提出了一个新颖的可解释的提示学习框架,该框架通过在多个差异方面对齐图像,可学习的提示和临床概念驱动的提示来利用医学知识。此外,我们的框架通过从大型语言模型中引起知识来解决缺乏宝贵的概念注释,并为提示提供了视觉和文字解释。在各种数据集上进行的广泛的实验和可解释性分析,有或没有概念标签,表明我们的方法同时实现了卓越的诊断性能,灵活性和解释性,并阐明了基础模型在促进XAI方面的有效性。该代码可在https://github.com/tommy-bie/xcoop上找到。
机器学习算法现在能够执行先前由人类专家进行的评估(例如,医学诊断)。我们应该如何概念化人类评估和算法之间的差异,以及一个人何时偏爱另一个人?我们提出了一个框架,以检查两种评估形式之间的一个关键区别:机器学习算法是标准化的,修复了一组共同的协变量,以评估所有个人,而人类评估者则自定义了哪些协方差将获得每个人的协变量。我们的框架在具有高维数据的环境中定义和分析了这种自定义的优势(上下文的价值)。我们表明,除非代理对协变量的联合分布有精确的知识,否则其他协变量的好处通常超过上下文的价值。
摘要 - 测量机器人系统的总体自主分数需要组合系统的一组相关方面和特征,这些方面和特征可能以不同的单位,定性和/或不一致来测量。在本文中,我们建立在现有的非上下文自治框架的基础上,该框架衡量并结合了系统的自治级别和组件性能作为整体自主分数。我们检查了几种组合特征的方法,显示了某些方法如何找到相同数据的不同排名,并采用加权产品方法来解决此问题。此外,我们介绍了非上下文自主权坐标,并代表具有自主距离的系统的整体自主权。我们将我们的方法应用于一组七个无人机系统(UAS),并获得其绝对自主分数以及相对于最佳系统的相对得分。
气候变化的幽灵困扰了加拿大政治和经济,并且在农业中,加拿大总温室气体排放的很大比例已成为对农业政策的重要影响。在农业政策讨论中,与气候变化相关的冲突维度有很多。加拿大的农业是温室气体的重要发射极(包括在内的农场加热时约10%);它也是碳的主要隔离剂。农业在很大程度上免于碳税;然而,与加拿大竞争对手相对于没有碳税的竞争力负担的任何碳税(直接与农场建筑物的谷物干燥或加热,或间接使用),这列出了成本竞争力负担的前景,并且在农业社区中具有敏感性。即使没有征收碳税,我们也有自愿目标 - 例如肥料GHG排放,或最近提出的牲畜甲烷方案。