抽象虚拟现实(VR)是一项允许用户体验模拟真实或虚构场景的多感觉和交互式环境的技术。仍然辩论了不同的VR沉浸式技术神学对心理工作量(MWL)的影响,即执行任务所需的资源数量;但是,从未利用脑电图在这种情况下的潜在作用。本文旨在调查在VR环境中对MWL进行认知任务的影响,这是通过使用多模式的方法进行的,其特征在于以不同程度的沉浸式来进行,这些方法通过生理EEG测量对MWL进行了良好评估的主观评估。提出了基于N-BACK测试的认知任务,以比较使用头部安装显示器(HMD)或桌面计算机展示Stim uli的特定裤子的性能和MWL。任务具有四个不同的复杂度(N¼1或2具有视觉或视觉和听觉刺激)。二十七名健康参与者都参加了这项研究,并在两种情况下都执行了任务。EEG数据和NASA任务负荷指数(NASA-TLX)分别用于评估客观和主观MWL的变化。 错误率(ER)和反应时间(RTS)也针对每个条件和任务水平进行了COL。 任务水平在两种情况下都对MWL产生了重大影响,增加了次级措施和降低性能。 EEG MWL指数显示出显着增加,特别是与休息相比。 不同程度的沉浸式均未显示个人的表现和MWL的显着差异,如主观评分所估计。EEG数据和NASA任务负荷指数(NASA-TLX)分别用于评估客观和主观MWL的变化。错误率(ER)和反应时间(RTS)也针对每个条件和任务水平进行了COL。任务水平在两种情况下都对MWL产生了重大影响,增加了次级措施和降低性能。EEG MWL指数显示出显着增加,特别是与休息相比。 不同程度的沉浸式均未显示个人的表现和MWL的显着差异,如主观评分所估计。EEG MWL指数显示出显着增加,特别是与休息相比。不同程度的沉浸式均未显示个人的表现和MWL的显着差异,如主观评分所估计。但是,在大多数情况下,HMD降低了EEG衍生的MWL,表明较低的认知负载。总而言之,HMD可能会减少某些任务的认知负荷。如脑电图MWL指数所示,MWL的降低水平可能对基于VR的应用程序的设计和未来评估有影响。
抽象虚拟现实(VR)是一项允许用户体验模拟真实或虚构场景的多感觉和交互式环境的技术。仍然辩论了不同的VR沉浸式技术神学对心理工作量(MWL)的影响,即执行任务所需的资源数量;但是,从未利用脑电图在这种情况下的潜在作用。本文旨在调查在VR环境中对MWL进行认知任务的影响,这是通过使用多模式的方法进行的,其特征在于以不同程度的沉浸式来进行,这些方法通过生理EEG测量对MWL进行了良好评估的主观评估。提出了基于N-BACK测试的认知任务,以比较使用头部安装显示器(HMD)或桌面计算机展示Stim uli的特定裤子的性能和MWL。任务具有四个不同的复杂度(N¼1或2具有视觉或视觉和听觉刺激)。二十七名健康参与者都参加了这项研究,并在两种情况下都执行了任务。EEG数据和NASA任务负荷指数(NASA-TLX)分别用于评估客观和主观MWL的变化。 错误率(ER)和反应时间(RTS)也针对每个条件和任务水平进行了COL。 任务水平在两种情况下都对MWL产生了重大影响,增加了次级措施和降低性能。 EEG MWL指数显示出显着增加,特别是与休息相比。 不同程度的沉浸式均未显示个人的表现和MWL的显着差异,如主观评分所估计。EEG数据和NASA任务负荷指数(NASA-TLX)分别用于评估客观和主观MWL的变化。错误率(ER)和反应时间(RTS)也针对每个条件和任务水平进行了COL。任务水平在两种情况下都对MWL产生了重大影响,增加了次级措施和降低性能。EEG MWL指数显示出显着增加,特别是与休息相比。 不同程度的沉浸式均未显示个人的表现和MWL的显着差异,如主观评分所估计。EEG MWL指数显示出显着增加,特别是与休息相比。不同程度的沉浸式均未显示个人的表现和MWL的显着差异,如主观评分所估计。但是,在大多数情况下,HMD降低了EEG衍生的MWL,表明较低的认知负载。总而言之,HMD可能会减少某些任务的认知负担。如脑电图MWL指数所示,MWL的降低水平可能对基于VR的应用程序的设计和未来评估有影响。
数学领域中的学术文章通常包括定理(和其他类似定理的环境)及其证明。本文建立在我们以前的作品[11]的基础上,该论文旨在将科学文献从PDF文章的集合转变为以定理为中心的开放知识基础(KB)。在本文中,我们主要集中于[11]中引入的管道的提取方面。我们深入探索了多种模式方法,并评估了模型的长期段落序列的影响。要澄清,在本文中,我们使用定理的意义与L a t e X中使用的定理相同(例如,按\ new Theorem命令):一个定理的环境是一种结构化的陈述,可能是以特定方式进行编号的,用于以特定的方式进行编号,用于正式(通常是数学)的陈述:也可以代表一个正式的陈述:也可以是empormem,emporm a remem,一个定义,一个定义,一个定义,一个定义,一个定义,一个定义,等等,等等,等等,等等。定理,我们的意思是任何此类陈述。 通过证明,我们的意思是在证明环境中通常在L A T E X中呈现的内容:结果的证明或证明草图。 我们通过根据多模式机器学习来签署一种方法来解决定理 - 防护识别问题,该方法将文章的每个每个款分类为基于科学语言的基本,定理和证明标签,以印刷信息和PDF文档的视觉渲染为基础。 此外,定理,我们的意思是任何此类陈述。通过证明,我们的意思是在证明环境中通常在L A T E X中呈现的内容:结果的证明或证明草图。我们通过根据多模式机器学习来签署一种方法来解决定理 - 防护识别问题,该方法将文章的每个每个款分类为基于科学语言的基本,定理和证明标签,以印刷信息和PDF文档的视觉渲染为基础。此外,
结果:基于临床数据的模型包含年龄,性别和IL-6,而RandomForest算法则达到了最佳学习模型。确定了CT图像的两个关键放射线特征,然后用于建立放射线模型,发现Logistic算法的模型是最佳的。多模型模型包含年龄,IL-6和2个放射线特征,最佳模型来自LightGBM算法。与最佳的临床或放射线学模型相比,最佳的多模型模型具有最高的AUC值,准确性,灵敏度和负预测值,并且在外部测试数据集中还验证了其“优惠性能”(准确性= 0.745,敏感性= 0.900)。此外,多模型模型的性能优于放射科医生,NGS检测和现有机器学习模型的性能,其精度分别为26%,4和6%。
这项工作旨在在教学计划视频的背景下特别了解VideoQa的快速新兴领域。它还鼓励设计可以引起基于编程的自然语言问题的系统的设计。We introduce two datasets: Code- VidQA, with 2,104 question-answer pair with timestamps and links taken from programming videos extracted using Stack Overflow for Pro- gramming Visual Answer Localization task, and CodeVidCL with 4,291 videos (1751 pro- gramming, 2540 non-programming) for Pro- gramming Video Classification task.在广告中,我们提出了一个框架,该框架适应了Bigbird和SVM进行视频分类技术。所提出的方法实现了视频分类的奇特精度为99.61%。
要澄清,在本文中,我们使用定理的意义与L a t e X中使用的定理相同(例如,按\ new Theorem命令):一个定理的环境是一种结构化的陈述,可能是以特定方式进行编号的,用于以特定的方式进行编号,用于正式(通常是数学)的陈述:也可以代表一个正式的陈述:也可以是empormem,emporm a remem,一个定义,一个定义,一个定义,一个定义,一个定义,一个定义,等等,等等,等等,等等。定理,我们的意思是任何此类陈述。 通过证明,我们的意思是在证明环境中通常在L A T E X中呈现的内容:结果的证明或证明草图。 我们通过根据多模式机器学习来签署一种方法来解决定理 - 防护识别问题,该方法将文章的每个每个款分类为基于科学语言的基本,定理和证明标签,以印刷信息和PDF文档的视觉渲染为基础。 此外,我们考虑了有关段落块,归一化的空间坐标和页面编号的序列的信息以及页面断路,以利用一个事实,即段落的标签很大程度上依赖于前面(或以下)的段落。 我们在本文中提供了以下贡献,如图1:(i)定理的三个单峰(视觉,文本,字体,字体,字体,字体信息)模型,用于依靠现代机器学习技术(CNN,变形金刚,LSTMS),重点关注相对于相对于非常大的模型,依靠现代机器学习技术(CNN,变压器,LSTMS);请注意,文本模式方法依赖于预处理我们语料库的语言模型,该模型可能超出了我们的任务。 我们在第2节中介绍了三个单形模型。定理,我们的意思是任何此类陈述。通过证明,我们的意思是在证明环境中通常在L A T E X中呈现的内容:结果的证明或证明草图。我们通过根据多模式机器学习来签署一种方法来解决定理 - 防护识别问题,该方法将文章的每个每个款分类为基于科学语言的基本,定理和证明标签,以印刷信息和PDF文档的视觉渲染为基础。此外,我们考虑了有关段落块,归一化的空间坐标和页面编号的序列的信息以及页面断路,以利用一个事实,即段落的标签很大程度上依赖于前面(或以下)的段落。我们在本文中提供了以下贡献,如图1:(i)定理的三个单峰(视觉,文本,字体,字体,字体,字体信息)模型,用于依靠现代机器学习技术(CNN,变形金刚,LSTMS),重点关注相对于相对于非常大的模型,依靠现代机器学习技术(CNN,变压器,LSTMS);请注意,文本模式方法依赖于预处理我们语料库的语言模型,该模型可能超出了我们的任务。我们在第2节中介绍了三个单形模型。(ii)一个多模式晚期融合模型,结合了所有三种方式的特征。(iii)基于变压器模型的块顺序方法,该方法可用于通过捕获块之间的依赖性来提高任何单峰和多模型模型的表现。(iv)在Arxiv的大约200k英语论文数据集上进行了实验评估,其中一个单独的验证数据集为3.5K论文(总计529K段落块)。然后,我们在第3节中讨论如何将它们组合到多模式模型中,以及如何添加有关块序列信息的支持。我们在第4节中进一步提供了数据集的描述。所有单峰和多模型模型的实验结果均在第5节中列出。这项工作的扩展版本[12]可用,讨论了相关工作,有关不同模型的详细信息和实验。我们还参考第一作者的博士学位论文[10],以了解我们的方法和结果。可以在https://github.com/mv96/ mm_extraction上访问支持本文的代码,数据和模型。
Anthony P. King 1,Scott A. Langenecker 1,Stephanie Gorka 1,Jessica Turner 1,Lei Wang 1,Heather Wastler 1,Canada Keck 2,Randall Olsen 2,Randall Olsen 2,Soledad Fernandez 4,Hyoshin Kim 4,Hyoshin Kim Kim 4,Brett Klarter 4,Brett Klamer 4,Brett Klamine 6,Caleger 6,Caleger 6,Elissarie 7,Elissar and Stacey 7,Stacey L. Melanie Bozzay 1,Susan L. Brown 9,Chris Browning 5,Katie Burkhouse 18,Kathleen Carter 12,Kim M. Cecil 6,Karin Coifman 13,Timothy N. Crawford 10,Jennifer Cheavens 2,Jennifer Cheavens 2,Cory E. Cronin E. Cronin E. Cronin 11,Melissa Delbello 6,Melissa Delbello 6,Stepene for Stemey for Stemey W. Evanne forney forney forney forney forney forney forney forney forney fornee , John Gunstad 13 , Paul J. Hershberger 10 , Kristen R. Hoskinson 14 , Christina Klein 6 , Jose Moreno 1 , Molly McVoy 15 , Paula K. Miller 11 , Eric E. Nelson 14 , Randy Nesse 16 , Chris Nguyen 1 , Kei Nomaguchi 9 , Alissa Paolella 12 , Edison Perdomo 12 , Colin Odden 5 , Martha Sajatovic 15 ,罗伯特·史密斯(Robert Smith 7),乔纳森·特拉特(Jonathan Trauth)12,艾维·TSO 1,Xin Wang 7,Jennifer T.俄亥俄州立大学,俄亥俄州局,俄亥俄州哥伦布市2号俄亥俄州立大学,俄亥俄州立大学,俄亥俄州哥伦布3号俄亥俄州立大学,俄亥俄州立大学,俄亥俄州哥伦布,俄亥俄州4号俄亥俄州立大学,俄亥俄州立大学,生物医学信息学系
多模式大语模型(MLLM)具有复杂的语言和视觉数据表现出了显着的理解和推理能力。这些进步刺激了建立通才的机器人MLLM熟练理解复杂人类指示并完成各种体现任务的愿景。然而,由于机器人平台上可用的计算和内存能力通常有限,为现实世界机器人开发MLLM是具有挑战性的。相比之下,MLLM的推断涉及存储数十亿个Pa-Rameters并执行巨大的计算,并施加了巨大的硬件需求。在我们的论文中,我们试图通过利用有趣的观察来应对这一挑战:相对容易的情况构成了控制机器人以完成各种任务的大部分程序,并且通常需要更小的模型才能获得正确的机器人动作。以这种观察的启发,我们提出了一个d ynally e xit框架,用于r obotot v ision-l an an an an an an an an an an an an a an an an a an an a an a an an a ction模型(deer-vla或Simpple Deer),该模型会根据每个情况自动调整激活的MLLM的大小。该方法利用了MLLM中的多exit档案,该方法一旦在特定情况下激活了模型的适当大小,该模型就可以终止处理,从而避免了进一步的冗余计算。此外,我们开发了建立鹿的早期终止标准的新型算法,以预定义的要求(例如,计算成本)(即,功耗)以及峰值计算消耗(即,延迟)和GPU内存使用量。这些增强功能确保鹿在不同的资源限制下有效运行,同时保持竞争性能。此外,我们设计了一种量身定制的培训方法,用于在此类多EXIT体系结构之上集成时间信息,以合理地进行预先操作。在加尔文机器人操纵基准上,鹿表明,LLM的计算成本显着降低了5.2-6.5倍,而LLM的GPU记忆则在2-6倍中,而不会损害性能。代码和检查点可在https://github.com/yueyang130/deer-vla上找到。
分子nger板,小分子设计的生成方法,11 - 13药理学特性的预测和药物重新利用。13,14药物的临床开发是一种时间和货币消费过程,通常需要数年和十亿美元的预算才能从1期临床试验到患者进行。16最新的神经网络方法和语言模型的使用有可能大大促进药物开发过程。使用多种模型家族提出了许多LMS的生物医学领域:例如,研究人员开发了Biobert,基于BERT,具有1.1亿个参数,并基于T5-Base和T5-Large,分别使用220和77000万个T5-Large,使用生物医学文献,使用了220和77000万个参数。nvidia还使用一组更广泛的PubMed衍生的自由文本在生物医学领域开发了生物长期模型,范围从3.45亿到12亿参数。但是,这些模型中使用的数据集主要涵盖生物医学自然语言文本,并包含生物医学命名的实体,例如药物,基因和细胞系名称,但忽略了以微笑格式的重要化学结构描述。用化学结构丰富生物医学数据集是一项重要且具有挑战性的任务。最近,提出了以最大的设置为1.120亿个参数,基于变压器档案的LMS,基于Transformer Arch-tecture,以及基于T5-碱基和T5-LARGE的MOLT5、20的LMS,以解决此限制。两种模式均通过自然语言和化学数据进行了预训练,创建
。cc-by-nc-nd 4.0国际许可证(未经同行评审证明)获得的是作者/资助者,他授予Biorxiv授予Biorxiv的许可,以永久显示预印本。这是该版本的版权持有人,该版本于2024年3月14日发布。 https://doi.org/10.1101/2024.03.12.584504 doi:Biorxiv Preprint