多模式的

2021-10-11 机构名称:

使用多模式的原位光谱

为了对溶液中的卤化物钙钛矿加工产生详细的理解，在Mapbi 3对Mapbi 3的自旋涂层和插槽-DIE涂层中进行了不同的蒸发速率，以不同的蒸发速率进行了研究。基于光学参数的时间演变，发现两种处理方法最初都形成了溶剂 - 复合结构，然后是钙钛矿结晶。后者分为两个阶段进行自旋涂层，而对于插槽涂层，仅发生一个钙钛矿结晶阶段。对于两种处理方法，发现随着蒸发速率的增加，溶剂复合物结构的结晶动力学和钙钛矿结晶在相对时间尺度上保持恒定，而第二次钙钛矿结晶的持续时间在自旋涂层中增加。第二个钙钛矿结晶由于溶剂 - 复合相形态的差异而受到限制，钙钛矿形成了。工作强调了确切的前体状态特性对钙钛矿形成的重要性。进一步证明，多模式光学原位光谱的详细分析允许对卤化物钙钛矿溶液处理过程中发生的结晶过程进行基本了解，而与特定的处理方法无关。

查看详细

File

2025-01-13 机构名称:

评估2025多模式的评估研讨会...

这项工作旨在在教学计划视频的背景下特别了解VideoQa的快速新兴领域。它还鼓励设计可以引起基于编程的自然语言问题的系统的设计。We introduce two datasets: Code- VidQA, with 2,104 question-answer pair with timestamps and links taken from programming videos extracted using Stack Overflow for Pro- gramming Visual Answer Localization task, and CodeVidCL with 4,291 videos (1751 pro- gramming, 2540 non-programming) for Pro- gramming Video Classification task.在广告中，我们提出了一个框架，该框架适应了Bigbird和SVM进行视频分类技术。所提出的方法实现了视频分类的奇特精度为99.61％。

查看详细

File

2021-07-12 机构名称:

展示多模式的可行性 - NTNU Open

摘要我们开发了一种可穿戴实验传感器装置，其特点是多模态 EEG+fNIRS 神经成像，适用于人类行为与技术交互的现场实验。低成本脑电图 (EEG) 与可穿戴功能性近红外光谱 (fNIRS) 系统相结合，我们将其分为两部分进行介绍。论文 A 详尽描述了设置基础设施、数据同步过程、使用程序（包括传感器应用）以及如何确保高信号质量。本文（论文 B）展示了该装置在三个不同用例中的可用性：传统的人机交互实验、参与者在城市和高速公路上驾驶汽车的现场驾驶实验以及现场阿斯汤加瑜伽练习。我们展示了来自高度生态有效的实验装置的认知负荷数据，并讨论了经验教训。这些包括可接受和不可接受的人工制品、数据质量以及可以使用该装置进行调查的构造。关键词：EEG+fNIRS、现场实验、设计中的人类行为、以用户为中心的设计、研究方法和方法联系人：Dybvik，Henrikke 挪威科技大学机械与工业工程系挪威 henrikke.dybvik@ntnu.no

查看详细

File

2024-05-31 机构名称:

多模式的天然和化学语言基础模型

分子nger板，小分子设计的生成方法，11 - 13药理学特性的预测和药物重新利用。13,14药物的临床开发是一种时间和货币消费过程，通常需要数年和十亿美元的预算才能从1期临床试验到患者进行。16最新的神经网络方法和语言模型的使用有可能大大促进药物开发过程。使用多种模型家族提出了许多LMS的生物医学领域：例如，研究人员开发了Biobert，基于BERT，具有1.1亿个参数，并基于T5-Base和T5-Large，分别使用220和77000万个T5-Large，使用生物医学文献，使用了220和77000万个参数。nvidia还使用一组更广泛的PubMed衍生的自由文本在生物医学领域开发了生物长期模型，范围从3.45亿到12亿参数。但是，这些模型中使用的数据集主要涵盖生物医学自然语言文本，并包含生物医学命名的实体，例如药物，基因和细胞系名称，但忽略了以微笑格式的重要化学结构描述。用化学结构丰富生物医学数据集是一项重要且具有挑战性的任务。最近，提出了以最大的设置为1.120亿个参数，基于变压器档案的LMS，基于Transformer Arch-tecture，以及基于T5-碱基和T5-LARGE的MOLT5、20的LMS，以解决此限制。两种模式均通过自然语言和化学数据进行了预训练，创建

查看详细

File

2024-01-11 机构名称:

PhysioLabXR：一个用于实时、多模式的 Python 平台……

近年来，人们对神经科学和人机交互 (HCI) 中的多模态实验越来越感兴趣，这些实验通常涉及闭环交互系统。许多新兴范式在扩展现实 (XR) 环境中找到了新的根源，包括虚拟现实 (VR) 和增强现实 (AR)。此类实验越来越多地融合多种模态并结合不同的生理测量。例如，一个传感器可以生成事件以从其他传感器中提取有意义的数据间隔，例如注视相关电位 (FRP) 研究，其中 EEG 时期锁定到眼动仪的视觉注视（Nikolaev 等人，2016 年）。还可以组合多种生理信号以增强其预测能力，以用于从情绪识别（He 等人，2020 年；Koelstra 等人，2011 年）到通过感觉运动节律进行运动驱动（Sollfrank 等人，2016 年）等应用。此外，多模态范式可以促进探索不同的生理系统如何相互作用；例如，瞳孔扩张可作为通过功能性磁共振成像（fMRI；Murphy 等人，2014）测量的蓝斑活动的替代。

查看详细

File

2023-01-28 机构名称:

多模式的大脑信号复杂性预测人类智力

自发的大脑活动为外部需求期间人类认知处理的基础奠定了基础。基于功能磁共振成像（fMRI）的神经影像学研究确定了自发（内在）脑动力学的特定特征，这些特征与一般认知能力的个体差异相关，即智力。然而，fMRI研究本质上受到时间分辨率低的限制，因此阻止了关于毫秒内神经波动的结论。在这里，我们使用了来自144名健康成年人的静止状态脑电图（EEG）录音（EEG）录音，以测试是否可以从智力上的个体差异（Raven的先进的渐进式矩阵得分）来预测，可以从时间上高度分辨的内在脑脑sig-nals的复杂性中预测。我们比较了大脑信号复杂性的不同操作（多尺度熵，香农熵，模糊熵和微骨与智能关系的特定特征）。结果表明，大脑信号复杂性度量与智力之间的关联具有较小的效应大小（R; 0.20），并且在不同的空间和时间尺度上有所不同。具体来说，较高的智力得分与神经处理的局部方面的复杂性较低，而属于默认模式网络的任务阴性大脑区域的活动较少。最后，我们结合了大脑信号复杂性的多个测量方法，以表明可以通过样品中的多模式（10倍交叉验证）以及在独立的样品（外部复制，n = 57）中进行多模型的多模型来显着预测单个智力得分。总的来说，我们的结果强调了智力和内在的大脑动力学之间关联的时间和空间依赖性，并提出mul-timodal方法是对复杂人类特征的未来神经科学研究的有希望的手段。

查看详细

File

2024-02-27 机构名称:

人工智能从chatgpt到自主代理人和多模式的可能性

•1个字节= 0.001千字节（kb）•1千键（kb）= 1 kb•1兆字节（MB）= 1,000 kb•1千兆字节（GB）= 1,000,000 kb•1吨Exabyte（EB）= 1,000,000,000,000,000 kb

查看详细

File

2024-11-05 机构名称:

deer-vla：多模式的大型语言模型的动态推断，以实现机器人的执行

多模式大语模型（MLLM）具有复杂的语言和视觉数据表现出了显着的理解和推理能力。这些进步刺激了建立通才的机器人MLLM熟练理解复杂人类指示并完成各种体现任务的愿景。然而，由于机器人平台上可用的计算和内存能力通常有限，为现实世界机器人开发MLLM是具有挑战性的。相比之下，MLLM的推断涉及存储数十亿个Pa-Rameters并执行巨大的计算，并施加了巨大的硬件需求。在我们的论文中，我们试图通过利用有趣的观察来应对这一挑战：相对容易的情况构成了控制机器人以完成各种任务的大部分程序，并且通常需要更小的模型才能获得正确的机器人动作。以这种观察的启发，我们提出了一个d ynally e xit框架，用于r obotot v ision-l an an an an an an an an an an an an a an an an a an an a an a an an a ction模型（deer-vla或Simpple Deer），该模型会根据每个情况自动调整激活的MLLM的大小。该方法利用了MLLM中的多exit档案，该方法一旦在特定情况下激活了模型的适当大小，该模型就可以终止处理，从而避免了进一步的冗余计算。此外，我们开发了建立鹿的早期终止标准的新型算法，以预定义的要求（例如，计算成本）（即，功耗）以及峰值计算消耗（即，延迟）和GPU内存使用量。这些增强功能确保鹿在不同的资源限制下有效运行，同时保持竞争性能。此外，我们设计了一种量身定制的培训方法，用于在此类多EXIT体系结构之上集成时间信息，以合理地进行预先操作。在加尔文机器人操纵基准上，鹿表明，LLM的计算成本显着降低了5.2-6.5倍，而LLM的GPU记忆则在2-6倍中，而不会损害性能。代码和检查点可在https://github.com/yueyang130/deer-vla上找到。

查看详细

File

2025-02-12 机构名称:

基于多模式的基于机器学习模型，用于区分非结核分枝杆菌与结核分枝杆菌

结果：基于临床数据的模型包含年龄，性别和IL-6，而RandomForest算法则达到了最佳学习模型。确定了CT图像的两个关键放射线特征，然后用于建立放射线模型，发现Logistic算法的模型是最佳的。多模型模型包含年龄，IL-6和2个放射线特征，最佳模型来自LightGBM算法。与最佳的临床或放射线学模型相比，最佳的多模型模型具有最高的AUC值，准确性，灵敏度和负预测值，并且在外部测试数据集中还验证了其“优惠性能”（准确性= 0.745，敏感性= 0.900）。此外，多模型模型的性能优于放射科医生，NGS检测和现有机器学习模型的性能，其精度分别为26％，4和6％。

查看详细

File

2024-03-12 机构名称:

神经：一种多模式的方法，用于生成硅中的新蛋白质变体

。cc-by-nc-nd 4.0国际许可证（未经同行评审证明）获得的是作者/资助者，他授予Biorxiv授予Biorxiv的许可，以永久显示预印本。这是该版本的版权持有人，该版本于2024年3月14日发布。 https://doi.org/10.1101/2024.03.12.584504 doi：Biorxiv Preprint

查看详细

XiaoMi-AI文件搜索系统

多模式的

使用多模式的原位光谱

评估2025多模式的评估研讨会...

展示多模式的可行性 - NTNU Open

多模式的天然和化学语言基础模型

PhysioLabXR：一个用于实时、多模式的 Python 平台……

多模式的大脑信号复杂性预测人类智力

人工智能从chatgpt到自主代理人和多模式的可能性

deer-vla：多模式的大型语言模型的动态推断，以实现机器人的执行

基于多模式的基于机器学习模型，用于区分非结核分枝杆菌与结核分枝杆菌

神经：一种多模式的方法，用于生成硅中的新蛋白质变体

按机构统计排名前十媒体

按照发布年份统计数据

XiaoMi-AI