将于4月29日至5月31日进行2024 HWT春季预测实验(SFE 2024),EFP的基石。这将是面对面和虚拟参与的第二个混合实验。相对于去年的混合实验,SFE 2024将具有类似的格式,所有参与早晨和下午预测活动的参与者以及第二天的模型评估活动。此外,将有一个小型的晚间活动,其中2-4个NWS预测者将发出实验性0-1和1-2 h提前时间预测,直到下午8点CDT。与往年一样,我们的大量合作者贡献了一套新的和改进的实验CAM指导,将在这些预测和模型评估活动中至关重要。这些贡献包括一个合奏框架,称为社区利用统一的合奏(线索; Clark等2018)。2024线索是通过使用通用模型规范(例如,网格间距,模型版本,域大小,后处理等)构建的在可能的情况下,可以在精心设计的受控实验中使用每组贡献的模拟。这种设计将再次使我们能够进行几项针对确定确定性凸轮和凸轮合奏的最佳配置策略的实验。2024线索包括34名成员。SFE 2024还将继续测试WARN-FORECAST系统(WOFS,以下称),该系统产生18人,3公里的网格间隔预测,并将在第8年使用,以发行很短的交付时间和产品。
摘要。脑病变分割在神经学研究和诊断中起着至关重要的作用。由于脑病变可能是由各种病理改变引起的,不同类型的脑病变往往在不同的成像模式下表现出不同的特征。由于这种复杂性,脑病变分割方法通常以特定任务的方式开发。针对特定的病变类型和成像方式开发特定的分割模型。然而,使用特定任务的模型需要预先确定病变类型和成像方式,这使得它们在现实世界场景中的部署变得复杂。在这项工作中,我们提出了一个通用的 3D 脑病变分割基础模型,它可以自动分割不同类型的脑病变,以适应各种成像方式的输入数据。我们制定了一个新颖的混合模态专家 (MoME) 框架,其中多个专家网络负责不同的成像方式。分层门控网络结合了专家预测并促进了专业知识协作。此外,我们在训练过程中引入了课程学习策略,以避免每个专家网络退化并保持其专业化。我们在九个脑损伤数据集上评估了所提出的方法,涵盖了五种成像方式和八种损伤类型。结果表明,我们的模型优于最先进的通用模型,并为未知数据集提供了有希望的泛化能力。
摘要:脑肿瘤是细胞发育不正常的结果。它是全球成年人死亡的主要原因。早期发现脑肿瘤可以避免许多死亡。用于早期脑肿瘤诊断的磁共振成像(MRI)可以提高患者的生存机会。诊断脑肿瘤的最常用方法是 MRI。MRI 中恶性肿瘤的可见性提高使治疗更容易。脑癌的诊断和治疗取决于其识别和治疗。过去十年中提出了许多深度学习模型,包括 Alexnet、VGG、Inception、ResNet、DenseNet 等。所有这些模型都是在庞大的数据集 ImageNet 上训练的。这些通用模型具有许多参数,在针对特定问题实施这些模型时,这些参数变得无关紧要。本研究使用自定义深度学习模型对脑部 MRI 进行分类。提出的疾病和空间注意力模型(DaSAM)有两个模块; (a) 疾病注意模块 (DAM),用于区分图像的疾病区域和非疾病区域;(b) 空间注意模块 (SAM),用于提取重要特征。所提出的模型的实验在两个公开的多类数据集 Figshare 和 Kaggle 数据集上进行,分别达到了 99% 和 96% 的准确率。所提出的模型还使用跨数据集验证进行了测试,在 Figshare 数据集上训练并在 Kaggle 数据集上验证时达到了 85% 的准确率。DAM 和 SAM 模块的结合实现了特征映射功能,这对于在模型的决策过程中突出显示重要特征非常有用。
我们开发了一个具有 SU ( d ) 对称性的 S n -等变卷积量子电路的理论框架,该框架建立在 Jordan 的置换量子计算形式主义之上,该形式主义基于连接 SU ( d ) 和 S n 对量子比特作用的 Schur-Weyl 对偶,并对其进行了显著推广。具体而言,我们利用 Okounkov-Vershik 方法证明了 Harrow 关于 SU ( d ) 和 S n irrep 基之间等价性的陈述,并使用 Young-Jucys-Murphy 元素建立了 S n -等变卷积量子交替分析 (S n -CQA)。我们证明 S n -CQA 能够在任何给定的 S n irrep 区段中生成任何幺正,这可以作为具有 SU ( d ) 对称性的大量量子机器学习问题的通用模型。我们的方法提供了另一种方法来证明量子近似优化算法的普遍性,并验证了四局部 SU ( d ) 对称幺正足以构建通用 SU ( d ) 对称量子电路,直至相对相位因子。我们提出数值模拟来展示在矩形和 kagome 晶格上寻找 J 1 - J 2 反铁磁海森堡模型基态能量的假设的有效性。我们的工作首次将著名的 Okounkov-Vershik S n 表示理论应用于量子物理和机器学习,由此提出了量子变分分析,强烈表明该分析在针对特定优化问题进行经典处理时是不可解决的。
摘要MEDVQA-GI挑战挑战解决了AI驱动的文本对象生成模型在医学诊断中的集成,旨在通过合成图像生成来增强诊断能力。现有方法主要集中于静态图像分析,并且缺乏文本描述中医学图像的动态生成。本研究打算通过引入基于微调生成模型的新方法来部分缩小这一差距,以从文本描述中生成动态,可扩展和精确的图像。尤其是,我们的系统集成了微调的稳定扩散和Dreambooth模型,以及低级适应(LORA),以生成高保真的医学图像。问题是两个子任务,即:图像合成(IS)和最佳提示生产(OPG)。前者通过口头提示创建医学图像,而后者提供了在指定类别中产生高质量图像的提示。这项研究强调了传统医学图像生成方法的局限性,例如手绘,限制数据集,静态程序和通用模型。我们的评估措施表明,稳定的扩散在产生高质量,多样化的图像方面超过了夹子和Dreambooth + Lora。具体来说,稳定的扩散的限制距离(FID)得分最低(单中心为0.099,多中心为0.064,合并为0.067),表明图像质量更高。此外,它的平均成立得分最高(所有数据集中为2.327),表明了异常的多样性和质量。这进展了AI驱动的医疗诊断领域。未来的研究将集中于模型炼油,数据集扩展和道德考虑,以有效地将这些进步实施到临床实践中。
人工智能系统有各种形状和大小,从高度专业化的系统解决了人类思想无法接近的复杂概率,例如预测蛋白质的构象[21]到可以产生基于文本提示[40]的栩栩如生的高分辨率图像或视频的系统。然而,人类智能大多数机器智能的轴轴是多功能性的:解决位于各种物理环境中的各种任务的能力,同时巧妙地响应环境约束,语言命令和意外的扰动。也许可以在大型语言和视觉语言模型[1,48]中看到AI中这种多功能性的最切实进步:在网络上从大型且非常多样化的图像和文本进行预培训的系统,然后使用更精心策划的数据集进行精细调整(“对齐”),以诱发行为和响应的态度模式。尽管已经证明了这种模型可以表现出广泛的指导跟踪和解决问题的能力[53,27],但它们并不像人们那样真正地位于物理世界中,并且他们对身体互动的理解完全基于抽象描述。这样的方法是要向AI系统取得切实的进步,这些系统表现出人们所拥有的那种物理位置的多功能性,我们将需要在物理位置的数据上训练它们 - 也就是说,来自体现的机器人剂的数据。在自然语言[1]和计算机视觉[39]中,预先培训的多任务数据的通用基础模型倾向于优于狭义和专业的可以任务执行各种机器人行为的灵活和通用模型具有巨大的实践后果,但它们也可能为当今机器人学习面临的一些最艰巨的挑战提供解决方案,例如数据的可用性,概括和鲁棒性。
背景:在过去的几十年中,鼻脑递送已被研究作为将分子递送到中枢神经系统 (CNS) 的替代途径,绕过血脑屏障。使用纳米技术载体通过这种途径促进药物转移已被广泛探索。运输的确切机制仍不清楚,因为可能涉及不同的途径(全身或轴突)。尽管该领域的研究很多,但仍有各种方面需要解决。例如,合适的载体应具备哪些物理化学特性才能实现这一目标?为了确定载体特征(例如,粒度和表面电荷)与药物靶向效率百分比(DTE%)和直接运输百分比(DTP%)之间的相关性,使用机器学习进行了相关性研究。方法:对 2010 年至 2021 年 Pubmed 上的文献进行了详细分析,以建立“NANOSE”数据库。已应用回归分析来利用机器学习技术。结果:共考虑了 64 篇研究文章来构建 NANOSE 数据库(102 种配方)。基于颗粒的配方的平均尺寸在 150-200 nm 之间,并呈现从 -10 到 -25 mV 的负 zeta 电位 (ZP)。DTP/DTE 值回归的最通用模型是决策树回归,其次是 K-最近邻回归器(KNeighbor 回归)。结论:文献综述显示,鼻脑递送已在神经退行性疾病中得到广泛研究。纳米系统的物理化学性质(平均尺寸和 ZP)与 DTE/DTP 参数之间的相关性研究表明,对于 DTP/DTE 可预测性而言,ZP 可能比粒径更重要。关键词:纳米药物、鼻腔给药、药代动力学、DTE、DTP、机器学习
人工智能系统的形式和规模各有不同,有高度专业化的系统可以解决人类思维无法解决的复杂问题,比如预测蛋白质的构象 [ 21 ],也有可以根据文本提示生成逼真的高分辨率图像或视频的系统 [ 40 ]。然而,人类智能超越机器智能的最大优势是多功能性:能够解决不同物理环境中的不同任务,同时对环境约束、语言命令和意外干扰做出智能响应。人工智能在实现这种多功能性方面最实质性的进展或许体现在大型语言和视觉语言模型 [ 1, 48 ] 中:这些系统先在网络上的大量且非常多样化的图像和文本语料库上进行预训练,然后使用更精心策划的数据集进行微调(“对齐”),以诱导所需的行为和响应模式。虽然这些模型已被证明具有广泛的指令遵循和解决问题的能力 [ 53 , 27 ],但它们并不像人类那样真正地存在于物理世界中,它们对物理交互的理解完全基于抽象描述。如果这些方法要在人工智能系统方面取得切实进展,使其表现出人类所拥有的那种物理情境多功能性,我们将需要使用物理情境数据(即来自具身机器人代理的数据)对它们进行训练。灵活的通用模型可以执行各种机器人行为,具有巨大的实际意义,但它们也可能为当今机器人学习面临的一些最严峻的挑战提供解决方案,例如数据的可用性、泛化和鲁棒性。在自然语言 [ 1 ] 和计算机视觉 [ 39 ] 中,在各种多任务数据上预先训练的通用基础模型往往优于狭义的和专门的模型
多年来,人们已经观察到复杂的数据驱动系统广泛存在,例如医疗系统、智能农业和智能城市。这些系统产生大量高度异构的数据(又称大数据),需要集成这些数据以提供描述性分析或预测模型的各种应用程序。因此,数据集成 (DI) 架构在现代信息系统中是不可避免的,它们不断面临由复杂、快速到达和大量数据以及新兴数据工程技术带来的新挑战。DI 的一个共同目标是以统一的格式向最终用户提供异构且通常分布式的数据。研究和开发工作产生了一些标准的 DI 架构,即:(1)联合 [1] 和中介 [2],(2)数据仓库 (DW) [3],(3)lambda [4],(4)数据湖 (DL) [5],(5)数据湖屋 (DLH) [6],(6)polystore [7],以及 (7) 数据网格 / 数据结构 [8]。在所有上述架构中,来自异构和分布式数据源 (DS) 的数据通过集成层在集成系统中提供(通过虚拟或物化集成)。该层由复杂的软件实现,它运行所谓的 DI 流程(在数据仓库架构中又称为 ETL,在数据科学中又称为数据处理管道、数据整理或数据处理工作流 [9, 10])。DI 流程是所有 DI 架构的核心元素。 DI 流程是复杂的工作流,由数十到数千个任务组成。这些任务负责从 DS 中提取数据、将数据转换为通用模型和数据结构、清理数据、删除缺失、不一致和冗余的数据项、集成数据并将其加载到中央存储库(即 DW、DL 或 DLH)中,或使其在虚拟集成架构(即联合、中介、多存储或数据网格)中可用。DI 流程由专用软件管理,称为 DI 引擎(DW 架构中的 ETL 引擎)。
ORCID iDs:Pouyan Jahani Rad https://orcid.org/0009-0007-2956-2209 Mahdi Bahaghighat https://orcid.org/0000-0002-1813-8417 摘要。本研究重点是制作一个有效的文本分类器,将给定的语料库映射到特定的科学领域。我们的研究是根据 Web of Science (WOS) 的类别对不同科学领域进行分类。我们在父级和子级设计和开发了各种深度学习架构,例如卷积神经网络 (CNN)、深度神经网络 (DNN) 和循环神经网络 (RNN)。为了使我们的模型表现更好,我们有效地使用了超频调优。我们的目标是为较低级别和较小的通用模型大小构建一个精确的分层文本分类器。评估采用一种称为分层混淆矩阵的特殊度量。基于对词嵌入、文档嵌入和超频调优的广泛研究,结果表明,在父子级别上分层组合 CNN 和 DNN 可以实现更高的准确率。我们的模型得分确实不错,F1 得分为 94.29%,准确率达到 99.33%。虽然在父级使用一个 RNN,在子级使用另一个 RNN 会导致准确率降低,但有效地减小了整体模型大小。我们还使用 AoI2WoS 数据集对各种模型架构进行了全面评估。通过结合 Google 新闻词嵌入,我们在 AoI2WoS 数据集上测试了不同的 RNN-DNN 和 RNN-RNN 模型组合。RNN-DNN 模型取得了最佳效果,准确率达到 98.71%,F1 得分达到 91.87%。这些发现不仅推动了分层文本分类的发展,而且为利用科学计量学和文献计量学研究提供了强有力的工具。