我们在 2019 年预测分析大赛 (PAC) 中名列第三,通过 T1 加权 MRI 脑部图像预测年龄,平均绝对误差 (MAE) 达到 3.33 岁。我们的方法结合了七种算法,当特征数量超过观测值数量时,这些算法可以生成预测,特别是两个版本的最佳线性无偏预测器 (BLUP)、支持向量机 (SVM)、两个浅层卷积神经网络 (CNN) 以及著名的 ResNet 和 Inception V1。集成学习是通过在训练样本的保留子集中的线性回归估计权重而得出的。我们进一步评估并确定了可能影响预测准确性的因素:算法的选择、集成学习以及用作输入/MRI 图像处理的特征。我们的预测误差与年龄相关,年龄较大的参与者的绝对误差更大,这表明需要增加该子群的训练样本。我们的研究结果可用于指导研究人员建立健康个体的年龄预测指标,可用于研究和临床,作为疾病状况的非特异性预测指标。
序列到功能分析是人类遗传学中的一项具有挑战性的任务,特别是在从生物序列(例如个体化基因表达)预测细胞类型特异性多组学表型时。在这里,我们提出了一种新方法 UNICORN,其预测性能比现有方法有所提高。UNICORN 将来自生物序列的嵌入以及来自预先训练的基础模型的外部知识作为输入,并使用精心设计的损失函数优化预测器。我们证明 UNICORN 在细胞水平和细胞类型水平的基因表达预测和多组学表型预测方面均优于现有方法,并且它还可以生成预测的不确定性分数。此外,UNICORN 能够将个性化的基因表达谱与相应的基因组信息联系起来。最后,我们表明 UNICORN 能够表征不同疾病状态或扰动的复杂生物系统。总体而言,基础模型的嵌入可以促进理解生物序列在预测任务中的作用,并且结合多组学信息可以提高预测性能。
由于硬件特定的噪声,嘈杂的中型量子设备在实现高保真计算方面面临挑战。我们提出了一个量子电路深度学习编译器的框架,旨在降低在特定设备上运行的电路的输出噪声。我们的方法是首先在量子芯片的实验数据上训练卷积神经网络,以学习该设备的噪声模型。然后,我们将训练好的网络视为量子电路的噪声预测器,并设计一个编译器来重写电路,以尽量减少网络预测的预期噪声。我们使用 IBM 5 量子比特设备测试了这种方法,并根据 IBM Qiskit 编译算法对编译后的电路进行了基准测试。我们得到的结果显示,与 Qiskit 编译器相比,输出噪声降低了 11%(95% CI [10%、12%])。与 Qiskit 编译器相比,所有可用的 5 量子比特 IBM 设备都有所改进,但我们发现在学习噪声模型的设备上降噪效果明显更好。这些结果表明,使用机器学习设计的设备特定编译器可以产生更高保真度的操作,从而增加量子计算应用的潜力。
Google DeepMind Technologies Limited(英国伦敦)最近发布了其新版本的生物分子结构预测器人工智能(AI)模型,名为Alphafold3。的准确性优越,比其前任Alphafold 2更强大,这项创新以其能力和速度使世界惊讶。确定各种蛋白质的结构以及形状如何与受体一起工作,但Alphafold 3在几秒钟内预测相同的结构。该版本的效用是在药物发现,疫苗,酶促过程以及确定不同生物学过程的速率和影响的领域中难以想象的。Alphafold 3使用类似的机器学习和深度学习模型,例如Gemini(Google DeepMind Technologies Limited)。alphafold 3已经成为计算生物化学和药物开发领域的转折点,以及受体调节和生物分子发育。借助Alphafold 3和类似的模型,研究人员将获得对蛋白质及其相互作用的结构动态的无与伦比的见解,为科学家和医生开辟了新的途径,以利用患者的利益。通过对高标准研究出版物的严格验证来支持Alphafold 3之类的AI模型,将促进进一步的创新,并瞥见生物医学的未来。
摘要 — 中风是导致成人复杂残疾的主要原因。中风后运动障碍和认知障碍的患病率很高且持续存在。最常见的后果是对侧上肢偏瘫,超过 80% 的中风患者急性发作,超过 40% 的中风患者慢性发作。基于运动意象的脑机接口 (BCI) 在中风后运动恢复方面表现出良好的效果。然而,这种方法并不适用于所有患者,即使有效,在不同患者之间的效果也大不相同。因此需要改进。这可以通过为每位患者个性化基于 BCI 的运动康复 (MR) 计划来实现,特别是通过个性化所使用的人工智能 (AI) 模型。为此,首先必须确定成功的基于 BCI 的运动康复的预测因素。事实上,很少有研究解决影响中风后基于 BCI 的 MR 的因素的问题。因此,在本文中,我们调查了与成功使用 BCI 相关的因素以及与中风后运动康复相关的因素,以确定可能影响基于 BCI 的中风后 MR 的各种因素。然后,我们讨论如何考虑这些因素,以便开发新的 AI 算法,用于个性化的中风后基于 BCI 的 MR。索引术语 —BCI、中风运动康复、性能预测器、训练个性化、人工智能
本文介绍了一种基于事件的功率建模新方法,适用于没有性能监控单元 (PMU) 的嵌入式平台。该方法涉及将测量物理功率数据的目标硬件平台与另一个可以收集模型生成所需的 CPU 性能数据的平台进行补充。该方法用于为 Gaisler GR712RC 双核 LEON3 容错 SPARC 处理器生成准确的细粒度功率模型,该处理器带有板载功率传感器,但没有 PMU。Kintex UltraScale FPGA 用作支持平台,通过在 GR712RC 上运行双核 LEON3 的软核表示,但使用 PMU 实现,来获取所需的 CPU 性能数据。两个平台都执行相同的基准测试集,并使用每个样本的时间戳同步数据收集,以便 GR712RC 板的功率传感器数据可以与 FPGA 的 PMU 数据相匹配。然后,同步样本由稳健能量和功率预测器选择 (REPPS) 软件处理,以生成功率模型。在工业用例上验证后,这些模型的功率估计误差小于 2%,并且可以跟踪程序阶段,这使得它们适合在开发过程中进行运行时功率分析。
深度神经网络 (DNN) 是功能强大的黑盒预测器,在各种任务上都取得了令人印象深刻的表现。然而,它们的准确性是以牺牲可理解性为代价的:通常不清楚它们如何做出决策。这阻碍了它们在医疗保健等高风险决策领域的适用性。我们提出了神经加性模型 (NAM),它将 DNN 的一些表达能力与广义加性模型固有的可理解性相结合。NAM 学习神经网络的线性组合,每个神经网络都关注一个输入特征。这些网络是联合训练的,可以学习输入特征和输出之间任意复杂的关系。我们在回归和分类数据集上的实验表明,NAM 比广泛使用的可理解模型(如逻辑回归和浅层决策树)更准确。它们在准确性方面的表现与现有的最先进的广义加性模型相似,但更灵活,因为它们基于神经网络而不是增强树。为了证明这一点,我们展示了如何利用 NAM 对合成数据和 COMPAS 累犯数据进行多任务学习(由于其可组合性),并证明了 NAM 的可微分性使它们能够为 COVID-19 训练更复杂的可解释模型。源代码可在 neuro-additive-models.github.io 上找到。
西尼罗病毒(WNV)是一种由蚊子传播并引起人类,人类,马和鸟类的发烧和脑炎的重新引起的人畜共患病原体。尽管所有WNV谱系都会引起人类疾病,但由于其在欧洲的迅速蔓延,并且在欧洲的迅速蔓延而引起了较大的疾病,因此在欧洲的引起了较大的疾病,因此预防了严重的疾病,因此爆发了爆发。乌克兰与欧洲其他一些地区一样,爆发确实会定期发生。这正成为令人震惊的趋势。在这项研究中,我们专注于生物气候预测因子设想欧洲WNV爆发的能力,特别着重于乌克兰。为此,我们采用了一种机器学习方法来绘制预测和XAI(即可解释的人工智能)的SHAP框架来对最具影响力的WNV驱动程序进行排名和揭示。在生物气候预测器的条款中,对于欧洲量表的SDM构造最重要的是,欧洲季度和温度季节的平均空气温度是欧洲频率和温度季节的平均空气温度。我们的模型表明,在即将到来的健康威胁下,西方地区(不包括喀尔巴阡高地)和乌克兰以南。
为了抗击冠状病毒病 (COVID-19) 大流行,许多政府都设立了电话热线来预先筛查潜在病例。这些热线因呼叫者数量过多而苦不堪言,导致等待时间长达数小时,甚至无法联系到卫生当局。Symptoma 是一个根据症状和疾病进行分类的数字健康助手,可以区分 20,000 多种疾病,准确率超过 90%。我们使用一组不同的临床病例结合 COVID-19 的病例报告测试了 Symptoma 识别 COVID-19 的准确率。结果表明,Symptoma 可以在 96.32% 的临床病例中准确区分 COVID-19。当仅考虑 COVID-19 症状和风险因素时,Symptoma 在仅出现三种体征的情况下就能 100% 地识别出感染者。最后,我们表明,Symptoma 的准确性远远超过网上广泛提供的简单“是-否”问卷。总之,Symptoma 在系统识别 COVID-19 病例方面提供了无与伦比的准确性,同时还考虑了 20,000 多种其他疾病。此外,Symptoma 允许以 36 种语言自由输入文本,并附带针对特定疾病的后续问题。综合起来,这些结果和可访问性使 Symptoma 有可能成为全球抗击 COVID-19 的关键工具。Symptoma 预测器可在 https://www.symptoma.com 上免费在线获取。
为了抗击冠状病毒病 (COVID-19) 大流行,许多政府都设立了电话热线来预先筛查潜在病例。这些热线因呼叫者数量过多而苦不堪言,导致等待时间长达数小时,甚至无法联系到卫生当局。Symptoma 是一个根据症状和疾病进行分类的数字健康助手,可以区分 20,000 多种疾病,准确率超过 90%。我们使用一组不同的临床病例结合 COVID-19 的病例报告测试了 Symptoma 识别 COVID-19 的准确率。结果表明,Symptoma 可以在 96.32% 的临床病例中准确区分 COVID-19。当仅考虑 COVID-19 症状和风险因素时,Symptoma 在仅出现三种体征的情况下就能 100% 地识别出感染者。最后,我们表明,Symptoma 的准确性远远超过网上广泛提供的简单“是-否”问卷。总之,Symptoma 在系统识别 COVID-19 病例方面提供了无与伦比的准确性,同时还考虑了 20,000 多种其他疾病。此外,Symptoma 允许以 36 种语言自由输入文本,并附带针对特定疾病的后续问题。综合起来,这些结果和可访问性使 Symptoma 有可能成为全球抗击 COVID-19 的关键工具。Symptoma 预测器可在 https://www.symptoma.com 上免费在线获取。