• 网络运营数据过载 • 数据分析和洞察提取困难 • 复杂的数据关联要求 • 服务和客户关联 • 数据存储和格式差异 • 上下文理解和关系映射 • 数据收集中上下文的丢失 • 数据收集方法和解释 • 组织孤岛 • 多个事实来源 • 机器可读知识
生物体的基因组由所有脱氧核糖核酸 (DNA) 组成,其中包含生物体发育和功能的遗传信息。人类基因组由细胞核中的 23 对染色体和线粒体中的核外 DNA 组成。DNA 序列的变化导致人类遗传多样性,并使每个人类个体的基因组序列都是独一无二的,同卵双胞胎除外 [3,6]。在法医遗传学中,人类遗骸的身份是通过分析经过验证的遗传标记的 DNA 谱来识别的,例如短串联重复序列 (STR),其重复序列数量各不相同,并表现出孟德尔遗传 [3,7]。在法医牙科中,形态特征和牙科治疗的分析可以确定身份不明者的身份 [1,2,8]。在某些情况下,例如自然灾害、火灾或发现部分或腐烂的人类遗骸,牙齿是最可行的 DNA 来源之一。它们的成分和位置使其对自然分解、创伤、环境因素、微生物因素以及旨在阻碍识别过程的人为活动具有很强的抵抗力 [2,8]。
知识图谱是组织信息的有效工具。在本文中,我们专注于一种特殊类型的知识图谱,即教育知识图谱(EKG),其中的先决条件关系形成了学生在学习过程中可以遵循的路径。EKG 提供了多种功能,包括对学习领域的全面视觉表示,并为学生提供了替代学习路径。手动构建 EKG 是一项耗时且劳动密集型的任务,需要领域专家评估每个概念对以确定先决条件关系。为了应对这一挑战,我们提出了一种结合机器学习技术和专家知识的方法。我们首先引入一种基于通过词嵌入捕获的语义参考的概念对先决条件评分机制。然后根据得分对概念对进行排序,并选择得分高的对进行专家评估,从而减少需要评估的总对数。向专家迭代地呈现一个概念对,并根据专家的标签在后台动态构建 EKG。随着图谱的发展,可以根据现有的先决条件推断出一些先决条件,从而进一步减少专家的任务。我们在 Web 应用程序中实现了我们的方法,允许专家与系统交互并创建自己的图谱。对真实基准数据集的评估表明,我们的 AI 辅助图谱构建方法可以形成准确的图谱,并显著减少专家在此过程中的工作量。在教育平台的数据集上进行的进一步实验表明,按照我们的方法确定的先决条件顺序学习概念对的学生总体成功率更高,这表明 EKG 可以改善教育中的学习成果。感兴趣的读者可以从我们的 Github 存储库 1 访问更多材料和数据集。
课程设计是教育的一个重要方面,需要仔细考虑内容相关性、学生进步和教学连贯性。近年来,知识图谱 (KG) 的使用因其能够以结构化格式表示概念之间的复杂关系而受到关注。本文介绍了 KGCD(基于知识图谱的课程设计),这是一种新颖的智能课程设计方法,它利用知识图谱来模拟学科相互依赖性、技能进步和学生学习路径。通过结合人工智能驱动的洞察力,KGCD 为教育工作者提供了一种强大的工具,用于设计符合学生需求和教育目标的自适应个性化课程。该系统提供课程调整的实时建议,确保包含相关内容和主题的逻辑顺序。初步试点研究表明,通过为课程开发和修订提供数据驱动的支持,KGCD 有潜力提高课程连贯性和学生学习成果。
当研究人员收集单细胞数据并将其细化为细胞图谱时,一项关键任务是对每种细胞类型进行表征和标记或注释。“这通常是一项非常耗时、繁重的任务,只有少数生物学专家才能完成,”计算生物学家、麻省理工学院和哈佛大学布罗德研究所 HCA 细胞注释平台负责人 Evan Biederstedt 说。研究人员已经开发了几种自动标记细胞的程序,但这些工具并不总是能得出相同的答案。popV 就是个例子。它的功能简单但功能强大:它将八种自动细胞注释工具整合到一个平台中,并且可以在有更多工具可用时添加 1 。“这是一个加速工具,”联合开发者、加州大学伯克利分校的计算生物学家 Can Ergen 说。拥有新鲜生成的单细胞 RNA 测序数据的研究人员可以将其加载到 popV 中,八种方法中的每一种都会对细胞身份进行“投票”——因此该工具的全名是 popular Vote。对于任何给定的细胞,用户可以检查所有八种注释是否一致,或者对可能的身份是否存在分歧投票。如果这些方法对某种细胞类型的判定一致,研究人员就可以对其身份充满信心;如果存在分歧,可能就没那么自信了。为了量化这一点,popV 提供了“不确定性分数”,以便用户知道在其鉴定中可以给予多大信任度。“这真的很酷,”Regev 说。PopV 使用来自 Tabula Sapiens 的数据进行训练,Tabula Sapiens 是一张人类细胞图谱,涵盖了近 500,000 个细胞,代表了 15 个人的 24 个器官。研究人员随后在来自人类肺细胞图谱 2 的数据库上对其进行了测试;根据最终论文,popV 的预测与大多数注释一致,比任何单个计算注释器都更准确。Biederstedt 计划将 popV 整合到 HCA 细胞注释平台用户界面中,科学家将能够在对细胞类型进行分类时查看 popV 的预测。“它确实让社区更接近自动细胞注释的梦想,并将极大地帮助研究人员,”他说。一旦研究人员发现了一种有趣的细胞类型或状态,他们可能会想知道它还会出现在哪里。Regev 和她的同事开发了 SCimilarity 来回答这个问题。该软件可以获取感兴趣的细胞概况
附属机构 1 疾病神经基因组学中心,2 弗里德曼脑研究所,3 精神病学系,4 遗传学和基因组科学系,5 神经科学系,6 人工智能与人类健康系,纽约州纽约市伊坎西奈山医学院,邮编 10029,美国,7 匹兹堡大学医学院精神病学系,美国宾夕法尼亚州匹兹堡 8 精准医学和转化治疗中心,9 精神疾病研究、教育和临床中心 VISN2,詹姆斯 J. 彼得斯 VA 医疗中心,纽约州布朗克斯,美国。10 美国马里兰州贝塞斯达国家心理健康研究所-内部研究项目人类大脑收集核心。11 PsychAD 联盟。 *这些作者对这项工作做出了同等贡献# 通信至:KG(kiran.girdhar@mssm.edu)和 PR(panagiotis.roussos@mssm.edu)
材料科学知识广泛分布于大量科学文献中,对新材料的有效发现和集成构成了重大挑战。传统方法通常依赖于昂贵且耗时的实验方法,这进一步加剧了快速创新的复杂性。为了应对这些挑战,人工智能与材料科学的结合为加速发现过程开辟了道路,尽管这也需要精确的注释、数据提取和信息的可追溯性。为了解决这些问题,本文介绍了材料知识图谱 (MKG),它利用先进的自然语言处理技术与大型语言模型相结合,将十年的高质量研究成果提取并系统地组织成结构化的三元组,包含 162,605 个节点和 731,772 条边。MKG 将信息分类为名称、公式和应用等综合标签,并围绕精心设计的本体进行构建,从而增强了数据的可用性和集成性。通过实施基于网络的算法,MKG 不仅促进了高效的链接预测,而且还显著减少了对传统实验方法的依赖。这种结构化方法不仅简化了材料研究,而且为更复杂的科学知识图奠定了基础。
。CC-BY-NC-ND 4.0 国际许可 它是根据作者/资助者提供的,他已授予 medRxiv 永久展示预印本的许可。(未经同行评审认证)
图 2:精神活性药物导致的半意识状态。4 项药物测试费用因地区和设施而异,从 3500 卢比到 9000 卢比不等。因此,请经常在值得信赖的诊断中心(如 Ganesh Diagnostic)进行测试。麻醉分析一词由 Horseley 创造。麻醉分析在法律、医学和伦理的交叉点上提出了几个问题。麻醉分析是 Horsley 发明的一个术语,用于描述一种心理治疗技术,其中通过施用(通常通过静脉注射)麻醉药物,使患者进入昏睡状态,然后再被带去讨论问题。第一步是筛选测试,这是一种适用于所有样本的基于免疫测定的测试。第二步称为确认测试,通常由实验室使用高度特异性的
图 1:组织学图谱中的 NextBrain,具有优点()、缺点()和中立点。()。(A)打印的图谱 [1],其中包含一组稀疏的手动追踪切片 [1]。(BG)覆盖范围有限的特定 ROI 的组织学图谱:(B)手动追踪的基底神经节切片 [8];(C)确定性丘脑图谱的 3D 渲染 [11];(DF)追踪的 MRI 切片、组织学切片和海马图谱的 3D 渲染 [12];(G)我们的丘脑概率图谱切片 [14]。(HN)整个人脑的组织学图谱:(H)BigBrain 的 3D 重建切片 [13];(I)MNI 模板上的 Julich-Brain 标签切片; (J) 标记的 Allen 参考脑组织学切片 [7];(K) 使用受 (J) 启发的协议标记 MNI 模板;(LN) AHEAD 脑的 MRI、组织学和 3D 渲染 [22]。(OS) 我们的新图谱 NextBrain 包括五个标本的密集 3D 组织学 (OP) 和全面的手动标记 (Q),从而可以构建概率图谱 (R),该图谱可与贝叶斯技术相结合,自动标记体内 MRI 扫描中的 333 个 ROI (S)。