本论文旨在通过明确推理其模型与现实世界之间的差距,奠定必要的基础,使自主系统能够在复杂、变化和不确定的环境中确保自身安全。它首先介绍了一套新颖的鲁棒最优控制公式和算法工具,允许在时变、多智能体系统中进行可处理的安全分析,以及在部分未知环境中进行安全的实时机器人导航;这些方法在大型无人机交通模拟和物理四旋翼平台上得到了展示。此后,它利用贝叶斯机器学习方法将基于模型的保证转化为高置信度保证,根据有关物理系统和周围智能体的证据变化来监控预测模型的可靠性。该原则首先应用于通用安全框架,允许对无人机等安全关键型机器人系统使用基于学习的控制(例如强化学习),然后结合认知科学和动态博弈论的见解,实现以人为本的安全导航和交互;这些技术在物理四旋翼飞行器(在未建模的风中和人类行人中飞行)和模拟高速公路驾驶中得到展示。论文最后讨论了未来的挑战和机遇,包括安全分析和强化学习之间的衔接,以及围绕学习和适应“闭环”的必要性,以便自信地部署日益先进的自主系统。
运动刻板行为在患有自闭症谱系障碍 (ASD)、智力障碍或感觉剥夺的儿童以及正常发育的儿童(“原发性”刻板行为,pCMS)中很常见。运动刻板行为的确切病理生理机制尚不清楚,尽管已经提出了遗传病因。在本研究中,我们对 129 个患有 pCMS 的亲子三人组和 853 个对照三人组(经过质量控制后为 118 个病例和 750 个对照)进行了全外显子组 DNA 测序。我们报告了 pCMS 与对照相比新生预测损伤性 DNA 编码变异的发生率增加,确定 KDM5B 为高置信度风险基因,并估计有 184 个基因赋予风险。pCMS 患者中含有新生损伤性变异的基因与 Tourette 综合征、ASD 中的基因以及刻板行为评分高与低的 ASD 患者中的基因有显著重叠。对这些 pCMS 基因表达模式的探索性分析发现,在胎儿中期发育早期,这些基因在皮质和纹状体中聚集。探索性基因本体论和网络分析突出了钙离子转运、去甲基化、细胞信号传导、细胞周期和发育中的功能趋同。对 pCMS 三重奏的持续测序将识别出其他风险基因,并为跨诊断界限的刻板生物学机制提供更深入的见解。
摘要 — 脑电图 (EEG) 的受试者间/受试者内变异性使得脑机接口 (BCI) 的实际使用变得困难。通常,BCI 系统每次使用时都需要一个校准程序来调整模型。这个问题被认为是 BCI 的主要障碍,为了克服它,最近出现了基于迁移学习 (TL) 的方法。然而,许多 BCI 范例的局限性在于它们由首先显示标签然后测量“图像”的结构组成,在受试者到受试者的 TL 过程的许多情况下,包含不包含控制信号的数据的源受试者的负面影响被忽略了。本文的主要目的是提出一种排除预计会对受试者到受试者 TL 训练产生负面影响的受试者的方法,该方法通常使用来自尽可能多的受试者的数据。在本文中,我们提出了一个仅使用高置信度受试者进行 TL 训练的 BCI 框架。在我们的框架中,深度神经网络使用基于小损失技巧的共同教学算法为 TL 过程选择有用的对象并排除嘈杂的对象。我们在两个公共数据集(2020 年国际 BCI 竞赛 Track 4 和 OpenBMI 数据集)上尝试了留一法验证。我们的实验结果表明,选择具有小损失实例的对象的置信感知 TL 可以提高 BCI 的泛化性能。关键词 — 脑机接口、脑电图、运动意象、迁移学习、嘈杂标签
本论文旨在通过明确推理其模型与现实世界之间的差距,奠定必要的基础,使自主系统能够在复杂、变化和不确定的环境中确保自身安全。它首先介绍了一套新颖的鲁棒最优控制公式和算法工具,允许在时变、多智能体系统中进行可处理的安全分析,以及在部分未知环境中进行安全的实时机器人导航;这些方法在大型无人机交通模拟和物理四旋翼平台上得到了演示。此后,它借鉴贝叶斯机器学习方法将基于模型的保证转化为高置信度保证,根据有关物理系统和周围智能体的证据变化来监控预测模型的可靠性。该原则首先应用于通用安全框架,允许对无人机等安全关键型机器人系统使用基于学习的控制(例如强化学习),然后结合认知科学和动态博弈论的见解,实现安全的以人为本的导航和交互;这些技术在实体四旋翼飞行器(在未建模的风中和人类行人中飞行)和模拟高速公路驾驶中得到展示。论文最后讨论了未来的挑战和机遇,包括安全分析和强化学习之间的衔接,以及围绕学习和适应“闭环”的必要性,以便自信地部署日益先进的自主系统。
小麦是全球粮食安全的重要贡献者,为了养活不断增长的人口,小麦需要进一步改良。功能遗传学和基因组学工具可以帮助我们了解不同基因的功能并设计有益的变化。在这项研究中,我们使用启动子捕获分析对四倍体小麦品种 Kronos 的 1,513 株诱变植物中所有高置信度注释基因上游 2 kb 区域进行测序。我们鉴定了 430 万个诱发突变,准确率为 99.8%,突变密度为每 kb 41.9 个突变。我们还将 Kronos 外显子组捕获读数重新映射到 Chinese Spring RefSeq v1.1,鉴定了 470 万个突变,并预测了它们对注释基因的影响。使用这些预测,我们鉴定出的非同义替换比原始研究多 59%,截断突变多 49%。为了展示启动子数据集的生物学价值,我们选择了 VRN - A1 春化基因启动子内的两个突变。这两个突变都位于转录因子结合位点内,显著改变了 VRN - A1 的表达,一个突变减少了每个穗的小穗数量。这些公开可用的测序突变数据集提供了快速且廉价的途径,可以获取大多数小麦基因启动子和编码区中诱导的变异。这些突变可用于了解和调节基因表达和表型,用于基础和商业应用,有限的政府监管可以促进部署。这些突变集合与基因编辑一起,为加速这种经济重要作物的功能遗传研究提供了宝贵的工具。
DNA N 6 -甲基腺嘌呤(6mA)修饰在生物体中广泛存在,在调控细胞过程方面发挥着重要的功能性作用。作为生物湿法冶金的模式生物,Acidithiobacillus ferrooxidans在酸性条件下可以通过氧化亚铁(Fe 2+ )和各种还原性无机硫化物(RISC)获取能量。为探讨A. ferrooxidans中基因组DNA甲基化与两种氧化代谢途径切换之间的联系,利用6mA-IP-seq技术评估了不同条件下培养的A. ferrooxidans基因组中的6mA景观。在Fe 2+和RISCs氧化条件下分别鉴定出214个和47个6mA的高置信度峰(P < 10 − 5 ),表明在Fe 2+氧化条件下基因组甲基化程度更高。 6mA在转录起始位点(TSS)处表达下降,并且在两种氧化条件下均频繁出现在基因体中。此外,基因本体论(GO)和京都基因和基因组百科全书(KEGG)分析显示,7条KEGG通路被映射到差异甲基化基因上,大多数差异甲基化基因在氧化磷酸化和代谢途径中富集。选择了14个基因研究甲基化差异对mRNA表达的影响。除petA-1外,13个基因随着甲基化水平的增加表现出mRNA表达下降。整体而言,两种条件下6mA甲基化富集模式相似,但富集的途径有所不同。基因甲基化水平上调与表达下调的现象表明6mA的调控机制与Fe 2+和RISCs氧化途径之间存在潜在关联。
虚拟筛选等预测方法已用于药物研发,目的是减少开发时间和成本。当前的机器学习和基于网络的方法存在与泛化、可用性或模型可解释性相关的问题,特别是由于目标蛋白的结构/功能的复杂性以及系统训练数据集的偏差。在这里,我们提出了一种新方法“DRUIDom”(DRUg 相互作用域预测),利用蛋白质的结构域模块化来识别药物候选化合物和靶标之间的生物相互作用,以克服与当前方法相关的问题。DRUIDom 由两个方法步骤组成。首先,将配体/化合物统计地映射到其靶蛋白的结构域,目的是识别它们的相互作用。这样,包含相同映射域或域对的其他蛋白质就成为相应化合物的新候选靶标。接下来,根据分子相似性对百万级小分子化合物数据集(包括上一步中映射到域的化合物)进行聚类,并将它们的域关联传播到同一聚类内的其他化合物。从公共数据库获得的经过实验验证的生物活性数据点经过精心筛选,构建活性/相互作用和非活性/非相互作用药物/化合物-靶标对的数据集(约 290 万个数据点),并用作计算化合物-域映射参数的训练数据,从而得到 250 个域和 8,165 种化合物之间的 27,032 个高置信度关联,最终输出约 500 万个新的化合物-蛋白质相互作用。通过对预测靶向 LIM-激酶蛋白的化合物进行合成和生物活性分析,对 DRUIdom 进行了实验验证,LIM-激酶蛋白在通过肌动蛋白丝动力学调节细胞运动、细胞周期进程和分化方面发挥关键作用。我们发现 LIMK-inhibitor-2 及其衍生物通过抑制 LIMK 磷酸化和下游蛋白肌动蛋白丝切蛋白,显著阻止癌细胞迁移。
虚拟筛选等预测方法已用于药物研发,目的是减少开发时间和成本。当前的机器学习和基于网络的方法存在与泛化、可用性或模型可解释性相关的问题,特别是由于目标蛋白的结构/功能的复杂性以及系统训练数据集的偏差。在这里,我们提出了一种新方法“DRUIDom”(DRUg 相互作用域预测),利用蛋白质的结构域模块化来识别药物候选化合物和靶标之间的生物相互作用,以克服与当前方法相关的问题。DRUIDom 由两个方法步骤组成。首先,将配体/化合物统计地映射到其靶蛋白的结构域,目的是识别它们的相互作用。这样,包含相同映射域或域对的其他蛋白质就成为相应化合物的新候选靶标。接下来,根据分子相似性对百万级小分子化合物数据集(包括上一步中映射到域的化合物)进行聚类,并将它们的域关联传播到同一聚类内的其他化合物。从公共数据库获得的经过实验验证的生物活性数据点经过精心筛选,构建活性/相互作用和非活性/非相互作用药物/化合物-靶标对的数据集(约 290 万个数据点),并用作计算化合物-域映射参数的训练数据,从而得到 250 个域和 8,165 种化合物之间的 27,032 个高置信度关联,最终输出约 500 万个新的化合物-蛋白质相互作用。通过对预测靶向 LIM-激酶蛋白的化合物进行合成和生物活性分析,对 DRUIdom 进行了实验验证,LIM-激酶蛋白在通过肌动蛋白丝动力学调节细胞运动、细胞周期进程和分化方面发挥关键作用。我们发现 LIMK-inhibitor-2 及其衍生物通过抑制 LIMK 磷酸化和下游蛋白肌动蛋白丝切蛋白,显著阻止癌细胞迁移。
在陆地定居后的1.5-2亿年左右,陆地植被以无种子植物为主。现代无种子植物是一个并系群落,以苔藓植物(苔类、地钱和角苔)、石松植物和蕨类植物为代表(图1)。从进化角度来看,无种子植物是追溯陆地植物进化重大转变的关键;从应用角度来看,它们是更好地理解种子、果实和花等农学重要性状的生物学的重要外群。无种子谱系的系统发育关系一直存在广泛争议,尤其是苔藓植物之间的关系。几乎所有苔藓、苔类、角苔和维管植物之间的分支顺序的可能组合都是根据形态学、核糖体和/或细胞器DNA证据提出的(参见参考文献1-3)。直到最近,使用转录组和基因组数据集的系统发育基因组学研究才开始提供更明确的答案。Wickett 等人 1 首次应用大量核基因来推断绿色植物的系统发育。在他们的研究中,苔藓和苔类之间的姐妹关系得到了强有力的支持,而角苔的位置则因数据类型(核苷酸与氨基酸)、子集(密码子位置或过滤阈值)和推理方法(连接与物种树方法或最大似然与贝叶斯)1 而异。随后,Puttick 等人 2 和 de Sousa 等人 2 3 使用可以更好地模拟速率和成分异质性的方法重新分析了 Wickett 等人 1 的数据集。这两项研究都证实,苔藓和地钱组成一个进化枝,而 de Sousa 等人 3 则进一步以高置信度将苔藓植物解析为单系植物。然而,应该强调的是,Wickett 等人 1 的数据集中金鱼藻的代表性非常有限,只有两种密切相关的 Nothoceros 物种的转录组。2019 年,随着千株植物 (1KP) 转录组 4 的全面发布,采样更加均衡。1KP 4 和 Harris 等人 5 的分析都支持将金鱼藻置于苔藓和地钱的姐妹地位。最近对金鱼藻基因组的分析进一步支持了所有苔藓植物的单系性 6、7。越来越多的证据表明,现存的陆地植物基本上是由
抑制剂尚未显示出足够的抗肿瘤活性(4)。因此,迫切需要新的治疗策略。针对细胞表面抗原的免疫疗法,例如治疗性单克隆抗体(mAb)、嵌合抗原受体(CAR)T 细胞和免疫偶联物,例如抗体-药物偶联物(ADC),已在血液系统恶性肿瘤和实体肿瘤中显示出良好的疗效(5 – 7)。几种 mAb 和 ADC 已在骨肉瘤临床试验中进行了测试(8 – 12)。尽管发现 HER2、IGF1R、GD2 和 GPNMB 在一些骨肉瘤样本中表达(13 – 15),但这些靶标的 mAb 或 ADC 在临床试验中未能表现出足够的抗肿瘤活性(8、9、11、12)。一个潜在原因可能是表面抗原的表达水平低。理想情况下,用作免疫治疗靶点的细胞表面抗原应在肿瘤上具有高表达水平,而在正常组织上表达有限(13-16)。然而,骨肉瘤的表面组尚未得到充分研究。缺乏已知的肿瘤特异性细胞表面抗原一直是未来开发骨肉瘤治疗方法的主要障碍。在当前的研究中,我们试图识别在骨肉瘤中具有治疗潜力的可靶向细胞表面抗原。我们采用高通量集成方法,使用来自骨肉瘤细胞系、患者来源的异种移植(PDX)组织和患者样本的蛋白质组学和转录组学数据来识别高置信度的骨肉瘤细胞表面抗原。我们的数据表明,MT1-MMP (MMP14)、MRC2 (uPARAP/endo180) 和 CD276 (B7-H3) 在骨肉瘤中高度表达。目前,I/II 期临床试验 (NCT03486730) 正在探索 MT1-MMP 作为治疗靶点,联合使用自行车毒素偶联物 (BTC) BT1718。BTC 由受限的双环肽组成,这些肽对靶点具有低纳摩尔亲和力,并且与 ADC 一样,旨在在肿瘤微环境中释放细胞毒性有效载荷 (17)。与 ADC 相比,BTC 具有低分子量(4.5 kDa),这能够快速穿透肿瘤并缩短全身半衰期,从而有助于最大限度地降低毒性 (18)。然而,MT1-MMP 靶向治疗之前尚未在骨肉瘤中进行过测试。