世界依赖农业,而农业本身也面临着巨大的挑战,例如满足不断增长的人口对食物、纤维和生物能源的需求。必须利用不断减少的可耕地面积来满足这些需求,同时还要适应导致洪水、干旱和高温更频繁的气候变化,以及培育能够抵抗疾病和害虫且几乎不使用有害环境的化学物质的农作物。所有这些挑战都需要创新的解决方案,这些解决方案将源自植物科学和农业领域的基础和应用研究,包括基因组编辑。基因组编辑是指实现精确的基因组修改,例如在细胞或生物体中对 DNA 进行位点特异性插入、删除、替换和表位等位基因改变。基因组编辑基本上是基于体内 DNA 双链断裂 (DSB),这种断裂是由经过编程以识别预选基因组位点的工程内切酶诱导的,并利用细胞 DSB 修复机制 (Carroll, 2014)。可编程核酸酶包括巨核酸酶( Gong 和 Golic,2003 年)、锌指核酸酶 (ZFN)(Urnov 等人,2005 年)、转录激活因子样效应核酸酶 (TALEN)(Christian 等人,2010 年;Li 等人,2011 年)和成簇的规律间隔的短回文重复序列 (CRISPR) 相关核酸酶 (Cas)(Jinek 等人,2012 年;Cong 等人,2013 年;Mali 等人,2013 年)。此外,工程化核酸酶变体可以在没有 DSB 的情况下进行基因组编辑(例如,通过引起 DNA 单链断裂)(Rees and Liu,2018 年)或表观基因组编辑(完全没有 DNA 断裂,也没有 DSB 修复)(Holtzman and Gersbach,2018 年)。基因组编辑已成为最重要的生物技术工具,它促进了我们的生物学知识和生物技术领域本身的增长,并做出了巨大贡献,推动了工业、医学和农业的快速发展。在过去的 10 年中,我们目睹了基于 CRISPR 的基因组编辑技术的快速发展及其在植物功能基因组学和作物改良等各个领域的应用。植物中的基因组编辑技术包括序列特异性核酸酶的工程设计、编辑试剂的递送、编辑事件的产生和选择以及完整植物的表征和利用,这对公众接受基因组编辑植物和监管部门的批准具有进一步的影响。在过去的十年中,基因组编辑平台已经建立并应用于 45 多个植物属(Shan et al.,2020)。然而,为了更好地理解基因组编辑的分子和遗传机制、持续改进和植物中基因组编辑技术的新应用,仍然需要进行大量的研究工作。具体而言,植物基因组编辑面临如下主要挑战。
通过思维与效应器进行交互,可以使这些患者在日常生活中恢复一定的自主权。例如,基于运动想象的 BCI 已被用于控制脊髓损伤后截瘫或四肢瘫痪患者的上肢( Hochberg 等人, 2012 年; Collinger 等人, 2013 年; Wodlinger 等人, 2014 年; Edelman 等人, 2019 年)、下肢( López-Larraz 等人, 2016 年; He 等人, 2018 年)和四肢( Benabid 等人, 2019 年)的假肢或外骨骼。在本研究中,我们重点研究基于皮层脑电图 (ECoG) 的运动 BCI,这是一种很有前途的工具,与更具侵入性的方法相比,它可以实现神经假体控制的连续 3D 手部轨迹解码,同时降低植入风险 ( Volkova 等人,2019)。BCI 记录神经元活动并将其解码为效应器的控制命令。解码器通常以监督的方式使用机器学习算法进行训练。在绝大多数研究中,由于对记录的访问有限,训练数据集受到严格限制。同时,数据集大小是机器学习分析中的一个重要因素,会极大地影响整个系统的性能。与最近的计算机视觉和自然语言处理研究(Kaplan 等人,2020 年;Rosenfeld 等人,2020 年;Hoiem 等人,2021 年)相比,对于 BCI,很少研究训练数据的最佳数量,即解码器性能在给定应用中达到稳定状态的数量(Perdikis and Millan,2020 年)。尤其是学习曲线,它提供了对模型性能和训练集大小之间关系的洞察,但却很少被提出。学习曲线可用于模型选择、减少模型训练的计算量或估计向训练数据集添加更多数据的理论影响(Viering and Loog,2021 年)。考虑到人类记录的数据集的访问权限有限,最后一点在 BCI 中尤为重要。如果不知道系统性能和数据集大小之间的关系,就很难确定提高解码器准确性的策略:增加训练数据量还是增加模型容量。对于基于 ECoG 的运动 BCI,大多数模型的容量有限。所使用的解码器是卡尔曼滤波器(Pistohl 等人,2012 年;Silversmith 等人,2020 年)并且大多是线性模型的变体(Flamary 和 Rakotomamonjy,2012 年;Liang 和 Bougrain,2012 年;Nakanishi 等人,2013 年、2017 年;Chen 等人,2014 年;Bundy 等人,2016 年;Eliseyev 等人,2017 年)。在大多数这些研究中,解码器优化都是在包含几分钟或几十分钟信号的数据库上进行的。这会产生可用的模型,但并未提供有关可以通过更多数据实现的性能提升的任何信息,也没有比较多个解码器之间的数据量/性能关系。在 BCI 中,模型特征和学习曲线并不是影响解码器性能的唯一因素。人类生成独特脑信号模式的能力对于 BCI 系统至关重要。近年来的研究主要集中在开发越来越高效的解码器上,例如深度学习 (DL)(Bashivan 等人,2015 年;Elango 等人,2017 年;Schirrmeister 等人,2017 年;Du 等人,2018 年;Lawhern 等人,2018 年;Pan 等人,2018 年;Xie 等人,2018 年;Zhang 等人,2019 年;Rashid 等人,2020 年;´ Sliwowski 等人,2022 年),而不是耐心学习或共同适应(Wolpaw 等人,2002 年;Millan,2004 年),尽管一些研究表明
