抽象病毒是人类微生物组的丰富和关键成分,但是通过宏基因组准确地发现它们仍然具有挑战性。当前,可用的病毒参考基因组在微生物组样本中代表多样性,并且很难扩大这种病毒参考。因此,即使考虑了从头元基因组组装和binning的功能,许多病毒仍无法通过宏基因组学检测到,因为病毒缺乏通用标记。在这里,我们描述了一种新颖的方法,用于对人肠道微生物组的新病毒成员进行分类,并展示所得资源如何改善元基因组分析。我们检索了> 3,000个富含元基因组样品(病毒膜)的病毒样颗粒(VLP),评估了每个样品中富集的效率以利用最高纯度的病毒率,并应用了涉及组装和比较的多个分析步骤,并与成千上万的大都市群体中的基因组to to Chind new ner Genomes to Inder new now ver new ver genomes。我们报告了超过162,000个病毒序列通过了数千个肠道元基因组和病毒瘤的质量控制。绝大多数检索的病毒序列(〜94.4%)是未知的起源,大多数具有CRISPR间隔匹配的宿主细菌,其中四个可以在我们调查的18,756个肠道元素元中的50%中检测到。我们将获得的序列收集到了新的extaphlan 4.1释放中,该序列可以量化与已知和新发现的病毒多样性相匹配的元基因组中的读数。此外,我们发布了病毒数据库,以进行人类微生物组的进一步病毒和元基因组研究。
对具有数千个数据集的复杂环境的元基因组分析,例如序列读取存档中可用的数据集,需要巨大的计算资源才能在可接受的时间范围内完成计算工作。这样的大规模分析要求有效地使用基础基础结构。此外,任何分析都应完全可复制,并且必须公开使用工作流程,以允许其他研究人员了解计算结果背后的推理。在这里,我们介绍了可扩展的数据不可吻合的工作流程的宏基因组学-Toolkit,该工作流程分别自动化了从Illumina或Oxford Nanopore技术设备获得的简短和长元基因组读取。宏基因组学-ToolKit不仅提供元基因组工作流程中预期的标准功能,例如质量控制,组装,套件和注释,还提供独特的特征,例如基于各种工具的质粒识别,恢复无组成的微生物社区成员的恢复以及通过互联网模型的相互依赖模型的恢复,并发现了一个元素,并依赖于基本模型,并进行互联网组合。此外,元基因组学 - 库尔基特包括一个机器学习优化的组装步骤,该步骤量身定制元素组装程序要求的峰值RAM值以符合实际要求,从而最大程度地减少对专用高音硬件的依赖性。虽然可以在用户工作站上执行Metagenomics-Toolkit,但它还为有效的基于云的集群执行提供了多种优化。Metagenomics-Toolkit是开源的,可在https://github.com/metagenomics/metagenomics-tk上获得。我们将宏基因组学 - toolkit与五个常用的宏基因组工作流进行了比较,并通过在757 Metagenome数据集中从污水处理样本中执行元基因组学 - 静电库来证明其能力,以研究可能的污水核心微生物组。
我们对折叠空间的看法隐含地基于许多影响我们分析,解释和理解生物系统的假设 - 从蛋白质结构比较和分类到功能预测和进化分析。例如,是否有最佳的粒度来查看蛋白质结构相似性(例如建筑,拓扑或其他层面)?如果是这样,它的问题类型有何不同?同样,折叠空间的离散/连续二分法在结构生物信息学中至关重要,但仍未解决。折叠空间bin“类似”折叠的离散视图分为不同的非重叠组;不幸的是,这样的融合本固有地错过了许多遥远的关系。虽然诸如CATH,SCOP和ECOD之类的层次系统代表了蛋白质分类的主要步骤,但在蛋白质分类中,一种可扩展,客观和概念灵活的方法,较少对假设和启发式方法的依赖较少,但可以实现对折叠空间的更加系统和细微的探索,尤其是在进化中涉及进化的关系。以蛋白质结构的最新“乌尔堡”模型为基础,我们开发了一种新的方法来消除蛋白质相互关系。该框架称为“ Deepurfold”,植根于通过变分贝叶斯推断的深层生成建模,我们发现它对于跨蛋白质宇宙的比较分析很有用。批判性的深层利用其深层生成模型的学习嵌入,该模型占据了高维的潜在空间,并且可以根据给定的蛋白质进行蒸馏,以合并的表示,该表示的融合,结合序列,结构,生物物理和系统源。值得注意的是,deepurfold是结构指导的,
背景:乳腺癌是全球领先的健康问题,需要在复发预测和管理方面取得进步。使用CHATGPT的基于人工智能(AI)的临床决策支持系统(AI-CDSS)的开发解决了这一需求,目的是提高预测准确性和用户可访问性。目的:本研究旨在为基于Web的AI-CDSS应用程序开发和验证高级机器学习模型,利用ChatGPT的问答指导能力来增强数据的预处理和模型开发,从而改善了乳腺癌复发的预测。方法:这项研究的重点是通过利用3577名患者的三级医院乳腺癌注册中心(2004-2016)的数据来开发先进的机器学习模型。作为三级医疗中心,它接受了四个分支机构的推荐,即北部地区的3个分支机构和我们国家一个离岸岛上的1个分支机构,可以管理慢性疾病,但将包括乳腺癌在内的复杂手术病例转到主要中心,富含我们研究人群的多样性。模型培训从2004年到2012年使用了患者数据,随后使用2013年至2016年的数据进行了验证,从而确保了我们的预测模型的全面评估和鲁棒性。chatgpt是预处理和模型开发,有助于激素受体分类,年龄构成和单次编码的组成部分。诸如综合少数族裔过采样技术之类的技术解决了数据集的不平衡。使用了各种算法,包括轻梯度增强机,梯度提升和极端梯度提升,并使用诸如曲线下的面积,准确性,灵敏度和F 1尺度的指标评估它们的性能。
对表现出接收场的神经元的分析取决于生物体的空间位置,例如网格,位置或边界细胞,通常是从使用射击速率图绘制其在空间中的活性开始的。然而,映射方法是多种多样的,并取决于通常由实验者定性选择的调音参数,因此在整个研究中都有很大变化。诸如此类参数的小变化可能会显着影响结果,但是迄今为止尚未尝试对发射速率图进行定量研究。使用模拟数据集,我们检查了调谐参数,记录持久性和射击场大小如何影响使用最广泛使用的方法生成的空间图的准确性。对于每种方法,我们都发现了一个明确的参数子集,该参数产生了低误差射击率图并隔离了产生的参数1)可能的误差最小,2)帕托托 - 最佳参数集,这些参数集平衡,计算时间,位置场检测准确性和缺失值的外推。平滑的双变量直方图和平均移位直方图始终与最快的计算时间相关联,同时仍提供准确的地图。自适应平滑和嵌合方法被发现可以最有效地补偿低位置采样。内核平滑的确定性估计还可以很好地补偿了低采样的良好,并获得了准确的地图,但它也是测试最慢的方法之一。总体而言,在大多数情况下,双变量直方图,再加上空间平滑,这可能是最理想的方法。
为了保留其品种属性,已建立的葡萄品种(Vitis vinifera L. ssp. vinifera)必须进行克隆繁殖,因为它们的基因组是高度杂合的。马尔贝克是一种源自法国的品种,因生产高品质的葡萄酒而受到赞赏,是品种 Prunelard 和 Magdeleine Noire des Charentes 的后代。在这里,我们将 PacBio 长读段三重合并到从父母遗传的两个单倍体补体中,构建了马尔贝克的二倍体基因组组装。经过单倍型感知的重复数据删除和校正后,获得了两个单倍相的完整组装,且单倍型转换错误率非常低(< 0.025)。单倍相比对确定了 > 25% 的多态性区域。基因注释(包括 RNA-seq 转录组组装和从头算预测证据)导致两个单倍相的基因模型数量相似。利用注释的二倍体组装体对四个表现出浆果组成特征差异的马尔贝克克隆种质进行转录组比较。使用任一单倍体作为参考对成熟果皮转录组进行分析,得到了相似的结果,尽管观察到了一些差异。特别是,在仅以 Magdeleine 遗传单倍型为参考鉴定的差异表达基因中,我们观察到假设的半合子基因的过度表达。克隆种质 595 的浆果花青素含量较高,与脱落酸反应增加有关,可能导致观察到的苯丙烷代谢基因的过度表达和与非生物应激反应相关的基因的失调。总体而言,结果强调了生产二倍体组装体的重要性,以充分代表高度杂合的木本作物品种的基因组多样性并揭示克隆表型变异的分子基础。
为了保留其品种属性,已建立的葡萄品种(Vitis vinifera L. ssp. vinifera)必须进行克隆繁殖,因为它们的基因组是高度杂合的。马尔贝克是一种源自法国的品种,因生产高品质的葡萄酒而受到赞赏,是品种 Prunelard 和 Magdeleine Noire des Charentes 的后代。在这里,我们将 PacBio 长读段三重合并到从父母遗传的两个单倍体补体中,构建了马尔贝克的二倍体基因组组装。经过单倍型感知的重复数据删除和校正后,获得了两个单倍相的完整组装,且单倍型转换错误率非常低(< 0.025)。单倍相比对确定了 > 25% 的多态性区域。基因注释(包括 RNA-seq 转录组组装和从头算预测证据)导致两个单倍相的基因模型数量相似。利用注释的二倍体组装体对四个表现出浆果组成特征差异的马尔贝克克隆种质进行转录组比较。使用任一单倍体作为参考对成熟果皮转录组进行分析,得到了相似的结果,尽管观察到了一些差异。特别是,在仅以 Magdeleine 遗传单倍型为参考鉴定的差异表达基因中,我们观察到假设的半合子基因的过度表达。克隆种质 595 的浆果花青素含量较高,与脱落酸反应增加有关,可能导致观察到的苯丙烷代谢基因的过度表达和与非生物应激反应相关的基因的失调。总体而言,结果强调了生产二倍体组装体的重要性,以充分代表高度杂合的木本作物品种的基因组多样性并揭示克隆表型变异的分子基础。
为了保留其品种属性,已建立的葡萄藤品种(Vitis Vinifera L. ssp。vinifera)必须由于其高度杂合基因组而被克隆繁殖。马尔贝克(Malbec)是一种以法国原始的品种生产高质量的葡萄酒,是品种Prunelard和Magdeleine Noire des Charentes的后代。在这里,我们已经建立了Malbec的二倍体基因组组装,在PacBio Long的三人组合中读取了从任何一个父母继承的两个单倍体补充中。在单倍型的重复数据删除和校正后,以非常低的单倍型开关率(<0.025)获得了两个单倍相的完整组件。单倍相一致性识别> 25%的多态区域。基因注释,包括RNA-Seq转录组组装和从头算预测证据,两种单倍相的基因模型数量相似。在MALBEC的四个克隆辅助的转录组比较中,在浆果组成性状变化的四个克隆辅助中被利用。 使用任何一个单倍相作为参考的成熟果皮转录组分析产生了相似的结果,尽管观察到了一些差异。 尤其是,在仅以玛格德林属性单倍型为参考的差异表达基因中,我们观察到了假设半合子基因的过度占代表性。 总体而言,结果突出了产生二倍体组件以完全表示高度杂合木质作物品种的基因组多样性的重要性,并揭示了克隆表型变异的分子碱基。在浆果组成性状变化的四个克隆辅助中被利用。使用任何一个单倍相作为参考的成熟果皮转录组分析产生了相似的结果,尽管观察到了一些差异。尤其是,在仅以玛格德林属性单倍型为参考的差异表达基因中,我们观察到了假设半合子基因的过度占代表性。总体而言,结果突出了产生二倍体组件以完全表示高度杂合木质作物品种的基因组多样性的重要性,并揭示了克隆表型变异的分子碱基。克隆登录595的较高的浆果花青素含量与脱落酸反应增加有关,可能导致观察到观察到的苯基丙烷代谢基因的过表达以及对与非生物应激反应相关的基因失控。
1。jao,J.Y。等。微生物暗物质即将到来:挑战和机遇。国家科学评论8(2021)。2。Rinke,C。等。 对微生物暗物质的系统发育和编码潜力的见解。 自然499,431-437(2013)。 3。 Yarza,P。等。 使用16S rRNA基因序列将培养和未培养的细菌和古细菌的分类结合在一起。 自然评论微生物学12,635-645(2014)。 4。 Dykhuizen,D.E。 圣诞老人重新审视:为什么有这么多种细菌? Antonie van Leeuwenhoek国际通用与分子微生物学杂志73,25-33(1998)。 5。 Parte,A.C.,Carbasse,J.S。,Meier-Kolthoff,J.P.,Reimer,L.C。 &Göker,M。具有命名(LPSN)的原核生物名称清单移至DSMZ。 国际系统和进化微生物学杂志70,5607-5612(2020)。 6。 Chaffron,S.,Rehrauer,H.,Pernthaler,J. &von Mering,C。来自环境和全基因组序列数据共存微生物的全局网络。 基因组研究20,947-959(2010)。 7。 QIN,J.J。等。 通过元基因组测序建立的人类肠道微生物基因目录。 自然464,59-70(2010)。 8。 Methé,B.A。 等。 人类微生物组研究的框架。 自然486,215-221(2012)。 9。 lok,C。挖掘微生物暗物质。 10。Rinke,C。等。对微生物暗物质的系统发育和编码潜力的见解。自然499,431-437(2013)。3。Yarza,P。等。使用16S rRNA基因序列将培养和未培养的细菌和古细菌的分类结合在一起。自然评论微生物学12,635-645(2014)。4。Dykhuizen,D.E。圣诞老人重新审视:为什么有这么多种细菌?Antonie van Leeuwenhoek国际通用与分子微生物学杂志73,25-33(1998)。5。Parte,A.C.,Carbasse,J.S。,Meier-Kolthoff,J.P.,Reimer,L.C。 &Göker,M。具有命名(LPSN)的原核生物名称清单移至DSMZ。 国际系统和进化微生物学杂志70,5607-5612(2020)。 6。 Chaffron,S.,Rehrauer,H.,Pernthaler,J. &von Mering,C。来自环境和全基因组序列数据共存微生物的全局网络。 基因组研究20,947-959(2010)。 7。 QIN,J.J。等。 通过元基因组测序建立的人类肠道微生物基因目录。 自然464,59-70(2010)。 8。 Methé,B.A。 等。 人类微生物组研究的框架。 自然486,215-221(2012)。 9。 lok,C。挖掘微生物暗物质。 10。Parte,A.C.,Carbasse,J.S。,Meier-Kolthoff,J.P.,Reimer,L.C。&Göker,M。具有命名(LPSN)的原核生物名称清单移至DSMZ。国际系统和进化微生物学杂志70,5607-5612(2020)。6。Chaffron,S.,Rehrauer,H.,Pernthaler,J.&von Mering,C。来自环境和全基因组序列数据共存微生物的全局网络。基因组研究20,947-959(2010)。7。QIN,J.J。等。 通过元基因组测序建立的人类肠道微生物基因目录。 自然464,59-70(2010)。 8。 Methé,B.A。 等。 人类微生物组研究的框架。 自然486,215-221(2012)。 9。 lok,C。挖掘微生物暗物质。 10。QIN,J.J。等。通过元基因组测序建立的人类肠道微生物基因目录。自然464,59-70(2010)。8。Methé,B.A。 等。 人类微生物组研究的框架。 自然486,215-221(2012)。 9。 lok,C。挖掘微生物暗物质。 10。Methé,B.A。等。人类微生物组研究的框架。自然486,215-221(2012)。9。lok,C。挖掘微生物暗物质。10。自然522,270-273(2015)。Medema,M.H。,De Rond,T。&Moore,B.S。 采矿基因组阐明了生命的专业化学。 自然评论遗传学22,553-571(2021)。 11。 Pavlopoulos,G.A。 等。 通过全球宏基因组学解开功能性暗物质。 自然622,594-602(2023)。 12。 Altae-Tran,H。等。 揭示了稀有Terascale聚类的稀有CRISPR-CAS系统的功能多样性。 Science 382,EADI1910(2023)。 13。 Wilkinson,B。 &Micklefield,J。 采矿和工程自然产品生物合成途径。 自然化学生物学3,379-386(2007)。 14。 Chiang,C.Y。,Ohashi,M。&Tang,Y。通过异源表达和基因组挖掘的真菌天然产物生物合成的解密化学逻辑。 天然产品报告40,89-127(2023)。 15。 Goig,G.A。 等。 直接从临床样本中的全基因组测序,用于高分辨率基因组流行病学和耐药性监测:一项观察性研究。 柳叶刀微生物1,E175-E183(2020)。 16。 刘,Y.X。 等。 微生物组数据的扩增子和宏基因组分析的实用指南。 蛋白质和细胞12,315-330(2021)。 17。 Ustick,L.J。 等。 宏基因组分析揭示了海洋营养限制的全球规模模式。 科学372,287-291(2021)。 18。 Nissen,J.N。 等。Medema,M.H。,De Rond,T。&Moore,B.S。采矿基因组阐明了生命的专业化学。自然评论遗传学22,553-571(2021)。11。Pavlopoulos,G.A。等。通过全球宏基因组学解开功能性暗物质。自然622,594-602(2023)。12。Altae-Tran,H。等。 揭示了稀有Terascale聚类的稀有CRISPR-CAS系统的功能多样性。 Science 382,EADI1910(2023)。 13。 Wilkinson,B。 &Micklefield,J。 采矿和工程自然产品生物合成途径。 自然化学生物学3,379-386(2007)。 14。 Chiang,C.Y。,Ohashi,M。&Tang,Y。通过异源表达和基因组挖掘的真菌天然产物生物合成的解密化学逻辑。 天然产品报告40,89-127(2023)。 15。 Goig,G.A。 等。 直接从临床样本中的全基因组测序,用于高分辨率基因组流行病学和耐药性监测:一项观察性研究。 柳叶刀微生物1,E175-E183(2020)。 16。 刘,Y.X。 等。 微生物组数据的扩增子和宏基因组分析的实用指南。 蛋白质和细胞12,315-330(2021)。 17。 Ustick,L.J。 等。 宏基因组分析揭示了海洋营养限制的全球规模模式。 科学372,287-291(2021)。 18。 Nissen,J.N。 等。Altae-Tran,H。等。揭示了稀有Terascale聚类的稀有CRISPR-CAS系统的功能多样性。Science 382,EADI1910(2023)。 13。 Wilkinson,B。 &Micklefield,J。 采矿和工程自然产品生物合成途径。 自然化学生物学3,379-386(2007)。 14。 Chiang,C.Y。,Ohashi,M。&Tang,Y。通过异源表达和基因组挖掘的真菌天然产物生物合成的解密化学逻辑。 天然产品报告40,89-127(2023)。 15。 Goig,G.A。 等。 直接从临床样本中的全基因组测序,用于高分辨率基因组流行病学和耐药性监测:一项观察性研究。 柳叶刀微生物1,E175-E183(2020)。 16。 刘,Y.X。 等。 微生物组数据的扩增子和宏基因组分析的实用指南。 蛋白质和细胞12,315-330(2021)。 17。 Ustick,L.J。 等。 宏基因组分析揭示了海洋营养限制的全球规模模式。 科学372,287-291(2021)。 18。 Nissen,J.N。 等。Science 382,EADI1910(2023)。13。Wilkinson,B。 &Micklefield,J。 采矿和工程自然产品生物合成途径。 自然化学生物学3,379-386(2007)。 14。 Chiang,C.Y。,Ohashi,M。&Tang,Y。通过异源表达和基因组挖掘的真菌天然产物生物合成的解密化学逻辑。 天然产品报告40,89-127(2023)。 15。 Goig,G.A。 等。 直接从临床样本中的全基因组测序,用于高分辨率基因组流行病学和耐药性监测:一项观察性研究。 柳叶刀微生物1,E175-E183(2020)。 16。 刘,Y.X。 等。 微生物组数据的扩增子和宏基因组分析的实用指南。 蛋白质和细胞12,315-330(2021)。 17。 Ustick,L.J。 等。 宏基因组分析揭示了海洋营养限制的全球规模模式。 科学372,287-291(2021)。 18。 Nissen,J.N。 等。Wilkinson,B。&Micklefield,J。采矿和工程自然产品生物合成途径。自然化学生物学3,379-386(2007)。14。Chiang,C.Y。,Ohashi,M。&Tang,Y。通过异源表达和基因组挖掘的真菌天然产物生物合成的解密化学逻辑。 天然产品报告40,89-127(2023)。 15。 Goig,G.A。 等。 直接从临床样本中的全基因组测序,用于高分辨率基因组流行病学和耐药性监测:一项观察性研究。 柳叶刀微生物1,E175-E183(2020)。 16。 刘,Y.X。 等。 微生物组数据的扩增子和宏基因组分析的实用指南。 蛋白质和细胞12,315-330(2021)。 17。 Ustick,L.J。 等。 宏基因组分析揭示了海洋营养限制的全球规模模式。 科学372,287-291(2021)。 18。 Nissen,J.N。 等。Chiang,C.Y。,Ohashi,M。&Tang,Y。通过异源表达和基因组挖掘的真菌天然产物生物合成的解密化学逻辑。天然产品报告40,89-127(2023)。15。Goig,G.A。 等。 直接从临床样本中的全基因组测序,用于高分辨率基因组流行病学和耐药性监测:一项观察性研究。 柳叶刀微生物1,E175-E183(2020)。 16。 刘,Y.X。 等。 微生物组数据的扩增子和宏基因组分析的实用指南。 蛋白质和细胞12,315-330(2021)。 17。 Ustick,L.J。 等。 宏基因组分析揭示了海洋营养限制的全球规模模式。 科学372,287-291(2021)。 18。 Nissen,J.N。 等。Goig,G.A。等。直接从临床样本中的全基因组测序,用于高分辨率基因组流行病学和耐药性监测:一项观察性研究。柳叶刀微生物1,E175-E183(2020)。16。刘,Y.X。等。微生物组数据的扩增子和宏基因组分析的实用指南。蛋白质和细胞12,315-330(2021)。17。Ustick,L.J。等。宏基因组分析揭示了海洋营养限制的全球规模模式。科学372,287-291(2021)。18。Nissen,J.N。 等。Nissen,J.N。等。使用深层自动编码器改进了元基因组套筒和组装。自然生物技术39,555-560(2021)。
3美国加利福尼亚州圣何塞州立大学摘要:加密货币市场的迅速发展的景观提出了独特的挑战和机遇。 加密货币汇率的每日重大变化导致与加密资产的投资相关的重大风险。 本研究旨在使用高级机器学习模型来预测加密货币的价格。 在经过测试的预测和验证效率测试的七个模型中,中性网络的表现最佳,最小误差。 因此,使用长期记忆(LSTM)神经网络用于预测未来趋势。 LSTM模型非常适合分析财务数据中的复杂依赖性。 从历史数据收集,数据预处理,功能工程,归一化和综合套筒开始,对50个加密货币进行了全面的探索数据分析(EDA)。 基于诸如交易量,市值和价格趋势等标准确定了最佳性能者。 使用Python实施了LSTM模型,以预测90天的价格移动数据,以检查复杂的模式和关系。 模型性能通过MAE和RMSE等性能指标验证。 的发现与自适应市场假设(AMH)保持一致,该假设表明,加密货币市场表现出受不断发展的市场状况和投资者行为影响的动态效率。 该研究显示了机器学习模型在金融经济学中的潜力及其在增强风险管理策略和投资决策过程中的作用。3美国加利福尼亚州圣何塞州立大学摘要:加密货币市场的迅速发展的景观提出了独特的挑战和机遇。加密货币汇率的每日重大变化导致与加密资产的投资相关的重大风险。本研究旨在使用高级机器学习模型来预测加密货币的价格。在经过测试的预测和验证效率测试的七个模型中,中性网络的表现最佳,最小误差。因此,使用长期记忆(LSTM)神经网络用于预测未来趋势。LSTM模型非常适合分析财务数据中的复杂依赖性。从历史数据收集,数据预处理,功能工程,归一化和综合套筒开始,对50个加密货币进行了全面的探索数据分析(EDA)。基于诸如交易量,市值和价格趋势等标准确定了最佳性能者。使用Python实施了LSTM模型,以预测90天的价格移动数据,以检查复杂的模式和关系。模型性能通过MAE和RMSE等性能指标验证。的发现与自适应市场假设(AMH)保持一致,该假设表明,加密货币市场表现出受不断发展的市场状况和投资者行为影响的动态效率。该研究显示了机器学习模型在金融经济学中的潜力及其在增强风险管理策略和投资决策过程中的作用。关键字:货币预测,金融经济学,LSTM神经网络,机器学习,模型预测。引言加密货币作为一个名为Satoshi Nakamoto的匿名实体(2020年1月)成为了革命性的金融创新。比特币于2009年推出,并标志着新的数字货币时代的开始(Malik,2016年)。中村的白皮书将比特币描述为一种分散的电子现金系统,可促进安全的直接交易而不依赖中间人(Nakamoto&Bitcoin,2008)。在比特币的成功之后,开发了许多替代的加密货币,例如以太坊,波纹和莱特币。今天,加密货币景观包括成千上万的数字资产,其中包含金融,游戏,供应链和其他地区的应用(Chlioumi,2022年)。加密货币市场的快速发展给贸易商和投资者带来了机会和挑战。与传统金融市场不同,加密货币在分散的环境中运作,其特征是流动性高和价格频繁波动。这些独特的市场动态需要先进的预测建模技术才能准确预测未来的价格变动(Lubogo,2022)。预测加密货币的行为可以增强交易策略并支持风险管理决策。预测可以为监管框架提供信息,并增强市场信心。但是,这些线性模型在捕获财务时间序列中非线性和复杂依赖性方面的局限性导致了机器学习技术的探索。随着加密货币市场的不断发展,预期价格变动和市场行为的能力对于预测可持续增长并融入更广泛的金融景观至关重要(Nabila等,2021)。机器学习模型由于从历史数据中学习复杂模式的能力而获得了时间序列预测(Elsayed等,2021)。LSTM模型,一种复发性神经网络(RNN),被广泛用于预测长期变化和顺序关系。LSTM模型特别适合建模加密货币价格的非线性和时间性质(Liu等,2020)。研究表明,LSTM模型在预测股票价格,汇率和现在的加密货币价格方面的功效。例如,Ghosh和Neufeld(2022)将LSTMS应用于标准普尔500指数,发现LSTMS胜过