我们很高兴为您呈现国际晶体学联合会 (IUCr) 期刊的虚拟文章合集,这些文章探讨了人工智能 (AI) 和机器学习 (ML) 在结构科学中的应用 (https://journals.iucr.org/special_issues/2024/ML/)。人工智能/机器学习正在彻底改变我们的日常生活。尽管机器学习和深度学习 (DL) 的基础源自学术计算、数学和脑理论领域(McCulloch & Pitts,1943 年;Rosenblatt,1958 年),但其早期的许多社会影响都体现在商业领域。然而,如今物理学家们正在将这些发展成果应用于他们自身的科学研究(Choudhary 等人,2021 年),晶体学也不例外。因此,现在非常及时地汇总了在《晶体学报》(A、B 和 D 部分)、IUCrJ 和《同步辐射杂志》上发表的越来越多的 AI/ML 论文。我们还注意到《应用晶体学杂志》上发表的有关 AI 的相关虚拟合集(网址为 https://journals.iucr.org/special_issues/2024/ANNs/)以及《晶体学报》A 部分最近关于深度学习在蛋白质晶体学中的应用的主导文章(Matinyan 等人,2024 年)。本文的目的不是回顾虚拟合集中的每篇论文,而是鼓励您探索论文本身。因此,在表 1 中,我们总结了每篇论文使用的科学目标和 AI/ML 方法,使您可以快速导航到您最感兴趣的论文。在本文中,我们力求提供一些更高层次的主题,并按机器学习和领域主题对部分论文进行分组,以帮助您了解晶体学领域的发展历程,以及科学家目前如何利用人工智能/机器学习作为工具来解决他们的科学问题。这些论文几乎涵盖了所有类型的机器学习。无监督学习是一种方法,在这种方法中,机器学习算法在没有任何先验知识的情况下,尝试对数据集进行聚类(即寻找相似信号)或提取出能够解释更大信号集行为的不同信号集。在监督学习中,算法在大量先验数据上进行“训练”,之后,它们可以根据从训练数据中学到的知识对给定的新数据进行分类。这种分类问题的例子是训练算法区分猫和狗的图片(Subramanian,2018)。监督学习还可以用于执行回归而不是分类,即对数据集进行函数拟合。最后,各种生成式机器学习方法旨在根据一些基于大量学习到的响应进行训练的输入提示,生成新的输出。Deepfake 视频和音频技术以及 ChatGPT (OpenAI, 2024 a) 就是生成式人工智能的例子。区分不同AI/ML方法的另一种方法是基于算法的内部结构。广义上讲,这些方法可以分为传统ML和深度神经网络(深度学习,简称DL)。传统方法基于统计方法和线性代数,包括基于树的方法、逻辑回归和矩阵分解方法。深度学习受大脑神经元结构的启发,构建了高度非线性的图形数学结构,信息通过网络从输入端传递到输出端,同时在每一层都经历非线性变换。数据在网络中的转换和传输由数千个参数控制,这些参数通过算法进行更新,使网络能够
使用人工智能来处理衍射图像的挑战是需要组装大型且精确设计的训练数据集的挑战。为了解决这个问题,开发了一个称为Resonet的代码库,用于合成这些数据的衍射数据和培训残留神经网络。在这里,共振的两个人均能力:(i)晶体分辨率的解释和(ii)重叠晶格的识别。通过同步加速器实验和X射线自由电子激光实验对衍射图像的汇编进行了测试。至关重要的是,这些模型很容易在图形处理单元上执行,因此可以显着超过常规算法。目前使用共振来为斯坦福同步辐射光源的宏观分子晶体学用户提供实时反馈,但其简单的基于Python的接口使其易于嵌入其他处理框架。这项工作强调了基于物理的模拟对训练深神网络的实用性,并为开发其他模型的开发奠定了基础,以增强衍射收集和分析。
有许多因素可能会影响电池的降解行为,例如充电循环的数量或充电率。在这里,我们研究了工作温度对锂离子正极电极中微结构结构降解的影响。为此,微型结构的特征是在不同工作温度下在6C(10分钟)下循环的阴极,即20℃,30°C,30°C,40°C和50°C,每种工作条件扫描扫描电子显微镜(SEM)图像(SEM)图像的crossection Elector Simarcopoy(SEM)图像。5 mn 0。3 CO 0。2 O 2(NMC532)电极,以确定结构描述符,例如全局颗粒孔隙率,裂纹尺寸/长度/宽度/宽度分布,孔隙度以及单个颗粒的特定表面积分布。此外,已经部署了一种立体方法来研究局部粒子孔隙度,该孔隙度是距离粒子中心的距离的函数。结果表明,颗粒孔隙度随循环温度的升高而增加。粒子孔隙度在粒子中心最大,沿粒子半径降低至外部。粒子表面积在四个循环温度的老化条件下相似。
免责声明本文件是作为由美国政府机构赞助的工作的帐户准备的。美国政府和劳伦斯·利弗莫尔国家安全,有限责任公司,或其任何雇员均不对任何信息,设备,产品或流程的准确性,完整性或有用性承担任何法律责任或责任,或承担任何法律责任或责任,或者代表其使用不会侵犯私有权利。以本文提及任何特定的商业产品,流程或服务,商标,制造商或其他方式不一定构成或暗示其认可,建议或受到美国政府或Lawrence Livermore National Security,LLC的认可。本文所表达的作者的观点和意见不一定陈述或反映美国政府或劳伦斯·利弗莫尔国家安全,有限责任公司的观点和观点,不得用于广告或产品代表目的。
在过去的二十年中,微流体学取得了长足的进步,现在是时候对 2005 年出版的《微流体学导论》第一版进行认真的更新了。事实上,第二版不仅仅是一次更新。与第一版相比,它保留了相同的结构、相同的精神、相同的尝试,尽可能从物理角度深入、简单地解释事物,但它不能简化为更新。当前版本是对第一版的完全重写,并借鉴了过去二十年在该领域收集的大量信息。二十年来收集了如此多的信息。对该领域的愿景进行了如此多的修订。20 世纪 90 年代看似不可能的事情,十年后催生了一个重要的行业。这就是下一代测序 (NGS) 的情况。看似革命性的东西最终却令人失望。微流控技术的历史充满了梦想成真和有吸引力的证据被证明是错误的。让我们回到世纪之交。当时,微流控市场(即没有喷墨打印)规模很小,尽管经常有人宣称微流控技术将彻底改变二十一世纪,但人们对该技术是否有潜力在市场上站稳脚跟仍持怀疑态度。常识导致了这样一个理论,即在工业规模下,在没有泄漏、堵塞、气泡或不受控制的吸附的情况下,驱动流体通过微小通道是不可能的,而事实上,这是错误的。相反的观点认为,创建一个复杂、功能齐全的微流体设备很简单,这是不现实的。尽管如此,成功的微流体产品还是出现了,与此同时,该技术渗透到了越来越多的新领域。市场以两位数的速度稳步增长,如今已达到 170 亿美元。目前,每年售出数亿台设备。例如,每年有 120 万个用于基因测序的 Illumina 微流体流动池出货。与此同时,毛细现象、润湿、滑移和纳米流体传输等基本现象得到了更好的理解,或者在许多令人费解的情况下,只是得到了理解。多年来,该领域的早期愿景基于与微电子学的严格类比,逐渐转向一种新范式,其中微流体工具箱不再局限于 MOS-FET 替代品,而是采用了更广泛的材料和机制。
简介:所有心脏瓣膜的正常发育都需要高度协调的信号通路和下游介体。虽然基因组变体可能导致先天性瓣膜疾病,但环境因素也可以发挥作用。生命瓣膜后期钙化是主动脉瓣狭窄的主要原因,这是一种进行性疾病,可能导致心力衰竭。当前对先天性瓣膜疾病和瓣膜钙化原因的研究正在使用多种高通量方法,包括转录组学,蛋白质组学和基因组学。来自生物知识库的高质量遗传数据对于促进这些高通量数据集的分析和解释至关重要。基因本体论(GO,http://geneontology.org/)是用于解释这些数据集的主要生物信息学资源,因为它提供了描述所有生物体基因产物的作用的结构化,可计算的知识。UCL功能基因注释小组的重点是人类基因产品的注释。确定了转录组,蛋白质组学和基因组数据中包含的GO注释没有提供有关心脏瓣膜开发的精确描述性信息,我们启动了一个集中的项目来解决此问题。
莱切是意大利南部一座历史名城,也是普利亚大区最重要的城市之一,拥有丰富的巴洛克式建筑古迹和建筑群。莱切位于意大利靴子脚后跟处,位于亚得里亚海和爱奥尼亚海之间的“萨兰托”地区。该地区拥有数公里的沿海景观、蓝色的海水环绕的海湾、沙丘和白色的沙滩;它拥有丰富而美味的美食传统,并提供了生动活泼的文化场景。在莱切,您可以漫步穿过这座城市独特的建筑。一些必看的地方是:大教堂广场、圣十字大教堂、罗马圆形剧场、Ex Convitto Palmieri、那不勒斯门和圣比亚焦门。莱切提供许多餐饮选择,距离会议地点仅有几步之遥。Osteria da Angiulino 是品尝萨兰托传统美食的绝佳选择,价格实惠。最好的两家披萨店是 400 Gradi 和 La Gigante,您可以在那里分别找到“那不勒斯”和“萨兰托”风格的披萨。La Barca di Mario 是市中心最好的海鲜餐厅之一。肉食爱好者不能错过 La Locanda del Macellaio,这是莱切最好的传统“braceria”之一,或者 Il Carrettino 是城里最好的汉堡。如果您想吃一顿精致的晚餐,3 Rane 餐厅是一颗隐藏的小宝石。如果您想在深夜小酌,可以去 Quanto Basta 和 Prohibition 喝鸡尾酒,或者去 Cantiere Hambirreria 喝啤酒。这绝不是一份详尽的清单。莱切不断发展,每周都会出现新的值得尝试的地方。不要害怕探索。
Krabbe病(KD)是由GALC基因突变引起的溶酶体储存疾病(LSD)。有50多种单遗传LSD,在很大程度上阻碍了儿童的正常发育,并且经常导致过早死亡。目前尚无LSD的治疗方法,可用的治疗通常不足,表演短,并且并非没有合并症或长期副作用。过去30年中,我们对LSD病理学以及治疗方案的理解取得了重大进步。最近根据这些进展开始了两项基于基因治疗的临床试验,NCT04693598和NCT04771416。本评论将讨论我们对KD的了解如何到达今天的位置,重点关注临床研究,以及发现的内容如何证明对其他LSD的治疗有益。
摘要:易受攻击的斑块进展和破裂风险的评估和预测对于诊断,管理和治疗心血管疾病以及可能预防急性心血管事件(例如心脏病发作和中风)至关重要。然而,对斑块脆弱性评估的准确评估及其未来变化的预测需要准确的斑块帽厚度,组织成分和结构定量和机械应力/应变计算。多模式性内血管内超声(IVU),光学相干断层扫描(OCT)和血管造影图像数据和随访的血管造影图像数据是从十名患者中获取的,以获得用于模型构建的准确可靠的斑块形态。为228个匹配的IVUS + OCT切片构建了三维薄片薄度有限元模型,以获得斑块应力/应变数据进行分析。定量斑块盖的厚度和应力/应变指数作为替代定量斑块漏洞指数(PVIS),并采用机器学习方法(随机森林)来预测使用实际患者IVUS + OCT随访数据的PVI变化作为金标准。我们的预测结果表明,CAP-PVI(C-PVI),平均CAP应力PVI(emem-PVI)和平均盖CAP菌株PVI(平均值)(平均值)的最佳预测精度为90.3%(AUC = 0.877),85.6%,85.6%(AUC = 0.867)和83.3%(AUC = 0.867)和83.3%(AUC = 0.809)。最佳组合预测因子比最佳单个预测因子的预测准确性提高了6.6%,平均S-PVI为10.0%,平均SN-PVI为8.0%。结合机械和形态学预测因子可能会导致更好的预测准确性。我们的结果证明了使用多模式IVUS + OCT图像的电势准确,有效地预测斑块盖的厚度和应力/应变指数的变化。
大规模空间基因表达数据的增长需要新的计算工具,以在其天然空间环境中提取基因表达的主要趋势。在这里,我们将一个不受监督和可解释的计算框架描述为(1)通过插入缺失的体素的插入的预处理的3D空间基因表达数据集,(2)使用稳定性驱动的非阴性矩阵分解区域的3D空间基因表达曲线的主要模式(PPS),并[stanmf)技术和(stanmf)技术和(stanmf)技术和(3)本体论。该框架,称为OSNMF(通过Stanmf发现),识别纯粹来自艾伦小鼠脑图中数千个3D空间基因表达谱的PPS。这些3D PPS具有小鼠大脑的稳定和空间相干区域,可能没有人工和偏见。我们证明,OSNMF PPS提供了与专家通知的大脑区域的组合高度相关的新大脑模式,同时还纯粹基于基于空间基因表达数据的唯一本体论。与主成分分析(PCA)和其他聚类算法相比,我们的PPS具有更好的空间连贯性,更准确地匹配专家标签,并且在多个自举模拟中更稳定。我们还使用OSNMF来定义标记基因并建立推定的空间基因相互作用网络。我们的发现突出了OSNMF迅速从大量空间基因表达数据中迅速生成新的地图集的能力,而没有监督并发现了使用常规手动方法很难辨别的大脑区域之间的新型关系。