2021 年 5 月 17 日至 21 日,由空间科学研究所 (SSI) 数据科学中心 (CDS) 主办、美国国家科学基金会 (NSF) 赞助的完全虚拟会议“统计方法和机器学习在空间科学中的应用”举行 (http://spacescience.org/workshops/mlconference2021.php)。此次活动汇集了空间科学各个学科(如太阳物理学和高空物理学、行星和系外行星科学、地质学、天体生物学和天文学)和行业的专家,以利用统计学、数据科学、人工智能 (AI) 方法和信息理论方面的进步,旨在利用这些领域的海量数据改进分析模型及其预测能力。这次多学科会议为行业专业人士、高级科学家、早期职业研究人员和学生提供了一个充满活力的论坛,让他们使用各种高级统计学技术和方法展示他们的最新成果,以增强他们对人工智能最新趋势的了解,并参与未来合作的平台。会议涵盖了广泛的研究主题,例如高级统计方法、深度学习和神经网络、时间序列分析、贝叶斯方法、特征识别和特征提取、结合机器学习(ML)技术的物理模型和代理模型、空间天气预报和应用人工智能的其他领域的研究主题、模型验证和不确定性量化、空间等离子体中的湍流和非线性动力学、物理信息神经网络、信息论以及数据重建和数据同化。自 20 世纪 90 年代以来,人工智能方法已经应用于日地物理领域的各种问题( Newell 等,1991 ;Lundstedt,1992 ;Lundstedt,1996 ;Wintoft 和 Lundstedt,1997 ;Wing 等,2005 ;Lundstedt,2006 )。其中包括极光粒子沉降的分类、太阳风速度的预测、地磁扰动和行星 K 指数 K p ,用于表征
在过去的几十年中,在轨驻留物体数量不断增长已成为世界各地航天机构和研究机构的主要关注点之一。在此背景下,碎片进一步增加了空间碎片的数量,从操作上讲,尽快确定事件时期至关重要,即使只有由初始轨道确定 (IOD) 过程得到的单个碎片轨道状态。这项工作说明了碎片时期检测器 (FRED) 算法,该算法通过统计方法处理该问题,从单个碎片 IOD 结果(通过平均状态和协方差表示)和父星历表(假设为确定性)开始。该过程用多元正态分布填充碎片星历表,对于每对样本父代,首先在时间窗口上计算通过最小轨道交叉距离 (MOID) 的时期,然后按时间聚类。对于每个簇,都会导出三维 MOID 和三维相对距离分布(通常是非正态分布,后者是在母星通过 MOID 时计算的),并对它们的相似性进行统计评估。最后,将两个分布之间最匹配的簇视为最佳候选,并从母星通过 MOID 时返回碎片时期,以平均值和标准差表示。通过数值分析评估 FRED 算法的性能。还讨论了从雷达测量开始嵌入 IOD 过程的操作案例。
高效可靠的量子态认证对于各种量子信息处理任务以及量子技术实施的总体进展至关重要。近几年来,出现了几种使用高级统计方法以资源高效的方式认证量子态的方法。本文回顾了该领域的最新进展。首先解释如何用假设检验的语言讨论量子态的验证和保真度估计。然后,详细解释了使用局部测量或局部操作辅助测量和经典通信来验证纠缠态的各种策略。最后,讨论了该问题的几种扩展,例如量子信道的认证和纠缠的验证。
SARS-CoV-2 病毒已成为 21 世纪最大的流行病,感染人数达数亿,死亡人数达数千万人。世界各地的科学家都在竞相开发疫苗和新药,以战胜这场流行病并为 COVID-19 疾病提供有效的治疗方法。因此,迫切需要更好地了解 SARS-CoV-2 的发病机制如何受到病毒突变的影响,并确定病毒基因组中可作为新疗法稳定靶点的保守片段。在这里,我们介绍了一种文本挖掘方法,可直接从参考(祖先)全基因组序列估计基因组片段的可变性。该方法依赖于根据基因组片段在整个基因组中的空间分布和频率来计算其重要性。为了验证我们的方法,我们对近 80,000 个公开可用的 SARS-CoV-2 前身全基因组序列中的病毒突变进行了大规模分析,并表明这些结果与用于关键字检测的统计方法预测的片段高度相关。重要的是,这些相关性在密码子和基因水平以及基因编码区都成立。使用文本挖掘方法,我们进一步确定了可能成为基于 siRNA 的抗病毒药物候选者的密码子序列。值得注意的是,这项研究中确定的候选者之一对应于刺突糖蛋白表位的前七个密码子,这是唯一一种与人类蛋白质不匹配的 SARS-CoV-2 免疫原性肽。
补课政策 除了被取消的作业外,任何缺课作业都不会得到补课。被取消的分数不是假期!它们旨在自动处理学生在学期中通常会积累的少数借口。完成你能完成的每一项作业,因为你可能在某些时候出于正当理由(即不可避免的个人问题或技术困难)需要被取消的分数。如果你缺席的考试或作业比因有理由缺席而被取消的还多,你必须尽快向你的导师发送有效的文件。如果你缺席了很多作业,无论是由于有理由还是无理由缺席,你都可能需要退出课程。学术诚信学生可以通过审查彼此的作业、建议修改和提供有用的提示来一起完成家庭作业和练习作业。但是,你应该为每个问题做自己的工作。不允许在测试或测验上进行协作。此外,在参加任何考试之前,请查看 Canvas 上的在线考试说明。任何违反学术诚信政策的行为都将报告给学生事务办公室主任。处罚力度从作业/考试零分到开除学籍不等。办公时间办公时间为每周一、三、五上午 9:00 至 11:0。在正常办公时间之外,您可能需要至少提前一天联系讲师以安排会面时间。如果您对成绩、一般课程政策有疑问,或者对某个概念有困难,请利用这些办公时间。如果您对课程概念有困难,请做好准备参加会议,阅读教科书部分并尝试解答 MyMathLab 中的问题。您应该把这份作业带到会议上,以便您的讲师更有效地帮助您。
摘要 我们引入了一种新的统计和变分相位估计算法 (PEA)。与仅返回特征相位估计的传统和迭代 PEA 不同,所提出的方法可以利用用于迭代 PEA (IPEA) 的硬件的简化版本从给定的酉矩阵确定任何未知的特征态-特征相对。这是通过将 IPEA 类电路的概率输出视为特征态-特征相接近度量来实现的,使用此度量来估计输入状态和输入相位与最近的特征态-特征相对的接近度,并通过输入状态和相位的变分过程接近该对。该方法可以搜索整个计算空间,也可以有效地在某个指定范围(方向)内搜索特征相(特征态),从而使那些对其系统有一定先验知识的人可以搜索特定的解决方案。我们展示了使用 Qiskit 包在 IBM Q 平台和本地计算机上对该方法的模拟结果。
大脑由许多功能上不同的区域组成。该组织支持分布式处理[242_TD $ dif],并且需要跨区域的信号协调。我们对不同地区神经元种群如何相互作用的理解仍处于起步阶段。随着跨多个大脑区域的大量神经元的记录的可用性增加了,因此需要非常适合解剖和审问这些记录的统计方法。在这里,我们审查已经或可以应用于此类记录的多元统计方法。通过利用人口反应,thesemethodscanprovidearichdescriptionofinter-inter-thereal相互作用。同时,这些方法可以引入解释性挑战。因此,我们通过讨论如何解释这些方法的输出来进一步理解我们对美族间相互作用的理解来得出结论。
诱发电位 (EP) 是嵌入自发性脑电图活动 (EEG) 中的离散信号。从噪声中提取它们需要重复记录。视觉或听觉刺激触发采集系统,然后收集“诱发电位”。诱发电位不同于自发性神经活动 (EEG),因为它与触发“事件”同步。实际上,触发事件的信号用于采集诱发电位信号。诱发电位 (PE) 被定义为大脑有限区域相对于另一个电中性区域的电势的瞬态变化。EP 由放置在活动结构发出的电场中的电极捕获,并与所谓的“参考”电极检测到的电位进行比较。当参考电极捕获脑神经活动时,传感器系统称为双极。另一方面,当参考电极位于没有大脑活动的区域(例如耳垂)时,传感器系统称为单极。在最好的情况下,我们刚才看到的感兴趣的诱发电位 (PE) 是在离源很远的地方捕获的,其幅度非常小,不超过十微伏。此外,它嵌入在电极捕获的连续大脑活动(EEG 高于 100 微伏)中。PE 有时低于放大器的背景。因此,在检查其特性之前,有必要从背景噪声中提取 PE。40 年来使用的经典方法是平均法。该方法由同步连续响应的平均值组成。诱发电位是一种根据受试者的注意力而发展的大脑活动,因此平均值不足以令人满意地研究它。
许多配体的灵活性使得这些计算变得困难,需要开发和使用特殊方法。以下两个例子说明了对此类工具的需求:蛋白酶抑制剂的设计和与特定 MHC 受体结合的肽抗原的分析和设计。我们回顾了从刚体对接扩展到柔性对接的计算概念,以及以下重要的柔性对接和设计策略:(a) 蒙特卡洛/分子动力学对接,(b) 现场组合搜索,(c) 配体构建,以及 (d) 位点映射和片段组装。讨论了使用经验自由能作为目标函数。由于方法学的快速发展,大多数新方法仅在有限数量的应用上进行了测试,并且可能会改进更传统的计算或图形工具获得的结果。