(合著者:议员 Achadjian、Alejo、Travis Allen、Atkins、Baker、Bigelow、Bloom、Bonta、Brough、Brown、Burke、Calderon、Campos、Chang、Chau、Chávez、Chiu、Chu、Cooley、Cooper、Dahle、Daly、Dodd、Eggman、Frazier、Gallagher、Cristina Garcia、Eduardo Garcia、Gatto、Gipson、Gomez、Gonzalez、Gordon、Gray、Grove、Hadley、Harper、Roger Hernández、Holden、Irwin、Jones、Kim、Lackey、Levine、Linder、Lopez、Low、Maienschein、Mayes、McCarty、Medina、Melendez、Mullin、Nazarian、Obernolte、O’Donnell、Patterson、Quirk、Rendon、Rodriguez、Salas、Santiago、Steinorth、Mark Stone、Thurmond、Ting、 Wagner、Waldron、Weber、Wilk、Williams 和 Wood)(合著者:参议员 Bates、Block、Liu、Vidak 和 Wieckowski)
(HbO) 和脱氧 (HbR) 血红蛋白可以分别评估 HbO 和 HbR 的浓度变化。1 尽管 fNIRS 信号被认为对运动具有相对耐受性,2 但是由于运动伪影引起的光强度突然变化,数据质量可能会降低。3 结果表明,两种波长的动态特性为伪影检测和校正提供了重要信息。4 然而,当前用于运动伪影校正的技术(例如小波滤波、分解、样条插值等)通常假设两种波长的行为在时间上相似,因此无法利用两种波长提供的结构化信息。5 – 7 二维 (2D) 分析要求对具有更多维度的数据(例如 fNIRS 数据)在处理之前进行表面展开,例如分别处理两种波长或 HbO 和 HbR。因此,其中一些二维分析工具被迫施加其他非生理约束,例如主成分分析(PCA)中的正交性或独立成分分析(ICA)的统计独立性。尽管有几种方法可以实现 PCA,例如降维、分类、从信号分解的角度来看,PCA 旨在提取所谓的主成分,即可解释 fNIRS 中信号活动最大方差的成分。6、7、10、11 在时间 PCA 中,数据被分解为成分之和,每个成分由两个向量的乘积形成:一个代表时间主成分,另一个代表相应的地形(每个通道的分数)。PCA 的一个基本问题是仅由两个特征(时间和空间)定义的成分不是唯一确定的。因此,不同成分的对应时间特征之间必须具有正交性。 7、12、13然而,脑信号之间的正交性是一种非生理约束。即使有这种限制,提取的主成分也不是完全唯一的,因为任意旋转轴不会改变数据的解释方差。这导致研究人员使用不同的数学标准作为选择特定旋转的基础(例如,Varimax、Quartimax 和 Promax)。在 fNIRS 中,PCA 还被应用于目标时间间隔(tPCA),即仅在与发音或其他头部运动相关的伪影发生的期间,而不是在整个未分割的信号期间。3、14与基于小波的滤波和样条插值相比,这种类型的有针对性的校正可以产生更好的信号质量,同时也降低了改变信号整体完整性的风险。3虽然 PCA 非常常见且易于使用,一些作者已经讨论了其作为伪影校正方法的缺陷和注意事项。5、15
o 例如,在具有大倾斜角的钟摆轨道上飞行(这会增加对东西重力变化的敏感性)将需要进一步研究,因为由此产生的两个航天器的相对速度可能对于 LRI 操作来说太高。o 对于低于 420 公里的高度(为了进一步增加对重力变化的敏感性),非重力力的增加幅度可能对于加速度计来说太大,可能需要更复杂的 AOCS。o 将航天器的分离从 220 公里增加到 300 或 400 公里(这将降低加速度计误差的影响)另一方面会增加两颗卫星之间的指向要求,这可能会抵消大距离的积极影响。所有这三个都需要在后续研究中进一步调查。
零知识证明(ZKP)是一种强大的加密原理,用于许多分散或以隐私为中心的应用程序。但是,ZKP的高开销可以限制其实际适用性。我们设计了一种编程语言OU,旨在在编写有效的ZKP时减轻程序员的负担以及编译器框架Lian,该框架可以自动化对计算集群的语句分析和分布。lian使用编程语言语义,形式方法和组合优化,将OU程序自动将OU程序划分为有效尺寸的块,以进行并行ZK提供和/或验证。我们贡献:(1)一种前端语言,用户可以在熟悉的语法中将证明语句写为命令式程序; (2)自动分析程序并将其编译成优化的IR的编译器体系结构和实现,可以将其提升为各种ZKP构造; (3)基于伪树状优化和整数线性编程的切割算法,将指令重新定义,然后将程序分配为有效尺寸的块,以进行并行评估和有效的状态和解。
Transformer 模型的成功将深度学习模型规模推向了数十亿参数,但单 GPU 的内存限制导致在多 GPU 集群上进行训练的需求迫切。然而,选择最优并行策略的最佳实践仍然缺乏,因为它需要深度学习和并行计算领域的专业知识。Colossal-AI 系统通过引入统一接口将模型训练的顺序代码扩展到分布式环境,解决了上述挑战。它支持数据、管道、张量和序列并行等并行训练方法,并集成了异构训练和零冗余优化器。与基线系统相比,Colossal-AI 在大规模模型上可以实现高达 2.76 倍的训练加速。
摘要 — 本文介绍了一种基于视觉的控制策略,使用一种新型视觉传感器跟踪地面目标,该传感器为每个像素元素配备一个处理器。这使得计算机视觉任务能够以高效的方式直接在焦平面上执行,而无需使用单独的通用计算机。该策略使小型、灵活的四旋翼无人机 (UAV) 能够以最少的计算工作量和低功耗从近距离跟踪目标。为了评估该系统,我们瞄准了一辆由混沌双摆轨迹驱动的车辆。目标接近度和车辆的巨大、不可预测的加速度给无人机带来了挑战,使其难以保持在向下摄像头的视野 (FoV) 内。状态观察器用于平滑对目标位置的预测,并且重要的是估计速度。实验结果还表明,在目标能见度短时间内丢失期间,可以继续重新获取和跟踪目标。跟踪算法利用视觉传感器的并行特性,在与无人机控制器出现任何通信瓶颈之前实现高速图像处理。由于视觉芯片执行最密集的视觉信息处理,因此计算机上跟踪的所有控制在计算上是微不足道的。这项工作旨在开发出节能且只在信息周围传送有用数据的视觉敏捷机器人
J.-L. Vay、A. Huebl,“等离子体粒子加速器大规模建模中原位/传输方法的应用”,ISAV'20 研讨会主题演讲 (2020);M. Larsen 等人,“ALPINE 原位基础设施:从稻草人的灰烬中崛起”,ISAV'17 会议论文 (2017)
靶向基因敲入在细胞治疗中的应用效率普遍较低,规模有限。本研究开发了CLASH系统,该系统能够实现高效、高通量的基因敲入工程。在CLASH中,Cas12a/Cpf1 mRNA与混合腺相关病毒结合,通过大规模并行同源定向修复介导同时基因编辑和精准转基因敲入,从而产生一个稳定整合的突变变体池,每个变体都具有靶向基因编辑功能。我们将该技术应用于原代人T细胞,并使用CD3、CD8和CD4 T细胞在血癌和实体瘤模型中进行了时间进程式CLASH实验,从而实现了有利的CAR-T变体的混合生成和无偏选择。 CLASH 实验中出现了一种独特的 CRISPR RNA (crRNA),它可以在 CAR-T 中生成 PRDM1 的外显子 3 跳跃突变,从而增强这些细胞的增殖、干细胞样特性、中枢记忆和寿命,从而在多种癌症模型(包括实体瘤模型)中提高体内疗效。CLASH 的多功能性使其广泛应用于各种细胞和治疗工程应用。
摘要。本文深入探讨了人工智能 (AI) 在并行编程中的蓬勃发展,强调了其改变计算效率和开发人员体验格局的潜力。我们首先探讨了并行编程在现代计算中的基本作用及其带来的固有挑战,例如任务分配、同步和内存管理。人工智能的出现,尤其是在机器学习和深度学习中,为这些挑战提供了新颖的解决方案。我们讨论了人工智能在自动创建并行程序中的应用,重点是自动代码生成、自适应资源管理和增强开发人员体验。本文研究了特定的人工智能方法——遗传算法、强化学习和神经网络——及其在优化并行编程各个方面中的应用。此外,我们深入探讨了将这些人工智能方法结合起来以产生协同效应的前景,强调了提高效率和准确性的潜力。我们还强调了将人工智能技术与现有开发工具相结合的重要性,旨在将人工智能的好处带给更广泛的开发人员。本文最后展望了未来的研究方向,包括开发适应并行编程中不同任务和环境的自适应 AI 模型。这些进步有望使并行编程更加强大、更易于访问和更高效,为计算能力和创新的新时代铺平道路。
Transformer 模型的成功将深度学习模型规模推向了数十亿参数,但单 GPU 的内存限制导致在多 GPU 集群上进行训练的需求迫切。然而,选择最优并行策略的最佳实践仍然缺乏,因为它需要深度学习和并行计算领域的专业知识。Colossal-AI 系统通过引入统一接口将模型训练的顺序代码扩展到分布式环境,解决了上述挑战。它支持数据、管道、张量和序列并行等并行训练方法,并集成了异构训练和零冗余优化器。与基线系统相比,Colossal-AI 在大规模模型上可以实现高达 2.76 倍的训练加速。