• 数据质量和偏见:AI 和 ML 模型的有效性在很大程度上取决于训练数据的质量和代表性。数据集固有的偏见可能会导致歧视性或不准确的结果。确保数据集多样化、无偏见对于缓解此类问题至关重要。 • 可解释性和透明度:AI 驱动的决策通常缺乏透明度,因此很难理解其输出背后的原因。这个“黑匣子”问题引发了对问责制的担忧,尤其是在安全关键型应用中,了解决策过程至关重要。 • 安全和隐私:由于 AI 系统嵌入互连网络中,因此确保强大的网络安全措施势在必行。保护敏感数据并防止对 AI 系统的恶意攻击对于维护运营完整性和保护用户隐私至关重要。 • 自主系统中的道德决策:能够做出决策的自主机器引发了道德困境。确定管理其选择的道德框架,特别是在决策可能影响人类生命的情况下,需要仔细考虑和道德准则。 • 对就业的影响:人工智能和自动化技术的快速发展引发了人们对工作岗位流失的担忧。虽然这些技术提高了生产力,但对劳动力进行再培训并在人类专业知识和机器能力之间建立平衡至关重要。 • 监管和法律框架:人工智能不断发展的性质对现有的监管框架提出了挑战。制定指导方针、标准和法律框架来管理人工智能的开发、部署和
摘要 我们提出了 CXL-ANNS,这是一种软硬件协作方法,可实现高度可扩展的近似最近邻搜索 (ANNS) 服务。为此,我们首先通过计算快速链路 (CXL) 将 DRAM 从主机中分离出来,并将所有必要的数据集放入其内存池中。虽然这个 CXL 内存池可以使 ANNS 能够在不损失准确性的情况下处理十亿点图,但我们观察到由于 CXL 的远内存类特性,搜索性能会显著下降。为了解决这个问题,CXL-ANNS 考虑节点级关系并将预计访问最频繁的邻居缓存在本地内存中。对于未缓存的节点,CXL-ANNS 通过了解 ANNS 的图遍历行为预取一组最有可能很快访问的节点。CXL-ANNS 还了解 CXL 互连网络的架构,并让其中的不同硬件组件并行协作搜索最近邻居。为了进一步提高性能,它放宽了邻居搜索任务的执行依赖性,并通过充分利用 CXL 网络中的所有硬件来最大化搜索并行度。我们的实证评估结果表明,与我们测试的最先进的 ANNS 平台相比,CXL-ANNS 的 QPS 提高了 111.1 倍,查询延迟降低了 93.3%。在延迟和吞吐量方面,CXL-ANNS 也分别比仅具有 DRAM(具有无限存储容量)的 Oracle ANNS 系统高出 68.0% 和 3.8 倍。
直到最近,计算机系统的性能和功率效率才随着摩尔定律的扩展和 Dennard 缩放的晶体管效率的提高而稳步提高。然而,现在由于物理限制,设备缩放在性能和功率改进方面遇到了限制。为了在后摩尔和后 Dennard 时代继续生产快速且节能的计算机系统,计算机架构师和系统设计师正在朝着令人兴奋的新方向发展。一个方向是转向并行计算机架构和系统,包括多核和众核处理器、并行执行模型以及新的缓存一致性和内存一致性模型。另一个方向是整合异构和专用加速器,包括 GPU、TPU、FPGA、CGRA 和 ASIC。第三个方向是出现全新的硬件和软件系统,包括量子计算、基于 DNA 的计算机系统、神经形态计算和间歇性计算。本课程将首先回顾计算机设计的基本原理和指令集原理,然后研究当今计算机设计的基本原理,包括高级流水线、指令级并行、内存层次设计、存储系统、互连网络和多处理器。我们还将通过阅读和讨论研究论文、听取和发表技术演讲、在真实和模拟硬件上运行实验以及规划和开展学期研究项目来探索上述三个新方向。本课程将帮助学生为涉及高级计算机架构和系统方面的研究做好准备,或者为国家实验室或公司工作,开发或使用高级架构用于高性能计算、大规模数据分析或机器学习的应用。课程先决条件
大规模人工智能系统是现代在线服务的基础。随着世界从新冠肺炎疫情中恢复,人们对人工智能驱动的在线服务的依赖日益加深。然而,当今的网络难以满足新兴人工智能工作负载带来的高带宽、低端到端延迟和高可用性要求。例如,机器学习 (ML) 应用的爆炸式增长对分布式训练产生了巨大的需求。硬件加速器(如 GPU 和 TPU)大大提高了计算能力,但当今的深度神经网络 (DNN) 仍需要数天甚至数周的时间才能完成训练。许多因素都会影响大型 DNN 作业的训练时间,包括并行化策略、模型/数据大小、软件库和互连网络。因此,人们提出了大量框架来有效地在当今的数据中心中分发和训练 DNN 模型 [1–4]。然而,当今的系统往往只优化计算和通信维度。因此,共同优化网络拓扑以及计算和通信维度对加速 DNN 训练的影响在很大程度上被忽略了。本文主张将网络拓扑重新配置为额外的加速维度,以跨计算、通信和拓扑维度联合优化 DNN 训练作业。为数据中心流量重新配置网络拓扑是网络和光学社区的一个热门话题。多篇学术论文展示了基于光可重构电路交换机的互连对数据中心工作负载的好处 [5, 6]。然而,之前的工作仅考虑将光互连用于通用数据中心流量,例如网络搜索、存储和云。本文没有关注通用数据中心工作负载,而是将注意力转向分布式 ML 工作负载,并认为可重构光互连是构建下一代 ML 数据中心的一个有吸引力的解决方案。为此,有三个挑战需要解决。
生物过滤是一种低成本的低能技术,它采用了多孔培养基的生物活化床来减少源水中溶解有机物(DOM)池的可生物降解部分,从而导致饮用水的产生。在生物滤池内不同床深度的微生物群落在降解和去除溶解有机碳(DOC)中起着至关重要的作用,最终影响了其性能。然而,居住在不同生物滤池深度的微生物群落组成与它们对各种DOC馏分的使用之间的关系仍然很少。为了解决这一知识差距,我们进行了一项实验研究,其中从上部(即前10厘米)和下部(即底部10厘米)的小型群落进行了30厘米长的实验室尺度生物滤器的部分。然后使用与生物滤器进水量相同的源水单独孵育10天。我们的研究表明,与顶级微生物社区相比,底部微生物群落的多样性较低,但其成员之间具有更高程度的互连网络。此外,我们在微生物群落的组成和网络结构之间建立了直接相关性,以及它们在DOM池中使用各种DOM化合物的能力。有趣的是,尽管在孵化开始时,与顶级社区相比,底部微生物社区仅占总细胞丰度的20%,但它使用了,因此从DOM池中删除了比顶级社区多的总DOC约60%。虽然两个群落都迅速利用了不稳定的碳分数,例如低分子 - 重量中性,但使用更多难治性的碳馏分,例如高分子重量腐殖质的腐殖质,平均分子量比CA的平均分子量更高。1451 g/mol,是底部微生物群落独有的。通过采用捕获微生物多样性的技术(即流式细胞术和16S rRNA扩增子测序),并考虑DOM的复杂性(即LC - OCD),我们的研究提供了微生物社区结构如何影响微生物介导的工程生产的重要过程。最后,我们的发现可以通过工程干预措施来改善生物滤器性能,从而塑造生物滤器微生物群落的组成,并增强其对DOM的利用率和去除,最尤其是更经典的谦卑和耐用性DOM -DOM AFTER。
虽然最近的空间生物学创新推动了对组织组织如何改变疾病的新见解,但以通用且可扩展的方式解释这些数据集仍然是一个挑战。用于发现组织组织中条件特定差异的计算工作流程通常依赖于成对比较或无监督的聚类。在许多情况下,这些方法在计算上是昂贵的,缺乏统计严格,并且对低流行的细胞壁细分市场不敏感,这些细胞壁细分市场仍然高度歧视和预测患者的结果。在这里,我们提出了乳蛋饼 - 一种自动化,可扩展性和统计上健壮的方法,可用于发现在空间区域,纵向样本或临床患者群体中差异富集的细胞壁细分市场。与现有方法相反,乳蛋白蛋白蛋白蛋白蛋白原将局部利基检测与可解释的统计建模相结合,使用图形邻域来检测差异富集的细胞壁细分市场,即使在较低的患病率下也是如此。在人类组织的硅模型和空间蛋白质组学成像中,我们证明了乳蛋饼可以准确地检测出少于20%的患者样品的频率为0.5%的条件特异性细胞壁细分市场,从而超过了下一个最佳方法,该方法需要患者患者的患病率为60%才能进行检测。为了验证我们的方法并了解肿瘤结构如何影响三重阴性乳腺癌(TNBC)的复发风险,我们使用蛋饼全面介绍了多中心的空间蛋白质组学群体中的肿瘤微环境,这些蛋白质组学同类群体由原发性手术切除术组成,由314例患者分析了200万个细胞,分析了500万个患者。我们发现了始终富集在肿瘤微环境的关键区域的细胞壁细分市场,包括肿瘤免疫边界和细胞外基质重塑区域,以及与患者的统计相关的壁细分市场,包括复发状态和复发性无效生存。大多数差异壁ni(74.2%)是针对未复发并形成富含肿瘤和肿瘤细胞单核细胞,巨噬细胞,APC和CD8T细胞的强大互连网络的患者。相比之下,复发的患者的相互作用网络明显稀疏,并且在B细胞,CD68巨噬细胞和中性粒细胞中富集。我们使用两个独立人群验证了这些发现,观察了相似的细胞相互作用和预测能力。总的来说,这些结果表明,生产性抗肿瘤免疫反应的显着,普遍的特征是由与肿瘤和基质细胞的先天和适应性免疫之间的结构参与网络所定义的,而不是由任何特定的细胞群体。,我们已在https://github.com/jranek/quiche中免费提供作为用户友好的开源Python软件包。