抽象数据机密性是数字时代的关键问题,影响了用户与公共服务之间以及科学计算组织与云与HPC提供商之间的互动。并行计算中的性能是必不可少的,但对于建立受信任的执行环境(TEE)以确保遥远环境中的隐私通常会对执行时间产生负面影响。本文旨在分析在英特尔SGX处理器机密的飞地内执行的DNA对齐(Bowtie2)的平行生物信息学工作负载的性能。结果提供了令人鼓舞的见解,内容涉及在大型数据集上使用基于SGX的TEE进行并行计算的可行性。调查结果表明,在高平行化条件下,并具有两倍的线程,在SGX飞地中执行的工作负载平均比非固定执行快15%。这种经验证明支持基于SGX的TEE有效平衡隐私需求与高性能计算的需求的潜力。
摘要 - 传统的卷积神经网络(CNN)通常在捕获各种数据集中的复杂空间关系和细微的模式方面遇到困难。为了克服这些限制,这项工作先驱,使视觉变压器(VIT)模型的应用在计算机视觉领域引起了显着关注,因为它们能够通过自我意见机制在图像中捕获图像中的长期依赖性的能力。然而,培训大量参数的大规模VIT模型会带来计算挑战。在本文中,我们提出了一种优化的方法,用于培训VIT模型,该模型利用图形处理单元(GPU)的并行处理功能,并使用多线程优化了计算工作负载分布。在CIFAR-10数据集上对所提出的模型进行了训练和测试,并在100个时期后达到了99.92%的出色精度。与现有方法相比,实验结果揭示了我们方法在优化训练效率方面的有效性。这强调了VIT模型的出色性能及其革新图像分类任务的潜力。索引术语 - CIFAR-10数据集,卷积神经网络(CNN),GPU,图像分类,多线程,视觉变压器(VIT),注意机制
我们提出ELPREP 5,该5更新ELPREP框架,用于处理使用变体调用的测序对齐/地图文件。ELPREP 5现在可以执行由GATK最佳呼叫的最佳实践所描述的完整管道,该实践由PCR和光学重复标记组成,按坐标顺序排序,基本质量得分重新校准以及使用单倍型呼叫者算法的变体调用。ELPREP 5产生与GATK4相同的BAM和VCF输出,同时通过并行化和合并管道步骤的执行来显着降低运行时。我们的基准测试表明,ELPREP 5在整个exome和全基因组数据上都将变量呼叫管道的运行时加快了,同时使用与GATK4相同的硬件资源。这使ELPREP 5在需要更快的执行时间时,可以合适地替换GATK4。
摘要 — 布局是现代超大规模集成电路 (VLSI) 设计中的重要步骤。详细布局是整个设计流程中被密集调用的布局细化程序,因此其效率对设计收敛至关重要。然而,由于大多数详细布局技术本质上是贪婪和顺序的,因此它们通常难以并行化。在这项工作中,我们提出了一个并发详细布局框架 ABCDPlace,利用多线程和 GPU 加速。我们为广泛采用的顺序详细布局技术提出了基于批处理的并发算法,例如独立集匹配、全局交换和局部重新排序。实验结果表明,在 ISPD 2005 竞赛基准上,ABCDPlace 可以比使用多线程 CPU 的顺序实现快 2 × - 5 × 的运行时间,使用 GPU 可以比顺序实现快 10 × 以上,而不会降低质量。在更大的工业基准测试中,我们展示了比最先进的顺序详细布局器快 16 倍以上的 GPU 加速。 ABCDPlace 在一分钟内完成一千万个单元的工业设计的详细布局。