多线程

2021-01-30 机构名称:

ELPREP 5中的多线程变体

我们提出ELPREP 5，该5更新ELPREP框架，用于处理使用变体调用的测序对齐/地图文件。ELPREP 5现在可以执行由GATK最佳呼叫的最佳实践所描述的完整管道，该实践由PCR和光学重复标记组成，按坐标顺序排序，基本质量得分重新校准以及使用单倍型呼叫者算法的变体调用。ELPREP 5产生与GATK4相同的BAM和VCF输出，同时通过并行化和合并管道步骤的执行来显着降低运行时。我们的基准测试表明，ELPREP 5在整个exome和全基因组数据上都将变量呼叫管道的运行时加快了，同时使用与GATK4相同的硬件资源。这使ELPREP 5在需要更快的执行时间时，可以合适地替换GATK4。

查看详细

File

2024-06-14 机构名称:

使用GPU和多线程的优化视觉变压器训练

摘要 - 传统的卷积神经网络（CNN）通常在捕获各种数据集中的复杂空间关系和细微的模式方面遇到困难。为了克服这些限制，这项工作先驱，使视觉变压器（VIT）模型的应用在计算机视觉领域引起了显着关注，因为它们能够通过自我意见机制在图像中捕获图像中的长期依赖性的能力。然而，培训大量参数的大规模VIT模型会带来计算挑战。在本文中，我们提出了一种优化的方法，用于培训VIT模型，该模型利用图形处理单元（GPU）的并行处理功能，并使用多线程优化了计算工作负载分布。在CIFAR-10数据集上对所提出的模型进行了训练和测试，并在100个时期后达到了99.92％的出色精度。与现有方法相比，实验结果揭示了我们方法在优化训练效率方面的有效性。这强调了VIT模型的出色性能及其革新图像分类任务的潜力。索引术语 - CIFAR-10数据集，卷积神经网络（CNN），GPU，图像分类，多线程，视觉变压器（VIT），注意机制

查看详细

File

2024-10-04 机构名称:

与Intel SGX多线程的DNA对齐工作负载的性能分析

抽象数据机密性是数字时代的关键问题，影响了用户与公共服务之间以及科学计算组织与云与HPC提供商之间的互动。并行计算中的性能是必不可少的，但对于建立受信任的执行环境（TEE）以确保遥远环境中的隐私通常会对执行时间产生负面影响。本文旨在分析在英特尔SGX处理器机密的飞地内执行的DNA对齐（Bowtie2）的平行生物信息学工作负载的性能。结果提供了令人鼓舞的见解，内容涉及在大型数据集上使用基于SGX的TEE进行并行计算的可行性。调查结果表明，在高平行化条件下，并具有两倍的线程，在SGX飞地中执行的工作负载平均比非固定执行快15％。这种经验证明支持基于SGX的TEE有效平衡隐私需求与高性能计算的需求的潜力。

查看详细

ABCDPlace：在多线程 CPU 和 GPU 上加速基于批处理的并发详细布局

File

2020-02-20 机构名称:

ABCDPlace：在多线程 CPU 和 GPU 上加速基于批处理的并发详细布局

摘要 — 布局是现代超大规模集成电路 (VLSI) 设计中的重要步骤。详细布局是整个设计流程中被密集调用的布局细化程序，因此其效率对设计收敛至关重要。然而，由于大多数详细布局技术本质上是贪婪和顺序的，因此它们通常难以并行化。在这项工作中，我们提出了一个并发详细布局框架 ABCDPlace，利用多线程和 GPU 加速。我们为广泛采用的顺序详细布局技术提出了基于批处理的并发算法，例如独立集匹配、全局交换和局部重新排序。实验结果表明，在 ISPD 2005 竞赛基准上，ABCDPlace 可以比使用多线程 CPU 的顺序实现快 2 × - 5 × 的运行时间，使用 GPU 可以比顺序实现快 10 × 以上，而不会降低质量。在更大的工业基准测试中，我们展示了比最先进的顺序详细布局器快 16 倍以上的 GPU 加速。 ABCDPlace 在一分钟内完成一千万个单元的工业设计的详细布局。

查看详细

File

2025-02-12 机构名称:

计算机系统工程（CSYE）

CSYE 7215. 并行、并发和多线程编程基础。（4 小时）涵盖利用 Java 多线程 API/工具进行并发程序设计、开发和实现的所有方面。涵盖的主题包括线程安全性和生存期问题、块结构化与显式同步、内在锁定与显式锁定、线程池、活跃性问题、死锁、活锁、竞争条件、原子性、性能和可伸缩性、执行策略、测试策略。涵盖的主要 Java 多线程 API/工具包括同步块、等待集、内在锁和条件变量、同步和并发集合、执行程序框架。提供了 Java 多线程 API 和 Posix Pthreads 多线程标准之间的比较。

查看详细

File

2022-11-08 机构名称:

基于 A3C 深度强化学习的空战机动决策方法

摘要：针对无人战斗机空战中的机动决策问题，本文提出了一种基于深度强化学习的无人战斗机自主机动决策方法。首先，建立敌我双方无人战斗机飞行机动模型及机动库。然后，考虑到无人战斗机俯仰角不同时各动作不同的状态转换效果，将俯仰角等10个状态变量作为状态空间。结合空战态势威胁评估指数模型，设计内部奖励与稀疏奖励相结合的两层奖励机制作为强化学习的评估依据。然后，根据异步优势演员-评论家（A3C）算法，构建全连接层的神经网络模型。通过多线程的方式，UCAV与环境不断交互学习，对模型进行训练，逐步学习到最优的空战机动对抗策略，并指导UCAV进行行动选择。该算法通过多线程异步学习，降低了样本间的相关性。最后，在三种不同的空战场景中验证了该方法的有效性和可行性。

查看详细

File

2024-11-08 机构名称:

Arne Olemans

自行碰撞系统。多线程声音系统。vsync控制的游戏循环。多个活动场景。无痛场景管理。RAII内存管理。键盘和Xbox控制器支持。多个玩家输入系统。RAII内存管理。键盘和Xbox控制器支持。多个玩家输入系统。

查看详细

File

2025-03-08 机构名称:

工作区环境管理2308

配置文件管理 - 提供最佳的登录性能，Workspace环境操作替换了常用的Windows组策略对象，登录脚本和偏好，并使用部署在每个虚拟机或服务器上的代理。代理是多线程，并且仅在需要时才对用户环境进行更改，从而确保用户始终可以尽快访问其桌面。

查看详细

File

2021-11-05 机构名称:

用于实时 BCI 的多加速器 SoC 架构

• 针对 3 个平台进行评估：Intel i7、ARM Cortex-A53 和 RISC-V CVA6 • 时钟频率：FPGA @ 78MHz、ARM @ 1.2 GHz、Intel @ 3.7GHz • 在通用处理器上运行的 C++ 中优化的多线程软件应用程序 • P2P 可节省 90% 以上的内存访问 à 最大限度地降低片外能耗 • 时钟频率为 1GHz 的 ASIC 投影

查看详细

File

2020-03-03 机构名称:

NIST、量子通信和时钟 DR。...

• 使用时钟同步传输“单光子”可实现高达 6 GHz 的速率 - 无论是在自由空间还是在光纤中 • 密钥处理使用多线程前向纠错算法 • 演示使用量子密钥的连续一次性加密，数据速率 > 4 MB/s；比之前的演示高出约 100 倍 • 实现量子密钥分发 (QKD) 的宽带应用

查看详细

XiaoMi-AI文件搜索系统

多线程

ELPREP 5中的多线程变体

使用GPU和多线程的优化视觉变压器训练

与Intel SGX多线程的DNA对齐工作负载的性能分析

ABCDPlace：在多线程 CPU 和 GPU 上加速基于批处理的并发详细布局

计算机系统工程（CSYE）

基于 A3C 深度强化学习的空战机动决策方法

Arne Olemans

工作区环境管理2308

用于实时 BCI 的多加速器 SoC 架构

NIST、量子通信和时钟 DR。...

按机构统计排名前十媒体

按照发布年份统计数据

XiaoMi-AI