黄油含量(又称矩形)是一个循环图案1,在图形分析中至关重要。尤其是,在两部分图上[41,61,3,97]上,But-Ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-terlif y [78,80,77,76],可以将顶点分为两个不相交组,并且仅在两组Vertices之间进行边缘。考虑图G =(v,e),其中v和e分别是ver和边缘的集合。黄油粉计数的问题是计算G中的黄油含量总数。黄油流数在许多应用中起着重要的作用,例如垃圾邮件检测[19,81,82],推荐系统[70],单词文献集群[16],研究小组识别[15],并根据传输理论[11]链接前词典。最近,Lyu等。[46]在电子商务的欺诈检测场景中,将黄油计算到修剪的顶点。
摘要 - 对并行排序算法的需求是由对大规模数据集有效处理的越来越多的需求所驱动的。Pigeonhole分选是在线性时间内携带排序的分类算法之一。本研究的重点是通过采用并行编程技术专门消息传递界面(MPI)和计算统一设备体系结构(CUDA)来提高提高孔分选方法的功效来提高算法的性能。主要目的是开发和评估鸽子孔分选的并行解决方案,以优化数据密集型应用中的排序效率。开始对Pigeonhole排序算法的顺序设计进行全面分析,该工作将使用CUDA进行图形处理单元(GPU)加速器和MPI创建并行实现,以进行分布式内存并行性。这项工作有助于将Pigonhole分类算法适应平行背景的宝贵见解。这些发现强调了平行化在减少总体计算时间方面的潜在优势。索引术语 - 伪造台面,并行编程,消息传递接口,计算统一设备体系结构,图形处理单元,加速
抽象数据机密性是数字时代的关键问题,影响了用户与公共服务之间以及科学计算组织与云与HPC提供商之间的互动。并行计算中的性能是必不可少的,但对于建立受信任的执行环境(TEE)以确保遥远环境中的隐私通常会对执行时间产生负面影响。本文旨在分析在英特尔SGX处理器机密的飞地内执行的DNA对齐(Bowtie2)的平行生物信息学工作负载的性能。结果提供了令人鼓舞的见解,内容涉及在大型数据集上使用基于SGX的TEE进行并行计算的可行性。调查结果表明,在高平行化条件下,并具有两倍的线程,在SGX飞地中执行的工作负载平均比非固定执行快15%。这种经验证明支持基于SGX的TEE有效平衡隐私需求与高性能计算的需求的潜力。
摘要 - 越来越多地使用深入强化学习(DRL)框架来解决机器人技术中的高维连续控制任务。然而,由于缺乏样本效率,在机器人域中将DRL应用于在线学习实际上仍然是不可行的。一个原因是,DRL代理不利用以前任务的解决方案。基于后继功能(SFS)的多任务DRL代理的最新工作已被证明在提高样本效率方面非常有前途。在这项工作中,我们提出了一种新的方法,该方法统一了两个先前的多任务RL框架,SF-GPI和价值组成,并将它们适应连续的控制域。我们利用后继功能的组成属性来构成一组原始人的策略分布,而无需培训任何新的政策。最后,为了证明多任务机制,我们基于Isaacgym提出了概念验证的基准环境,尖端和指针,这有助于大规模平行化以加速实验。我们的实验结果表明,我们的多任务代理具有与软演员 - 批评者(SAC)相同的单任务性能,并且代理可以成功地转移到新的看不见的任务中。我们在https://github.com/robot-poception-group/ concurrent_composition提供的代码作为开放源代码。
I n多名强化学习,搜索者通常会面临一个具有挑战性的权衡:使用需要基础计算资源的复杂环境,或者更简单的dy-namics进行加急执行,尽管以可转让的成本来实现更现实的任务。该媒介会挖掘可矢量环境的潜力,从而使平行环境推出并完全利用现代GPU的平行化能力。我们提出了各种RL环境库的比较,高点其功能和限制,以端到端硬件加速培训管道。我们观察到,最常用的RL算法库尚未完全包含最终到端硬件的训练管道,以及用于硬件加速的框架与机器学习中的框架之间的有限交叉兼容:Pytorch,Pytorch,Tensorflow,Tensorflow,Tensorflow,tensorflow和Jax,jax,jax,limits for Mix and Matchers for Mix and Matchers and and rar rar rar rar rar rar rar rar rar rar rar rar rar rar rar rar rar rar rar rar and rar rar rar and rar rar rar rar rar rar rar rar rar rar and rar rar。
摘要 - 在任意算术计算和计算科学中,大型整数乘以广泛使用的操作。许多加密技术涉及对整数的极大子集进行操作,包括Diffie-Hellman密钥交换,RSA,ECC等。这些技术采用安全消息加密,解密和密钥交换,使用其大小至少1024位的安全键。的指控和乘法。Karatsuba算法是一种快速有效的方法,用于繁殖大数量,在每个递归步骤中,将乘法数量从四个减少到三个。在本文中,当应用于顺序和平行环境时,我们对卡拉茨巴算法的性能进行了全面评估。我们使用计算统一设备体系结构(CUDA)编程的NVIDIA图形处理单元(GPU)的功能来衡量并行实现和处理器配置的加速。在连续的NVIDIA GPU CUDA平台上运行的Karatsuba算法达到的加速度为30.12。通过利用可用的GPU内核可以改善性能。这些发现强调了平行化在减少总体计算时间方面的潜在优势。索引术语 - Karatsuba,乘法,计算统一设备体系结构,NVIDIA图形处理单元,加速
快速行进方法通常用于扩展各个字段中的前面模拟,例如流体动力学,计算机图形和微电子,以恢复级别集合函数的签名距离字段属性,也称为重新启动。为了提高重新距离步骤的性能,已经开发了快速行进方法的并行算法以及对层次网格的支持;后者在局部支持模拟域的更高分辨率,同时限制了对整体计算需求的影响。在这项工作中,先前开发的多网性快速行进方法通过所谓的基于块的分解步骤扩展,以改善层次结构网格的串行和并行性能。OpenMP任务用于基于每个网格的基础粗粒平行化。开发的方法提供了改进的负载平衡,因为该算法采用了高网格分配学位,从而使网格分区与各种网格尺寸之间的平衡。对具有不同复杂性的代表性几何形状进行了各种基准和参数研究。在24核Intel Skylake Computing平台上的各种测试用例中,串行性能提高了21%,而平行速度为7.4至19.1,有效地使以前方法的并行效率增加了一倍。©2021作者。由Elsevier B.V.这是CC下的开放访问文章(http://creativecommons.org/licenses/4.0/)。
1美国麻省理工学院和哈佛大学,美国马萨诸塞州剑桥市02142,美国。2美国马萨诸塞州剑桥市艺术与科学学院有机和进化生物学系,美国马萨诸塞州02138,美国。3美国霍华德·休斯医学研究所,美国医学博士20815,美国。4 Harvard-Mit健康科学与技术计划,美国马萨诸塞州剑桥市02139,美国。 5哈佛/麻省理工学院MD-PHD计划,美国马萨诸塞州波士顿,美国02115。 6系统,合成和定量生物学博士学位课程,系统生物学系,哈佛医学院,马萨诸塞州波士顿,美国马萨诸塞州02115。 7英国爱丁堡大学生态与进化研究所。 8 Fathom信息设计,马萨诸塞州波士顿,美国92114,美国9马萨诸塞州公共卫生部,马萨诸塞州波士顿,马萨诸塞州02108,美国。 10免疫学和传染病系,哈佛T.H. Chan公共卫生学院,哈佛大学,波士顿,马萨诸塞州02115,美国。 11马萨诸塞州病原体准备的联盟,哈佛大学,哈佛大学,波士顿,马萨诸塞州,美国02115,美国。 12计算机科学系,工程与应用科学学院,哈佛大学,波士顿,马萨诸塞州02134,美国。 †函数:ispecht@broadinstitute.org,pvarilly@broadinstitute.org。 抽象传播重建 - 对谁感染了疾病暴发中的人的推论 - 对病原体如何扩散和为目标控制措施提供机会的关键见解。 杜松的中心是下一代测序观察到的主机内变体频率的统计模型,我们在超过160,000多个深入序列的SARS-COV-2基因组的数据集上验证了该模型。4 Harvard-Mit健康科学与技术计划,美国马萨诸塞州剑桥市02139,美国。5哈佛/麻省理工学院MD-PHD计划,美国马萨诸塞州波士顿,美国02115。6系统,合成和定量生物学博士学位课程,系统生物学系,哈佛医学院,马萨诸塞州波士顿,美国马萨诸塞州02115。7英国爱丁堡大学生态与进化研究所。8 Fathom信息设计,马萨诸塞州波士顿,美国92114,美国9马萨诸塞州公共卫生部,马萨诸塞州波士顿,马萨诸塞州02108,美国。10免疫学和传染病系,哈佛T.H. Chan公共卫生学院,哈佛大学,波士顿,马萨诸塞州02115,美国。 11马萨诸塞州病原体准备的联盟,哈佛大学,哈佛大学,波士顿,马萨诸塞州,美国02115,美国。 12计算机科学系,工程与应用科学学院,哈佛大学,波士顿,马萨诸塞州02134,美国。 †函数:ispecht@broadinstitute.org,pvarilly@broadinstitute.org。 抽象传播重建 - 对谁感染了疾病暴发中的人的推论 - 对病原体如何扩散和为目标控制措施提供机会的关键见解。 杜松的中心是下一代测序观察到的主机内变体频率的统计模型,我们在超过160,000多个深入序列的SARS-COV-2基因组的数据集上验证了该模型。10免疫学和传染病系,哈佛T.H.Chan公共卫生学院,哈佛大学,波士顿,马萨诸塞州02115,美国。 11马萨诸塞州病原体准备的联盟,哈佛大学,哈佛大学,波士顿,马萨诸塞州,美国02115,美国。 12计算机科学系,工程与应用科学学院,哈佛大学,波士顿,马萨诸塞州02134,美国。 †函数:ispecht@broadinstitute.org,pvarilly@broadinstitute.org。 抽象传播重建 - 对谁感染了疾病暴发中的人的推论 - 对病原体如何扩散和为目标控制措施提供机会的关键见解。 杜松的中心是下一代测序观察到的主机内变体频率的统计模型,我们在超过160,000多个深入序列的SARS-COV-2基因组的数据集上验证了该模型。Chan公共卫生学院,哈佛大学,波士顿,马萨诸塞州02115,美国。11马萨诸塞州病原体准备的联盟,哈佛大学,哈佛大学,波士顿,马萨诸塞州,美国02115,美国。12计算机科学系,工程与应用科学学院,哈佛大学,波士顿,马萨诸塞州02134,美国。 †函数:ispecht@broadinstitute.org,pvarilly@broadinstitute.org。 抽象传播重建 - 对谁感染了疾病暴发中的人的推论 - 对病原体如何扩散和为目标控制措施提供机会的关键见解。 杜松的中心是下一代测序观察到的主机内变体频率的统计模型,我们在超过160,000多个深入序列的SARS-COV-2基因组的数据集上验证了该模型。12计算机科学系,工程与应用科学学院,哈佛大学,波士顿,马萨诸塞州02134,美国。†函数:ispecht@broadinstitute.org,pvarilly@broadinstitute.org。抽象传播重建 - 对谁感染了疾病暴发中的人的推论 - 对病原体如何扩散和为目标控制措施提供机会的关键见解。杜松的中心是下一代测序观察到的主机内变体频率的统计模型,我们在超过160,000多个深入序列的SARS-COV-2基因组的数据集上验证了该模型。我们开发了杜松(系统发育和流行病学重建的关节基础网络推断),这是一种高度估计的病原体爆发重建工具,结合了host内变化,不完全采样和算法平行化。将这种内部内部变化模型与人口水平的进化模型结合在一起,我们开发了一种同时推断系统发育和传播树的方法。我们在计算机生成的爆发和实际爆发中对杜松进行了基准测试,其中传输链接已知或在流行病学上得到证实。我们演示了杜松的