摘要 —运动想象脑机接口 (MI- BMI) 通过分析脑电图 (EEG) 记录的大脑活动,实现人脑与机器之间直接且可访问的通信。延迟、可靠性和隐私限制使得将计算转移到云端并不合适。实际使用案例需要可穿戴、电池供电且平均功耗低的设备以便长期使用。最近,出现了用于分类 EEG 信号的复杂算法,尤其是深度学习模型。虽然这些模型达到了出色的准确性,但由于其内存和计算要求,它们通常会超出边缘设备的限制。在本文中,我们展示了 EEGN ET 的算法和实现优化,EEGN ET 是一种适用于许多 BMI 范式的紧凑型卷积神经网络 (CNN)。我们将权重和激活量化为 8 位定点,4 类 MI 的准确度损失为 0.4%,可忽略不计,并利用其定制的 RISC-V ISA 扩展和 8 核计算集群,在 Mr. Wolf 并行超低功耗 (PULP) 片上系统 (SoC) 上实现了节能的硬件感知实现。通过我们提出的优化步骤,与单核分层基线实现相比,我们可以获得 64 倍的整体加速和高达 85% 的内存占用减少。我们的实现仅需 5.82 毫秒,每次推理消耗 0.627 mJ。凭借 21.0 GMAC/s/W,它的能效比 ARM Cortex-M7 上的 EEGN ET 实现(0.082 GMAC/s/W)高 256 倍。索引词——脑机接口、边缘计算、并行计算、机器学习、深度学习、运动意象。
磁场的精确测量是量子计量学中最基本、最重要的任务之一。尽管过去几十年来人们对量子磁力仪进行了广泛的研究,但是在并行方案下估计磁场所有三个分量所能达到的最终精度仍然未知。这主要是因为人们对估计这三个分量的最佳探测态的不兼容性缺乏了解。在这里,我们提供了一种方法来表征由于最佳探测态不兼容性而导致的多个参数精度之间的最小权衡,从而确定了并行方案下估计磁场所有三个分量的最终精度极限。还明确构建了达到最终精度的最佳探测态。获得的精度为并行方案下多参数量子磁力仪的精度设定了基准,这在量子计量学中具有根本的兴趣和重要性。
。CC-BY-NC-ND 4.0 国际许可,根据 提供(未经同行评审认证)是作者/资助者,他已授予 bioRxiv 永久展示预印本的许可。它是此预印本的版权持有者,此版本于 2020 年 5 月 21 日发布。;https://doi.org/10.1101/2020.05.20.103614 doi:bioRxiv 预印本
B. 激发导致零级激子态,每个点由两个空穴态(h1 和 h2,蓝色条)和一个电子态(e,红色条)组成。可以构建 8 个激子态,4 个局部激子,即 h1eA(顶行),其中空穴-电子对位于同一点上(激发用直线表示)和 4 个电荷转移,即 h1A-eB,(CT 态,底行),其中空穴和电子位于不同的点上(激发用曲线表示)。C. 异质结的本征激子态
+RZDUG +XJKHV 0HGLFDO ,QVWLWXWH +DUYDUG 8QLYHUVLW\ &RUUHVSRQGHQFH WR MGRHQFK#EURDGLQVWLWXWH RUJ 8QGHUVWDQGLQJ WKH IXQFQFQHQXQHQHQXT FOHRWLGH YDULDQWV LV FULWLFDO WR XQFRYHULQJ WKH JHQHWLF XQGHUSLQQLQJV RI GLVHDVHV EXW WHFKQRORJLHV WR FKDUDFWHUL]H YDULDQWV DUHJ OLQHWHJH 55 & 5JHVH &H WRVLQH EDVH HGLWRUV LQ SRROHG VFUHHQV WR VFDODEO\ DVVD\ YDULDQWV DW HQGRJHQRXV ORFL LQ PDPPDOLDQ FHOOV :H EHQFKPDUN WKH SHUIRUPDQFH RI VGLWHQLWHQLWHW LYH VHOHFWLRQ VFUHHQV DQG LGHQWLI\ NQRZQ ORVV RI IXQFWLRQ PXWDWLRQV LQ %5&$ DQG %5&$ ZLWK KLJK SUHFLVLRQ 7R GHPRQVWUDWH WKH\HWHWHWHWHVH SUREH VPDOO PROHFXOH SURWHLQ LQWHUDFWLRQV ZH FRQGXFW VFUHHQV ZLWK %+ PLPHWLFV DQG 3$53 LQKLELWRUV DQG LGHQWLI\ SRLQW PXWDWLRQV WKDWLWLWHVHVHVH VWDQFH )LQDOO\ ZH FUHDWH D OLEUDU\ RI FOLQLFDOO\ REVHUYHG YDULDQWV LQ JHQHV DQG FRQGXFW VFUHHQV LQ WKH SUHVHQFH RI FHOOXODU VWUHVLIGWWQLVQLWQLR\ LDQWV LQ QXPHURXV '1$ GDPDJH UHSDLU JHQHV :H DQWLFLSDWH WKDW WKLV VFUHHQLQJ DSSURDFK ZLOO EH EURDGO\ XVHIXO WR UHDGLO\ DQG VFDODEO\ IXQFWH]FQWHWL Y728 &7,21 $ PDMRU FKDOOHQJH LQ JHQRPLFV LV WKH IXQFWLRQDO FKDUDFWHUL]DWLRQ RI SUHFLVH JHQHWLF YDULDQWV DW D ODUJH VFDOH $OWKRXJK JHQRPH ZLGHVVXLWHWLVXLWHQ6 * LILHG WHQV RI WKRXVDQGV RI DVVRFLDWLRQV EHWZHHQ VLQJOH QXFOHRWLGH SRO\PRUSKLVPV 613V DQG SKHQRW\SHV LGHQWLILFDWLRQ RI WKH FDXVDO YDULDJVKWGWLQVJVJWKWK H IXQFWLRQDO FRQVHTXHQFH RI D FDXVDO YDULDQW LV PRUH GLIILFXOW VWLOO W\SLFDOO\ UHTXLULQJ ORZ WKURXJKSXW JHQRPH HGLWLQJ WR LQWURGXFH YKDUXDWKWKWHWQL QDO VLJQLILFDQFH )XQFWLRQDO FKDUDFWHUL]DWLRQ RI JHQHWLF YDULDQWV LV DOVR D ERWWOHQHFN IRU UDUH GLVHDVH UHVHDUFK DQG FDQFHU JHQRPLFVOD FLQLQLQLQVH LQVR K FRQWH[WV RIWHQ XQFRYHUV YDULDQWV WKDW UHPDLQ XQWHVWHG IRU WKHLU IXQFWLRQDO FRQVHTXHQFH IXUWKJU H[SDQGLQJ WKH OLVW RI YDULDQWV RIFQLQFDJFD80JFDH6\ WHFKQRORJLHV IRU YDULDQW VFUHHQLQJ ± VRPHWLPHV FDOOHG PXOWLSOH[HG DVVD\V RI YDULDQW HIIHFWV RU 0$9(V 6WDULWD HW DO :HLOH HW DO RIIHU GLI ± QWHQWHVHVHVHV V 2QH JHQHUDO FDWHJRU\ RI 0$9(V DUH DVVD\V LQ ZKLFK D SUHGHILQHG VHW RI YDULDQWV
1. 引言 VLSI 技术在速度和尺寸方面的进步使得实现并行乘法器硬件成为可能。技术发展进一步确保了更好的性能特征和在 DSP 系统中的广泛使用。它执行诸如累加多个乘积之和之类的操作的速度比普通微处理器快得多。DSP 架构旨在执行并行操作,从而降低计算复杂性并提高此类应用中重复信号处理所需的速度[1]。这些功能旨在提高可编程 DSP 的速度和吞吐量。对于给定的应用,有大量可编程 DSP 可供选择,具体取决于速度、吞吐量、算术能力、精度、规模、成本和功耗等因素[2]。单芯片乘法器的引入及其与微处理器架构的结合是能够实现 DSP 功能的商用 VLSI 芯片面市的最重要原因[3]。并行前缀加法器被认为是最有效的二进制加法电路。它们的规则结构和快速性能使得它们特别适合实现 VLSI[4]。数字的乘积生成需要一个处理器周期。无论是基于软件的移位和加法算法,还是一个
近年来,通过 Crispr/Cas9 技术靶向编码基因组引入单核苷酸缺失/插入已成为一种标准程序。它迅速催生了多种方法,例如 Prime Editing、Crispr/Cas9 辅助 APEX 邻近标记蛋白质或同源定向修复 (HDR),但支持这些方法的生物信息学工具却落后了。新应用通常需要特定的向导 RNA (gRNA) 设计功能,而通用的 gRNA 设计工具却严重缺失。在这里,我们回顾了 gRNA 设计软件并介绍了 multicrispr,这是一种基于 R 的工具,旨在设计单个 gRNA 以及并行靶向许多基因组位点的 gRNA 库。该软件包易于使用,可检测、评分和过滤 gRNA 的效率和特异性,可视化和汇总每个目标或 Crispr/Cas9 序列的结果,最后返回基因组范围以及首选的、无脱靶 gRNA 序列。为了通用,multicrispr 定义并实施了一个基因组算法框架,作为轻松适应尚未出现的技术的基础。其性能和新的 gRNA 设计概念(例如针对 gRNA 库的目标集特定过滤)使 multicrispr 成为处理类似筛选方法时的首选工具。
摘要 — 节能是多核嵌入式系统上计算密集型实时应用的关键要求。多核处理器支持任务内并行,在本文中,我们研究了有约束截止期限的零星并行任务的节能实时调度,其中每个任务都表示为有向无环图 (DAG)。我们考虑一个集群多核平台,其中同一集群内的处理器在任何给定时间都以相同的速度运行。提出了一个名为速度配置文件的新概念来模拟运行时每个任务和每个集群的能耗变化,以最大限度地降低预期的长期能耗。据我们所知,目前还没有研究考虑过有约束截止期限的 DAG 任务的节能实时调度,也没有在集群多核平台上进行。所提出的节能实时调度器在 ODROID XU-3 板上实现,以评估和证明其可行性和实用性。为了补充我们的大规模系统实验,我们还进行了模拟,结果表明,与现有方法相比,我们提出的方法可节省高达 67% 的 CPU 能耗。
在生物网络中,某些节点比其他节点更有影响力。最具影响力的节点是那些其消除会导致网络崩溃的节点,而检测这些节点在许多情况下至关重要。然而,当生物网络规模很大时,这是一项艰巨的任务。在本文中,我们设计并实现了一种高效的并行算法,利用图形处理单元 (GPU) 检测大型生物网络中的有影响力节点。所提出的并行算法背后的基本概念是重新设计几个计算量巨大的检测有影响力节点的程序,并将其转化为相当高效的 GPU 加速原语,如并行排序、扫描和缩减。四个局部指标,包括度中心性 (DC)、伴随行为 (CB)、聚类系数 (CC) 和 H 指数,用于衡量节点影响力。为了评估所提出的并行算法的效率,在实验中采用了五个大型真实生物网络。实验结果表明:(1) 与相应的串行算法相比,所提出的并行算法可以实现大约 48 ∼ 94 的加速比; (2) 与在多核 CPU 上开发的基线并行算法相比,所提出的并行算法对于 DC 和 H-Index 的加速比为 5 ∼ 9,而对于 CB 和 CC 的加速比由于度分布不均匀而略慢;(3) 当使用 DC 和 H-Index 时,所提出的并行算法能够在不到 3 秒的时间内检测出由 1.5 亿条边组成的大型生物网络中的影响节点。© 2019 Elsevier BV 保留所有权利。