在过去的十年中,单晶钻石(SCD)生长的显着技术进步导致了高质量SCD底物的商业产品,通常以尺寸的几个平方毫米的良好特定板的形式获得[1]。同时,此类板的成本已大大降低[2],这引发了重要的研发工作,旨在利用SCD的特性[3],热[4]和机械性能[5] [5]用于电子学中的各种应用[6],光(光(光环)[7-10],光学和光学技术[11] [11] [11] [11] [11] [11] [11] [11])[11] [11] [11] [11] [11] [11] [11] [11] [11] [11] [11] [11] [11] [11]。高质量的SCD板是通过化学蒸气沉积(CVD)[13,14]或高压高温(HPHT)[15]技术生长的。记录示范最近产生的SCD底物直径为10 cm [16],但如今更典型的尺寸为1 mm – 10 mm,厚度为50μm -1 mm。基板以不同的“等级”类别提供(例如电子[6,17],光学[18]或机械[19])根据其杂质的程度,这表明底物性质已被遗忘,特别适合特定的应用区域。SCD的精确成型主要是使用激光切割和烧蚀技术以毫米尺度的目标维度进行的,具有几微米的精确性要求,例如切片钻石板或制造切割工具,用于转弯,敷料或铣削。微丝[41-47]和光栅[48,49])和光子学(例如用于耦合器[50-54]和谐振器[52,55-59])。激光处理也用于千分尺尺度的结构,例如复合折射率[20-23],埋入的波导[24-26]和微通道[27,28]。离子束蚀刻(IBE)可以有效地平滑并抛光SCD板[29,30],而聚焦的离子束(FIB)铣削已用于制造悬浮的结构[31-33],砧[34,35]和固体膜片[36-38]。尽管这些图案技术对于一组特定形状和设备最有效,但基于反应性离子蚀刻(RIE)制造方法是最常用的方法,用于广泛的应用,需要亚微米精度[39,40],例如微观典型(例如,与Rie相比
在过去十年中,图形处理单元 (GPU) 的进步推动了人工智能 (AI)、高性能计算 (HPC) 和数据分析领域的重大发展。要在这些领域中的任何一个领域继续保持这一趋势,就需要能够不断扩展 GPU 性能。直到最近,GPU 性能一直是通过跨代增加流式多处理器 (SM) 的数量来扩展的。这是通过利用摩尔定律并在最先进的芯片技术节点中使用尽可能多的晶体管数量来实现的。不幸的是,晶体管的缩放速度正在放缓,并可能最终停止。此外,随着现代 GPU 接近光罩极限(约 800 平方毫米),制造问题进一步限制了最大芯片尺寸。而且,非常大的芯片会导致产量问题,使大型单片 GPU 的成本达到不理想的水平。GPU 性能扩展的解决方案是将多个物理 GPU 连接在一起,同时向软件提供单个逻辑 GPU 的抽象。一种方法是在印刷电路板 (PCB) 上连接多个 GPU。由于提供的 GPU 间带宽有限,在这些多 GPU 系统上扩展 GPU 工作负载非常困难。封装内互连(例如通过中介层技术)比封装外互连提供更高的带宽和更低的延迟,为将 GPU 性能扩展到少数 GPU 提供了一个有希望的方向 [1]。晶圆级集成更进一步,通过将预制芯片粘合在硅晶圆上,为具有数十个 GPU 的晶圆级 GPU 提供了途径 [2]。不幸的是,使用电互连在长距离上以低功耗提供高带宽密度从根本上具有挑战性,从而限制了使用电中介层技术进行 GPU 扩展。在本文中,我们提出了光子晶圆网络 (NoW) GPU 架构,其中预先制造和预先测试的 GPU 芯片和内存芯片安装在晶圆级中介层上,该中介层通过光子网络层连接 GPU 芯片,同时将每个 GPU 芯片与其本地内存堆栈电连接,如图 1 所示。光子-NoW GPU 架构的关键优势在于能够在相对较长的晶圆级距离(高达数十厘米)内以低功耗实现高带宽密度。本文的目标是展示光子-NoW 的愿景
以及最近的临床研究。11 – 21 在 PAI 中,当纳秒激光照射组织时,发色团(例如氧合血红蛋白 (HbO 2 ) 和脱氧血红蛋白 (Hb))会吸收能量并通过热弹效应产生光声波。1 , 22 – 25 产生的波由超声换能器检测并通过图像重建算法进行处理。PAI 以前曾用于在小型和大型动物模型中提供高分辨率脑血管结构和功能图像。26 – 28 高分辨率功能性脑成像系统可以解答许多神经科学问题。22 , 29 , 30 对于功能成像,PAI 依赖于与功能性磁共振成像相同的原理,通过对脑血流动力学波动(即氧需求变化)进行成像来间接捕获神经活动。已报道了许多将 PAI 用于功能性脑成像的应用。例如,Wang 等人。4 对大鼠脑在胡须刺激、高氧和缺氧反应下的脑血流动力学变化进行了成像;Nasiriavanaki 等人。22 , 31 开发了一种光声计算机断层扫描 (PACT) 系统来监测小鼠脑皮质静息状态功能连接;1 Kang 等人。对小鼠脑癫痫发作期间的神经元活动进行了成像; 32 Liao 等人33 对大鼠脑响应前爪电刺激的血流动力学变化进行了成像;Janggun 等人34 开发了一种功能性 PAI 系统来监测可卡因引起的大鼠脑区域激活。PAI 有两种主要实现方式:PACT 和光声显微镜 (PAM),后者根据聚焦方式进一步分为两类,即声学分辨率-PAM 和光学分辨率 PAM (OR-PAM)。1 , 35 虽然 PACT 用于对较深区域较大血管的血流动力学参数进行成像, 4 , 22 , 36 – 39 PAM 用于对细小血管(即浅层毛细血管)进行成像。40 – 45 与脑内较大的血管相比,对毛细血管血流动力学变化的分析可以更详细地了解脑功能。OR-PAM 的早期版本使用 2D 振镜扫描仪,在约 2 分钟内提供直径约为 6 毫米的成像区域。46 通过结合更快的扫描硬件,例如微机电系统镜,第二代 OR-PAM 系统变得更快。例如,Yao 等人。47 开发了一种 OR-PAM 系统,能够在 37 秒内对 2.5 × 4 平方毫米的区域进行成像;Lan 等人。48
导致基板短缺的原因是什么? E. Jan Vardaman,TechSearch International, Inc. 总裁兼创始人 意外需求、全球供应链不确定性、事故和天气相关事件导致半导体短缺。所有类型的基板都供不应求;包括芯片级封装 (CSP) 和倒装芯片球栅阵列 (FC-BGA) 的基板。尽管未来几年将有一些产能扩张,并且新工厂计划在 2024-25 年上线,但预计至少两到三年内情况不会改善。一些公司正在考虑不使用基板的替代品,包括扇出型晶圆级封装 (FO-WLP)。采用 RDL 来减少基板设计的层数也在考虑之中。 导致 FC-BGA 需求的原因是什么?使用积层材料制造的 FC-BGA 基板需要支持用于服务器、笔记本电脑和台式机的 CPU、AI 加速器、电信中的 ASIC、HDTV、DSP 和 FPGA 等媒体芯片等应用的细间距凸块芯片。与该行业的许多领域不同,FC-BGA 的短缺并不是由疫情造成的。虽然对服务器、笔记本电脑和台式机的需求有所增加,但对额外基板制造能力的需求主要是由于某些领域的更大尺寸和增加的层数。ASIC 具有多种尺寸,常见的基板采用 4-2-4 积层结构。虽然许多应用使用 2-2-2 积层结构,但其他应用使用更大的数量和更大的尺寸。Apple 的 M1 采用 3-2-3 积层结构(见图 1)。服务器 CPU 的体积和层数增加是基板容量需求增加的主要原因。高端服务器 CPU 预计将使用最大 100mm x 100mm 的主体尺寸,核心每侧有 10 个构建层。在高端,高端网络交换机封装的边长在 70 mm 到 90 mm 之间。OSAT 报告称,他们预计到 2023 年将出现对 100mm x 100mm 基板的需求。正在考虑更大的主体尺寸。最小层数为每侧六或七层构建层,即将出现一些八层和九层构建层的设计。虽然单位产量较低,但由于基板大而复杂,因此对面板的要求很高,会影响面板上的布局以及面板产量。预计共封装光学器件将使用更大的 110 mm x 110 mm 主体尺寸。硅中介层呢?许多应用程序不是都将它们用于封装吗?是的,硅中介层用于 AI 加速器、高性能 FPGA 应用和高端网络交换机,但它们连接到层压积层基板上以完成封装。硅中介层通过焊球连接到层压基板上,通常间距为 130 µm。典型的 AI 加速器尺寸为 55 毫米 x 55 毫米。随着中介层尺寸的增加,需要更大的积层基板。台积电提出了超大的 2,500 平方毫米硅中介层,将
植入式神经接口在帮助瘫痪、截肢或各种神经系统疾病患者恢复功能方面具有巨大潜力。为了精确映射大脑各个区域的神经活动并提高信息传输速率,记录通道的数量显著增加,最近的系统集成了数千个或更多通道 [1-2]。这就需要能够处理数百 Mb/s 吞吐量的无线链路,这对无线植入物的功耗、尺寸和传输范围提出了重大挑战。由于体通道通信 (BCC) 能够实现毫米级外形尺寸,因此在脑植入物中的应用日益广泛 [3-4]。然而,它在数据速率和传输距离方面都面临限制。另一方面,脉冲无线电超宽带 (IR-UWB) 通信由于其高数据速率和低功耗而提供了一种有前途的解决方案 [5- 6]。然而,现有的 IR-UWB 发射器 (TX) 受到厘米级传输范围和较大尺寸的阻碍,使其并不适合长期植入。实现米级传输距离的远场射频辐射为患者提供了相当大的活动自由。然而,它需要一种高效的无线链路,符合大脑数十 mW/cm 2 的严格功耗要求。为了应对扩大植入式 TX 传输范围同时最小化其尺寸和功耗的挑战,本文介绍了一种经皮、高数据速率、完全集成的 IR-UWB 发射器,它采用新颖的协同设计的功率放大器 (PA) 和天线接口来增强性能。与最先进的 IR-UWB TX [5-6] 相比,通过协同设计的接口,我们实现了 49.8 平方毫米 (8.3 毫米×6 毫米) 的最小占用空间和 1.5 米的最长传输范围。图 1 展示了所提议的 TX 的架构,它结合了开关键控 (OOK) 调制方案和基于相移键控 (PSK) 的加扰。使用 PSK 加扰可以增强对极性的控制,从而有效地消除 OOK 输出频谱中的离散频谱音调,以符合 FCC 监管要求。正交本振 (LO) 信号由基于 2 级环形振荡器 (RO) 的整数 N 宽带锁相环 (PLL) 生成,提供类似 LC-VCO 的抖动性能。脉冲发生器输出 2ns 脉冲宽度的 OOK 数据,该数据被馈送到带有可编程延迟线 (DL) 的脉冲整形器 (PS)。PS 与开关电容 PA (SCPA) 一起在 RF 域中进行 FIR 滤波,从而提高频谱效率。无线链路由片外偶极天线建立,选择该天线是因为其与小型化植入物兼容,因为与单极天线相比,它不需要大的接地平面。图 2 显示了基于反相器的相位多路复用器 (PHMUX)、PS 和 SCPA 的框图。PHMUX 和 SCPA 均采用全差分架构,无需片外平衡器。为了提高功率和面积效率,同时确保有效的旁瓣抑制,采用了 4 位三角模板。该模板可以配置为对称或不对称,从而提高符号间干扰 (ISI) 性能。图 2(右上)将所提出的调制方案的模拟输出频谱与理想的三角包络进行了比较,表明在旁瓣抑制和主瓣带宽方面具有可比的性能。图 3 说明了数字/电压控制 RO 的电路实现,具有一对延迟元件和混合控制电阻器。振荡频率由 4 位数字控制字 (FC) 控制,以克服 PVT 变化,以及差分环路滤波器产生的两个模拟信号(即 VCP 和 VCN)。为了最大限度地减少基板噪声耦合,我们采用了差分电荷泵 (CP) 和环通滤波器 (LPF),与单端配置相比,调谐范围几乎增加了两倍。测量的 PLL 锁定频率范围