几条证据表明,B细胞在严重的全身性硬化症(SSC)病理生理学中的作用:B细胞刺激因子水平升高,干扰了B细胞稳态,随着幼稚B细胞的扩展以及鼠纤维化模型中B-Cell Depettion的抗纤维化效应的降低,降低了B细胞的稳态。首次随机对照试验显示CD20靶向抗体利妥昔单抗(RTX)2 3 3;然而,RTX在SSC中的治疗功效仍然存在争议:虽然一项试验表现出显着改善的皮肤,但在另一项研究中,2 RTX降低了强迫生命力(FVC)的下降,但与环形苯丙胺控制臂相比具有相似的影响。3与严重的红斑红斑(SLE)一样,我们推测CD20+ B细胞的耗竭可能不足以作为B细胞前体(在SSC中特别扩展,plasmablasts),并且可以通过CD20来靶向plasmablasts,而plasmablasts可能会产生自动抗体的产生。值得注意的是,自体干细胞移植克服了这些局限性,并在严重的SSC中表现出显着的治疗效果。4但是,与移植相关的死亡率很高。因此,对深层和宽CD19+ B细胞耗竭的更耐受治疗可能更有效。最近,CD19-细胞抗原受体(CAR)T细胞在难治性SLE 5中显示出显着的作用,并且在患有抗合成酶综合征患者的疗效的第一个证据中表现出了第一个证据,6表明通过CD19卡细胞拦截B细胞驱动的自身免疫性疾病的原理可行性。在这里,我们首次报道了用CD19-CAR T细胞治疗严重治疗难治性SSC的患者。一名60岁的男子出现了弥漫性皮肤SSC,在基线前22个月前22个月,在基线28个月前,基线和Raynaud现象开始前22个月前22个月发作。在基础线上,患者出现了弥漫性心肌纤维化(心脏MRI),肺纤维化(高分辨率计算机断层扫描),肺动脉高压(I类(I类),基于右心导管的结果:右心脏导管的结果:33 MM HG(> 33 MM HG)的肺部和后肺后高压率(I级) MM HG(> 14)和3木单元(> 2)),雷诺(Raynaud)现象和腕关节炎的肺血管耐药性。他具有阳性抗核抗体滴度和抗RNA聚合酶III自身抗体(亚基RP11)。以前失败的免疫抑制剂包括甲氨蝶呤(15 mg/周,治疗持续时间为3个月)和霉菌酸盐(剂量2 g/day持续23个月)。环磷酰胺。免疫抑制在淋巴结序列前进行了锥形,并在CAR T细胞输注前4周停止。CAR T细胞是由通过神经术获得的自体T细胞产生的。t细胞被宽性病毒载体(Miltenyi)转导,并通过自动化系统(Clinicmacs Prodigy)扩展。5在剂量减少淋巴结(50%)后,由于肾上腺素损伤(12.5 mg/m 2;天-5,-4和-3)和环磷酰胺(500 mg/m²,第-3天,-3),1×106 CAR T细胞/kg。汽车T细胞CAR T细胞从第3天开始迅速扩展(总计:0.3个细胞/μL,CD3+ T细胞的0.1%汽车)到第9天(1275/μL; 66,35%CD3+ T细胞的汽车;图1A,B)。
摘要 - 动画机器人有望通过栩栩如生的面部表达来实现自然的人类机器人互动。然而,由于面部生物力学的复杂性和对响应式运动的综合需求,产生逼真的语音同步机器人表达式构成了重大挑战。本文介绍了一种新颖的,以皮肤为中心的方法,以从语音输入中驱动动画机器人面部表情。在其核心上,提出的方法采用线性混合皮肤(LB)作为统一表示,并在实施例设计和运动合成中指导创新。lbs通知致动拓扑,促进人类表达重新定位,并实现有效的语音驱动面部运动产生。这种方法证明了在单个NVIDIA RTX 4090上实时在4000 fps上实时在动画面上产生高度现实的面部表情的能力,从而显着提高了机器人在自然相互作用上复制细微的人类表达式的能力。为了促进该领域的进一步研究和开发,该代码已在以下网址公开提供:https://github.com/library87/openroboexp。
摘要。本文介绍了用于图像识别的深度卷积神经网络训练的性能-能量权衡研究。使用配备 Nvidia Quadro RTX 6000 和 Nvidia V100 GPU 的系统测试了几种具有代表性且广泛采用的网络模型,例如 Alexnet、VGG-19、Inception V3、Inception V4、Resnet50 和 Resnet152。使用 GPU 功率上限,我们发现除了默认配置之外,还可以最小化三个不同的指标:能量 (E)、能量延迟积 (EDP) 以及能量延迟总和 (EDS),从而节省大量能源,EDP 和 EDS 的性能损失较低到中等。具体来说,对于 Quadro 6000 和最小化 E,我们获得了 28.5%–32.5% 的节能效果;对于 EDP,我们获得了 25%–28% 的节能效果,平均性能损失为 4.5%–15.4%;对于 EDS (k=2),我们获得了 22%–27% 的节能效果,平均性能损失为 4.5%–13.8%。对于 V100,我们发现平均节能效果为 24%–33%;对于 EDP,我们获得了 23%–27% 的节能效果,平均性能损失为 13%–21%;对于 EDS (k=2),我们获得了 23.5%–27.3% 的节能效果,平均性能损失为 4.5%–13.8%。
摘要 - 3D对象检测对于自动驾驶(AD)和高级驾驶员辅助系统(ADA)至关重要。但是,大多数3D检测器优先考虑检测准确性,通常会忽略实际应用中的网络推理速度。在本文中,我们提出了基于4D MMWave雷达点云的实时可靠的3D对象检测器RadarNext。它利用可重新参数的神经网络来捕获多尺度功能,降低记忆成本并加速推理。此外,为了突出雷达点云的不规则前景特征并抑制背景混乱,我们提出了一个可变形的可变形前景增强网络(MDFEN),以确保检测准确性,同时小型地牺牲了速度的牺牲和参数的过多。dive viewt和tj4dradset数据集的实验结果验证了Radarnext的出色性能和效率,使用我们提出的MDFEN实现了50.48和32.30映射的变体。值得注意的是,我们的radarnext变体在RTX A4000 GPU上达到了超过67.10 fps的推理速度,而Jetson AGX Orin上的推理速度则达到了28.40 fps。这项研究表明,Radarnext带来了基于4D MMWave雷达的3D感知的新颖有效的范式。索引项 - 4D mmwave雷达; 3D对象检测;基于边缘的感知;轻量级感知模型
由于气候变化,热带气旋变得更加激烈,与基于数学模型的传统方法相比,基于AL的建模的崛起提供了一种更实惠和更容易获得的方法。这项工作通过整合卫星成像,遥感和大气数据来利用生成扩散模型来预测旋风轨迹和降水模式。它采用了一种级联的方法,该方法包含三个主要任务:预测,超分辨率和降水建模。培训数据集包括2019年1月至2023年3月的六个主要热带气旋盆地的51个旋风。实验表明,来自级联模型的最终预测显示,对于所有三个任务,分别超过0.5和20 dB的良好结构相似性(SSIM)和峰值信号 - 噪声比(PSNR)值(SSIM)和峰值信号 - 噪声比(PSNR)值分别具有出色的结构相似性(SSIM)。可以在单个NVIDIA A30/RTX 2080 Ti的30分钟内生成36小时的预测。这项工作还强调了AL方法的有希望的效率,例如在天气预报中为高性能需求的扩散模型,例如热带气旋预测,同时保持计算负担得起,使其非常适合具有关键预测需求和财务限制的高度脆弱区域。代码可在https://github.com/nathzi1505/forecast-diffmodels上访问。
摘要 - 优化人工神经网络的计算效率对于资源受限的平台(例如自主驾驶系统)至关重要。为了应对这一挑战,我们提出了一个轻巧的上下文感知网络(LCNET),该网络加速了语义细分,同时在本文中保持了推理速度和细分精度之间的有利权衡。提出的LCNET引入了部分通道转换(PCT)策略,以最大程度地减少基本单元的计算潜伏期和硬件要求。在PCT块中,三个分支的上下文聚合(TCA)模块扩展了功能接收场,从而捕获多尺度上下文信息。此外,双重注意引导的解码器(DD)恢复了空间细节并增强了像素预测的认可。在三个基准上进行的广泛实验证明了拟议的LCNET模型的有效性和效率。值得注意的是,一个较小的LCNET 3_7仅获得了73.8%MIOU,只有51万个参数,分别使用单个RTX 3090 GPU和Jetson Xavier NX,其令人印象深刻的推理速度约为142.5 fps和〜9 fps。更准确的LCNET 3_11版本可以在约117 fps的推理速度下以相同的分辨率达到75.8%MIOU,在城市景观上约为117 fps推理速度。可以在较小的图像分辨率下实现更快的推理速度。LCNET在移动应用程序方案 - iOS的计算效率和预测能力之间取得了巨大的平衡。代码可在https://github.com/lztjy/lcnet上找到。
摘要。Opticks是一个开源项目,它通过集成通过NVIDIA OPTIX 7 + API访问的GPU射线跟踪来加速光光子仿真,并具有基于GEANT4的仿真。已经测量了第一个RTX生成的单个NVIDIA Turing GPU,以提供超过1500倍单线GEANT4的光子光子模拟速度因子,并具有完整的Juno Analytic GPU几何形状自动从GEANT4 GEOM-ETRY转换。基于GEANT4的CUDA程序,实施了散射,吸收,闪烁体再发射和边界过程的光学物理过程。波长依赖性的材料和表面特性以及重新发射的反向分布函数被交织成GPU纹理,从而提供快速插值的属性查找或波长产生。在这项工作中,我们描述了采用全新的NVIDIA OPTIX 7 + API所需的几乎完整的重新实现,现在实现了基于OPTIX使用的CUDA,仅限于提供相交。重新实现具有模块化的许多小型标头设计,可在GPU和CPU上进行细粒度测试,并从CPU / GPU共享中减少大量代码。增强的模块化已使CSG树的通用 - 类似于G4Multiunion的“列表节点”,从而改善了复杂CSG固体的表现。还支持对多个薄层(例如抗反射涂层和光阴道)的边界的影响,并使用CUDA兼容传递矩阵方法(TMM)计算反射,透射率和吸收性的计算。
摘要 —本文提出了一种神经形态音频处理的新方法,将脉冲神经网络 (SNN)、Transformers 和高性能计算 (HPC) 的优势整合到 HPCNeuroNet 架构中。利用英特尔 N-DNS 数据集,我们展示了该系统处理多种语言和噪声背景下的不同人类声音录音的能力。我们方法的核心在于将 SNN 的时间动态与 Transformers 的注意机制相融合,使模型能够捕捉复杂的音频模式和关系。我们的架构 HPC-NeuroNet 采用短时傅里叶变换 (STFT) 进行时频表示,采用 Transformer 嵌入进行密集向量生成,采用 SNN 编码/解码机制进行脉冲序列转换。通过利用 NVIDIA 的 GeForce RTX 3060 GPU 和英特尔的 Core i9 12900H CPU 的计算能力,系统的性能得到进一步增强。此外,我们在 Xilinx VU37P HBM FPGA 平台上引入了硬件实现,针对能源效率和实时处理进行了优化。所提出的加速器在 100 MHz 下实现了 71.11 千兆操作每秒 (GOP/s) 的吞吐量,片上功耗为 3.55 W。与现成设备和最新最先进实现的比较结果表明,所提出的加速器在能源效率和设计灵活性方面具有明显优势。通过设计空间探索,我们提供了优化音频任务核心容量的见解。我们的发现强调了集成 SNN、Transformers 和 HPC 进行神经形态音频处理的变革潜力,为未来的研究和应用树立了新的标杆。
Graves疾病(GD)是甲状腺的一种特异性自身免疫性疾病,其特征是循环TSH受体(TSH-R)刺激抗体(TSAB),导致甲状腺功能亢进。Graves的眼科病(GO)是与TSAB的存在相关的GD外甲状腺外表现之一,胰岛素样生长因子-1受体1受体(IGF-1R)自身抗体,与轨道相互作用。细胞因子在自身免疫性(即IL-18,IL-6)和非自动免疫性甲状腺功能亢进症(即TNF-A,IL-8,IL-6)中升高,这可能与甲状腺激素增加的慢性作用有关。在GD和GO的免疫性致病发生中报道了普遍的Th1免疫反应(本身与甲状腺功能亢进无关,但与自身免疫过程有关);在此过程中,Th1-脱脂因子(CXCL9,CXCL10,CXCL11)和(C-X-C)R3受体至关重要。在活性GO,皮质类固醇或静脉内免疫球蛋白的患者中,降低了炎症和轨道充血,被认为是第一线疗法。对GO病理生理学的更深层次的了解导致了不同的免疫调节治疗。细胞因子,TSH-R和IGF-1R(在B和T淋巴细胞的表面和纤维细胞的表面上),以及与自身免疫过程有关的趋化因子,是新疗法的可能靶标。靶向细胞因子(Etanercept,tocilizumab,subimab,adalimumab)的药物已在GO中进行了测试,结果令人鼓舞。针对CD20,RTX的嵌合单克隆抗体可减少B淋巴细胞,细胞因子和释放的自身抗体。一项多中心,随机,安慰剂控制的双掩盖试验研究了针对IGF-1R Teprotumumab的人类单克隆阻滞抗体,报告了其在GO中的有效性。总而言之,需要大型,受控和随机研究来评估GO的新可能靶向疗法。
抽象的智能移动性和自动驾驶汽车(AV),必须非常精确地了解环境,以保证可靠的决策,并能够将公路部门获得的结果扩展到铁路等其他领域。为此,我们基于Yolov5引入了一个新的单阶段单眼3D对象检测卷积神经网络(CNN),该卷积神经网络(CNN)致力于公路和铁路环境的智能移动性应用。要执行3D参数回归,我们用混合锚盒替换了Yolov5的锚点。我们的方法有不同的模型大小,例如yolov5:小,中和大。我们提出的新模型已针对实时嵌入DED约束(轻巧,速度和准确性)进行了优化,该模型利用了被分裂注意的改进(SA)卷积所带来的改进(称为小型分裂注意模型(SMALL-SA)。为了验证我们的CNN模型,我们还通过利用视频游戏Grand Theft Auto V(GTAV)来引入一个新的虚拟数据集,以针对道路和铁路环境。我们在Kitti和我们自己的GTAV数据集上提供了不同模型的广泛结果。通过我们的结果,我们证明了我们的方法是最快的3D对象检测,其准确性结果接近Kitti Road数据集上的最新方法。我们进一步证明,GTAV虚拟数据集上的预训练过程提高了实际数据集(例如Kitti)的准确性,从而使我们的方法比最先进的方法获得了更高的准确性,该方法具有16.16%的3D平均均衡性精度,而硬CAR检测的推理时间为11.1 MS/rtx 3080 gpu的推理时间为11.1 s/simage。