我们提出了格子(p Rotein la tent i doffusion),这是一种通过在预先训练的序列序列序列序列的序列序列的压缩潜在空间上学习扩散,用于蛋白质结构域的发电范围和蛋白质结构域的序列。由于在生成模型训练期间仅需要序列训练数据,因此与其他序列结构生成模型相比,我们将可用的训练数据集增加了10 2×至10 4×。此外,这扩大了可控制生成的注释,我们证明了功能和生物体的组成条件,包括2219个基因本体论功能的丰富词汇。样品表现出跨模式的一致性,同时具有条件弗雷切特(Fréchet)的距离(FID)测量的所需特性。格子范式避免了结构数据库的强烈先验和大规模失衡,可以轻松地使用数据和计算来缩放,并可以控制全原子蛋白质结构和序列。
我们描述了 CounterSynth,这是一种微分同胚变形的条件生成模型,可在体积脑图像中诱导标签驱动的、生物学上合理的变化。该模型旨在为下游判别建模任务合成反事实训练数据增强,其中保真度受到数据不平衡、分布不稳定、混杂或规格不足的限制,并且在不同亚群中表现出不公平的表现。我们专注于人口统计属性,使用基于体素的形态测量、条件属性的分类和回归以及 Fréchet 初始距离来评估合成反事实的质量。在人为的人口不平衡和混杂的背景下检查下游判别性能,我们使用英国生物库和 OASIS 磁共振成像数据对 CounterSynth 增强与这些问题的当前解决方案进行基准测试。我们在整体保真度和公平性方面都实现了最先进的改进。 CounterSynth 的源代码可在 https://github.com/guilherme-pombo/CounterSynth 上找到。
我们必须保护固有的脆弱量子数据以释放量子技术的潜力。量子存储方案的相关问题是它们近期实施的潜力。由于海森贝格铁磁体很容易获得,因此我们研究了它们的稳健量子存储潜力。我们建议使用置换不变的量子代码将量子数据存储在Heisenberg Ferromagnets中,因为任何Heisenberg Ferromagnet的地面空间都必须在任何基本Qubits的置换库下对称。通过利用Pauli错误的预期能量的区域法,我们表明,增加海森堡铁磁体的有效维度可以改善存储寿命。当海森堡铁磁体的有效维度最大时,我们还获得了一个上限,以解决存储误差。此结果依赖于扰动理论,在该理论中,我们使用戴维斯(Davis)的差异差异表示以及这些分裂差异的递归结构。我们的数值界限使我们能够更好地了解海森堡铁磁体如何在Heisenberg Ferromagnets中增强量子记忆的寿命。
生成的对抗网络(GAN)由于能够捕获复杂的高维数据分布而无需广泛的标签,因此近年来受到了极大的关注。自2014年的受孕以来,已经提出了各种各样的GAN变体,其中包含替代体系结构,优化器和损失功能,目的是提高性能和训练稳定性。本手稿着重于量化GAN结构对特定图像降解模式的弹性。我们进行系统的实验,以经验确定10个基本图像降解模式的影响,该模式应用于训练图像数据集,对条件深度卷积GAN(CDCGAN)产生的图像的Fréchet距离(FID)。我们在𝛼 = 0处找到。05水平,亮度,变暗和模糊在统计学上比完全删除降级数据的统计学意义更大,而其他降解通常可以安全地保留在训练数据集中。此外,我们发现,在随机部分遮挡的情况下,所得的GAN图像的FID接近降级训练集的闭塞水平,这令人惊讶的是,GAN FID的性能等于训练集的75%下降。
作者衷心感谢加州大学戴维斯分校健康中心和塞拉健康基金会提供的资金和行政支持。本报告受益于众多来源的意见和帮助:医疗政策和研究中心(Joy Melnikow、Dominique Ritley、Sabrina Loureiro、Ryan Ciuffetelli)、Stantec(Jeffery Farley、Jared Fisher、Christopher Wilson)、项目成本工作组(Len Nichols、Ethan Evans 等)、项目技术顾问委员会(Kaying Hang、Chet Hewitt、David Panush、David Lubarsky、Peter Beilenson 等)、项目临床顾问小组(Amy Barnhorst、Aimee Moulin、Mary Kathryn Orsulak、Tommie Trevino 等)、加州州立大学萨克拉门托分校(Arturo Baiocchi、Susanna Curry、Ethan Evans)、Jake Segal(社会金融)以及合作项目成员。对上述人员和组织的致谢并不意味着认可任何发现或结论。任何剩余错误均由作者负责。
摘要。连接组学已成为神经成像领域的强大工具,并推动了连接数据统计和机器学习方法的最新进展。尽管连接组存在于矩阵流形中,但大多数分析框架都忽略了底层数据几何。这主要是因为简单的操作(例如均值估计)没有易于计算的闭式解。我们提出了一种用于连接组的几何感知神经框架,即 mSPD-NN,旨在估计对称正定 (SPD) 矩阵集合的测地线均值。mSPD-NN 由具有绑定权重的双线性全连接层组成,并利用新颖的损失函数来优化由 Fréchet 均值估计产生的矩阵法向方程。通过对合成数据进行实验,我们证明了我们的 mSPD-NN 与常见的 SPD 均值估计替代方案相比的有效性,在可扩展性和抗噪性方面提供了具有竞争力的性能。我们在 rs-fMRI 数据的多个实验中说明了 mSPD-NN 的真实世界灵活性,并证明它发现了与 ADHD-ASD 合并症患者和健康对照者之间的细微网络差异相关的稳定生物标志物。
Al 0.85 Ga 0.15 As 0.56 Sb 0.44 由于其电子和空穴电离系数之间的比率非常大,因此作为 1550 nm 低噪声短波红外 (SWIR) 雪崩光电二极管 (APD) 的材料最近引起了广泛的研究兴趣。这项工作报告了厚 Al 0.85 Ga 0.15 As 0.56 Sb 0.44 PIN 和 NIP 结构的新实验过剩噪声数据,测得的噪声在比以前报告的乘法值高得多的倍增值下(F = 2.2,M = 38)。这些结果与经典的 McIntyre 过剩噪声理论不一致,该理论高估了基于该合金报告的电离系数的预期噪声。即使添加“死区”效应也无法解释这些差异。解释观察到的低过量噪声的唯一方法是得出结论,即使在相对较低的电场下,该材料中电子和空穴碰撞电离的空间概率分布也遵循威布尔-弗雷歇分布函数。仅凭电离系数的知识已不足以预测该材料系统的过量噪声特性,因此需要提取该合金的电场相关电子和空穴电离概率分布。
深度学习技术越来越多地用来以高准确性对医学成像数据进行分类。尽管如此,由于训练数据通常有限,这些模型可能缺乏足够的可推广性来预测不同领域中产生的未见测试数据,并具有可观的性能。本研究的重点是甲状腺组织病理学图像分类,并研究了只有156个患者样品训练的生成对抗网络[GAN]是否可以产生高质量的合成图像以充分增强训练数据并改善整体模型的可推广性。利用stylegan2方法,生成网络生成的图像产生了频率创造距离(FID)分数为5.05的图像,匹配的最新gan会导致具有可比数据集尺寸的非医疗域。当对从三个单独的域中采购的外部数据进行测试时,使用这些GAN生成的图像对训练数据进行培训数据增加了模型,将总体精度和AUC分别提高了7.45%和7.20%,而基线模型则分别提高了7.45%和7.20%。最重要的是,在训练有素的病理学家进行分类时,在少数群体图像,肿瘤亚型上观察到了这种绩效改善。
摘要 - 交通迹象对于向驾驶员提供重要信息,确保其安全并帮助他们遵守道路规则至关重要。对象检测算法(例如您只看一次(YOLO))在自动驾驶汽车中使用来监视交通标志信息。但是,大多数对象检测研究都集中在识别交通标志而不是其身体状况上。现有数据集的一个主要问题是缺乏有关培训损坏的流量标志的数据,这可能会对对象检测算法的性能产生不利影响。为了解决这个问题,我们的论文全面审查了图像到图像(I2i)算法,以修改现有的流量标志图像以展示不同的身份状态(正常和损坏)。我们使用最先进的图像式图像翻译技术,UNET视觉变压器周期符合生成对抗网络(UVCGAN)V2和能量引导的随机微分方程(EGSDE)进行实验进行实验。使用Fréchet成立距离(FID)和并排图像比较评估我们的实验结果。我们分析并讨论可能的和未来的改进。关键字 - 流量标志检测,图像生成,图像 - to-Image(I2i),生成对抗网络(GAN),循环生成对抗网络(Cyclegan),扩散模型
摘要。文本对图像合成是机器学习中最具挑战性和最受欢迎的任务之一,许多模型旨在提高该领域的性能。深融合生成的对抗网络(DF-GAN)是图像生成的直接但有效的模型,但它具有三个关键局限性。首先,它仅支持句子级文本描述,从而限制了其从文字级输入中提取细颗粒特征的能力。第二,可以优化残差层和块的结构以及关键参数,以提高性能。第三,现有的评估指标,例如FréchetInception距离(FID),倾向于不适当地强调无关紧要的功能,例如背景,当重点放在生成特定对象上时,这是有问题的。为了解决这些问题,我们引入了一个新的文本编码器,该编码器增强了具有处理单词级描述能力的模型,从而导致更精确和文本一致的图像生成。此外,我们优化了关键参数,并重新设计了卷积和残留网络结构,从而产生了更高质量的图像并减少了运行时间。最后,我们提出了一种量身定制的新评估理论,以评估生成图像中特定对象的质量。这些改进使增强的DF-GAN在有效地产生高质量的文本分配图像方面更有效。