动机:从多个组织样品的大量DNA测序中重建肿瘤的进化史仍然是一个具有挑战性的计算问题,需要同时对肿瘤组织的反卷积及其进化史的推论。最近,系统发育重建方法通过将重建问题分为两个部分,从而取得了重大进展:固定拓扑的回归问题和对树空间的搜索。尽管已经为后一种搜索问题开发了有效的技术,但由于缺乏快速,专业的算法,回归问题仍然是方法设计和实施的瓶颈。结果:在这里,我们介绍了FastPPM,这是一种快速工具,可以通过树结构的双动态编程来解决回归问题。FastPPM支持任意可分离的凸损耗函数,包括ℓ2,分段线性,二项式和β-二元损失,并为现有算法提供了ℓ2和分段线性损失的渐近改进。我们发现,FastPPM的表现优于专业和通用回归算法,获得了50-450×加速度,同时提供了与现有方法一样准确的解决方案。将FASTPPM纳入几种系统发育推理算法中,立即产生高达400倍的速度,仅需要对现有软件的程序代码进行少量更改。最后,FASTPPM可以在模拟数据和结直肠癌的患者衍生的小鼠模型中分析低覆盖量的大量DNA测序数据,从精度和运行时都优于最先进的系统发育推断算法。可用性:FastPPM在C ++中实现,并在github.com/elkebir-group/fastppm.git上作为命令行接口和Python库可用。
摘要 - 综合语音构成中的进步,包括文本到语音(TTS)和语音转换模型(VC)模型,允许产生令人信服的合成声音,通常称为音频深击。这些深击构成了日益增长的威胁,因为对手可以在社交媒体或绕过语音身份验证系统上使用它们来模仿个人,特别是突出的人物,从而产生广泛的社会影响。最先进的验证系统有效地检测语音深击的能力令人震惊。我们提出了一种新型的音频深击检测方法Voiceradar,它通过物理模型增强了机器学习,以近似音频样品中的频率动力学和振荡。这显着增强了检测能力。Voiceradar利用了两个主要的物理模型:(i)多普勒效应了解音频样品的频率变化和(ii)鼓头振动以将复杂的音频信号分解为组件频率。语音形式通过应用这些模型来识别音频信号中的微妙变化或微频。这些微观频率是聚合以计算观察到的频率的,从而捕获了音频的独特签名。该观察到的频率集成到机器学习算法的损耗函数中,从而使算法能够识别将人类生产的音频与AI生成的音频区分开的不同模式。我们构建了一个新的不同数据集,以全面评估Voiceradar,其中包含来自领先的TTS和VC模型的样本。我们的结果表明,语音的表现优于准确识别AI生成的音频样品的现有方法,展示了其作为音频深击检测的强大工具的潜力。
宠物分割算法在临床相关任务上的可靠性能是其临床翻译所必需的。然而,这些算法通常使用优异构件(FOM)进行评估,这些算法(FOM)未明确设计以与临床任务性能相关。这样的FOM包括骰子相似性系数(DSC),Jaccard相似性系数(JSC)和Hausdorff距离(HD)。这项研究的目的是研究使用这些任务无关FOM的PET策略算法是否会产生与临床相关定量任务的评估一致的插入。方法:我们进行了一项回顾性研究,以评估使用DSC,JSC和HD评估分割算法的一致性,并在估算非宠物宠物的主要小细胞癌症患者的原发性肿瘤的代谢性肿瘤体积(MTV)和总病变糖素分析(TLG)的任务上。PET图像是从美国放射学学院想象网络6668/放射疗法肿瘤学组0235多细胞临床试验数据中收集的。这项研究是在2种情况下进行的:(1)评估常规分割算法,即基于阈值的算法(SUV MAX 40%和SUV MAX 50%),边界检测(Snakes)和随机建模(Markov Random -Forner -Firfor -fland -fander -flost -Fird -Eld –Gaussian混合模型); (2)评估网络深度和损耗函数对基于最先进的U-NET的性能的影响 - 基于基于的分割算法。结果:基于DSC,JSC和HD的常规销售算法的评估表明,SUV最大40%的表现明显优于SUV最大50%。然而,SUV最大40%在估计MTV和TLG的任务上的准确性较低,在整体归一化偏置中分别增加了51%和54%。同样,马尔可夫随机场 - 高斯混合物模型在任务-Nostic FOM的基础上显着超过了蛇的表现,但在估计的MTV中产生了24%的偏差。对于基于U-NET的算法,我们的评估表明,尽管网络深度并未显着改变DSC,JSC和HD值,但较深的网络在估计的MTV和TLG中产生的较高的精度分别降低了91%和87%。此外,尽管不同损耗函数的DSC,JSC和HD值没有显着差异,但仍存在估计的MTV和TLG偏差差异73%和58%。结论:使用任务不合稳定FOM对PET分割算法的评估可能会产生不一致的发现