Loading...
机构名称:
¥ 1.0

音频denoising,尤其是在鸟类声音的背景下,由于持续的残留噪声,这仍然是一项具有挑战性的任务。传统和深度学习方法通​​常在人工或低频噪声中挣扎。在这项工作中,我们提出了VITV,这是一种新型的方法,利用了视觉变形(VIT)架构的力量。vitvs熟练地结合了分段技术,从而将清洁音频与复杂的信号混合物中解脱出来。我们的主要贡献涵盖了VITV的发展,引入了全面,远程和多规模的表示。这些贡献直接解决了常规方法固有的局限性。广泛的例子表明,VITV的表现要优于最先进的方法,将其定位为现实世界中鸟类声音降解应用的基准解决方案。源代码可用:https://github.com/aiai-4/vivts。索引术语:音频denoising,变压器,分段

视觉变压器分割的视觉鸟声音denoising

视觉变压器分割的视觉鸟声音denoisingPDF文件第1页

视觉变压器分割的视觉鸟声音denoisingPDF文件第2页

视觉变压器分割的视觉鸟声音denoisingPDF文件第3页

视觉变压器分割的视觉鸟声音denoisingPDF文件第4页

视觉变压器分割的视觉鸟声音denoisingPDF文件第5页

相关文件推荐

2024 年
¥2.0