Loading...
机构名称:
¥ 1.0

我们向当代光学识别(OMR)中最紧迫的两个问题提供了解决方案。我们提高了低质量,现实世界的识别准确性(即包含衰老,照明或污垢伪像)输入数据,并提供置信度评级的模型输出以实现有效的人类后处理。具体来说,我们提出了(i)复杂的输入增强方案,可以通过合成数据和现实世界文档的嘈杂扰动的结合来减少消毒基准和现实任务之间的差距; (ii)一种可用于改善OMR系统在低质量数据上的性能的对抗歧视域的适应方法; (iii)模型集合和预测融合的组合,该组合为每个预测产生值得信赖的置信度评级。我们在新创建的测试集上评估了我们的贡献,该测试集由来自国际音乐得分图书馆项目(IMSLP)/petrucci音乐库的手动注释的各种现实世界质量的页面组成。通过提出的数据增强方案,与最先进的培训相比,嘈杂的现实世界数据的检测性能从36.0%增加了一倍,达到73.3%。然后将此结果与强大的信心评级相结合,为OMR部署在现实世界中的道路铺平了道路。此外,我们还显示了无监督的对抗域适应的优点,以将36.0%的基线提高到48.9%。

现实世界音乐对象识别

现实世界音乐对象识别PDF文件第1页

现实世界音乐对象识别PDF文件第2页

现实世界音乐对象识别PDF文件第3页

现实世界音乐对象识别PDF文件第4页

现实世界音乐对象识别PDF文件第5页

相关文件推荐

2024 年
¥1.0
2020 年
¥13.0