缺乏大型和多样化的内窥镜数据集的AI的GI内窥镜检查和开发受到阻碍。因此,领域的传统发展涉及使用自然图像数据集(例如Imagenet-1K)进行预训练或转移学习。此路径要求组装相对较大且标记的填充数据集,以实现有意义的结果。创建此类数据集是耗时且昂贵的。此外,缺乏基础主链模型意味着GI内窥镜检查中不同的AI解决方案需要自己的推理计算开销。从部署的角度来看,这限制了部署多个AI解决方案在过程中实时运行的实用性。视觉基础模型特定于GI内窥镜检查可以统一AI解决方案,加速研究,甚至解锁了提高患者护理的新功能。
主要关键词