我们饶有兴趣地阅读了 Hassan 等人 [1] 撰写的社论,题为“人工智能在内窥镜检查中的无处不在,不只用于检测和表征”,该社论受到 Hansen 等人最近的论文“新型人工智能 (AI) 驱动的软件显著缩短了计算机视觉项目中注释所需的时间” [2] 的启发。正如 Hassan 等人指出的那样,与经典的机器学习方法 (MLM) 不同,这个新兴领域(即深度学习 [DL])的主要优势在于它能够自动提取图像特征,以便计算机可以使用它们来表征其内容 [3]。从本质上讲,这意味着这种无监督方法的准确性主要取决于所提供的训练数据的适当性和质量。特别是在胶囊内窥镜 (CE) 领域,图像数据随处可见,但谁来仔细研究图像、描绘/注释和评论感兴趣的区域,并确保使用高质量的材料进行 DL 训练,这还有待确定。考虑到这一点,我们投入了大量的人力(包括个人)[1],着手创建一系列相应的 CE 数据库,即 KID、CAD-CAP 和 Kvasir Capsule [4 – 6],以造福计算机科学家,而这却花费了我们自己和同事的努力。尽管它们通过来自不同制造商的 CE 图像得到丰富和扩大,但不同的数据库包含以各种方式准备的多种类别的胃肠道正常和异常发现。因此,数据库的清洁程度各不相同,它们为 AI 软件开发人员提供了独特的机会和各自的参考点。这种方法为结构化交付一系列急需的解决方案奠定了基础,这些解决方案可以准确检测和表征异常 CE 发现。这些包括可靠地生成解剖学缩略图