摘要:本研究采用复杂的深度学习技术来开发健壮的自动图像字幕模型,整合卷积神经网络(CNN),用于复杂的特征提取和长期短期记忆网络(LSTMS),以生成细微的序列。旨在解决在线视觉内容的激增,该技术促进了有效的图像解释,并通过涵盖可访问性增强的应用程序来提高可访问性,改进的搜索功能的内容索引索引,并通过上下文相关的图像标题来增强社交媒体参与度。该研究为计算机视觉提供了宝贵的见解,应对产生连贯的图像描述的挑战。精心调整的模型同时进行定量和定性评估,展示了在内容检索和人类计算机相互作用中创新应用的有希望的结果。最终,这项研究愿意提高自动图像理解,从而促进对视觉信息的增强性和推动人工智能的进步。
主要关键词