本文展示了生成人工智能(AI)如何通过改进文本分析,表提取和图形分类来增强地质文档处理。传统的工作流与特定领域的术语,质量较差和稀有格式的术语斗争。为了应对这些挑战,我们采用了来自变压器(BERT)模型的微调双向编码器表示,以增强文本处理。此外,我们利用多模式的大语言模型来精确表识别和上下文感知的图像分类。最后,域名的检索系统Georag提高了信息检索的相关性和准确性。这些AI驱动的进步简化了数字化,增强了数据提取,并可以有效处理复杂的地球科学文档。尽管仍然存在幻觉,解释能力和产出一致性等挑战,但本研究突出了生成AI在地球科学工作流和决策过程中的变革潜力。
主要关键词