摘要本研究介绍了AGGA,该数据集由80个学术准则组成,用于在学术环境中使用生成AIS(GAIS)和大型语言模型(LLM),并从官方大学网站上仔细收集。数据集包含188,674个单词,并充当了通常应用于需求工程中的自然语言处理任务的宝贵资源,例如模型合成,抽象识别和文档结构评估。此外,可以进一步注释AGGA作为各种任务的基准,包括歧义检测,需求分类和标识等效要求。我们的方法论严格的方法确保了彻底的检查,其中一系列代表各种各样的全球机构的大学,包括六大洲的顶级大学。数据集捕获了包括人文,技术以及公共和私人机构在内的各个学术领域的观点,为盖斯和LLM在学术界的整合提供了广泛的见解。