• 在官方统计数据的制作中使用人工智能并不是什么新鲜事(例如用于编码、图像处理、评论分类的 NLP) • 尝试使用 LLM(人口普查参考资料、报告生成、StatCan 网站) • 在数据科学和人工智能方法的应用方面建立了丰富的专业知识 数据科学
StatCan website GenAI Chat Bot (IntelliStatCan) using Retrieval-Augmented Generation (RAG) Infrastructure • Back-end: Data Analytics as a Service Development Environment + Production • Front-end: Webapp hosted in Kubernetes AI Engine • MS Azure OpenAI Model API service (Model as a service): GPT 3.5 Turbo 16K vs. GPT-4 Omni • Azure AI Search (formerly Cognitive搜索)数据•生产:PDF中的18,000多个网站出版物,英语和法语•每天添加出版物•排除:表格数据和非文本媒体(图形,视频等)技术堆栈 - 请参阅附件A