目录1环境3 2目标受众3培训目标3 4语言4 6实施位置4 7能力概况4 8课程概述5 10课程描述5 11介绍AI 6 11.1 AI基本技术简介6 11.2基本神经网络6 11.3卷积神经网络网络(CNN)6 11.4循环网络6 11.5 NLP的变压器体系结构6 11.6实用介绍检索增强发电(RAG)6 11.7特殊变压器在复杂条件下预测6 11.8最终项目深度学习7 11.9深度强化学习7.10值7.10 Value 7.10 Based methods-Introduction to Classic Deep Q-Learning 7 11.11 Value Based Methods-Deep Q-Learning extensions I 7 11.12 Value Based methods-Deep Q-Learning extensions II 7 11.13 Introduction to Policy-Based methods 7 11.14 Policy Gradient-Reinforce 7.15 Policy Gradient-优势演员评论家(A2C)用于离散和恒定动作8 11.16根据今天的最佳政策梯度方法,根据今天的政策优化(PPO)8 11.17黑匣子优化8 11.18最终项目加固学习8 11.19 Workshop-ai贸易与深度强化学习9 13 13 13 13 13 13 13 13 13能力证明9 14组织10
主要关键词