深入了解数据结构和数据操作。了解监督和无监督学习模型,包括线性回归、逻辑回归、聚类、降维、K-NN 和管道。使用 SciPy 包及其子包(包括 Integrate、Optimize、Statistics、IO 和 Weave)执行科学和技术计算。使用 NumPy 和 Scikit-Learn 获得数学计算方面的专业知识。掌握推荐引擎和时间序列建模的概念。理解机器学习的原理、算法和应用。了解人工智能在不同领域的各种用例中的应用,如客户服务、金融服务、医疗保健等。实现经典的人工智能技术,如搜索算法、神经网络和跟踪。学习如何应用人工智能技术解决问题,并解释当前人工智能技术的局限性。设计和构建自己的智能代理,并应用它们创建实际的人工智能项目,包括游戏、机器学习模型、逻辑约束满足问题、基于知识的系统、概率模型、代理决策功能等。了解 TensorFlow 的概念、主要功能、操作和执行管道。掌握卷积神经网络、循环神经网络、训练深度网络和高级接口等高级主题。使用 Tableau 分析数据并熟练构建交互式仪表板 了解 Hadoop 生态系统的不同组件,并学习使用 HBase、其架构和数据存储,了解 HBase 和 RDBMS 之间的区别,并使用 Hive 和 Impala 进行分区。了解 MapReduce 及其特性,并学习如何使用 Sqoop 和 Flume 提取数据。使用最流行的库 Python 的自然语言工具包 (NLTK) 了解自然语言处理的基础知识。
主要关键词