摘要 - 机器学习(ML)由于能够解决复杂问题的能力而在软件行业中越来越受欢迎。开发ML系统涉及更多的不确定性和风险,因为它需要确定商机并管理源代码,数据和训练有素的模型。我们的研究旨在确定行业中用于构建ML应用程序的现有实践,并理解采用ML系统的组织复杂性。我们进行了多局文献综述,然后对实践者和研究人员讨论的ML系统生命周期的实践进行了分类。这项研究的核心来自灰色文献中的41个选定职位和37个精选的科学论文。将初始编码和重点编码技术应用于这些数据中,我们将91个实践映射为与设计,开发,测试和部署ML系统有关的六个核心类别。结果,包括实践分类法,为组织提供了宝贵的见解,以确定其当前ML流程和实践中的差距以及改进,优化和管理ML系统的路线图。
主要关键词