摘要本文研究了机器学习(ML)模型以预测数据备份需求并优化任何规模IT环境中的备份解决方案。通过利用ML驱动的预测分析,用户和公司可以提高其数据备份流程的效率和可靠性,提高性能,降低成本并最小化数据丢失。本文描述了一种利用RandomForestRegressor模型来学习系统中现有文件属性的解决方案,以预测处理文件备份的优先级,并通过跳过额外的文件避免数据冗余。它将允许加快备份过程并减少备份的大小。通过对文件和文件系统行为的元数据进行足够的培训,该解决方案将有助于使备份软件对错误,智能和动态性更具抵抗力。
主要关键词