从受限的HPC系统中导出MLFlow实验
绕过直接通信的解决方法,从受限HPC系统中导出MLFLOW实验的邮政首先出现在数据科学方面。
来源:走向数据科学计算(HPC)环境,尤其是在研究和教育机构中,将通信限制为出站TCP连接。在HPC Bash Shell上使用MLFlow跟踪URL运行简单的命令行PING或CURL可以成功。但是,在节点上运行作业时,通信会失败和时间。
ping curl这使得无法在MLFlow上跟踪和管理实验。我面对这个问题,并建立了一种解决方法,该方法绕过直接通信。我们将重点关注:
- 在运行机器学习实验时使用本地跟踪URL在端口上设置本地HPC MLFLOW服务器。将实验数据转到本地临时文件夹中。将实验数据从HPC上的本地temp文件夹转移到远程MLFLOW服务器。将实验数据从远程MLFLOOD服务器上。
我使用JUJU部署了Charmed MLFlow(MLFLOW服务器,MySQL,Minio),并且整个内容托管在Microk8s localhost上。您可以在此处找到Canonical的安装指南。
在这里先决条件
确保您已加载了HPC上的Python并安装在MLFlow服务器上。对于整个文章,我假设您有Python 3.2。您可以进行相应的更改。
python Python 3.2在HPC上:
1)创建虚拟环境
python3 -m venv mlflowsource mlflow/bin/activate
2)安装mlflow
pip安装mlflow
在HPC和MLFlow服务器上:
1)安装MLFlow-Export-Import
pip安装git+https://github.com/mlflow/mlflow-export-import/#egg = mlflow-flow-export-import
lsof -i:
3)使用以下命令启动MLFlow服务器: