从受限的HPC系统中导出MLFlow实验

绕过直接通信的解决方法,从受限HPC系统中导出MLFLOW实验的邮政首先出现在数据科学方面。

来源:走向数据科学

计算(HPC)环境,尤其是在研究和教育机构中,将通信限制为出站TCP连接。在HPC Bash Shell上使用MLFlow跟踪URL运行简单的命令行PING或CURL可以成功。但是,在节点上运行作业时,通信会失败和时间。

ping curl

这使得无法在MLFlow上跟踪和管理实验。我面对这个问题,并建立了一种解决方法,该方法绕过直接通信。我们将重点关注:

    在运行机器学习实验时使用本地跟踪URL在端口上设置本地HPC MLFLOW服务器。将实验数据转到本地临时文件夹中。将实验数据从HPC上的本地temp文件夹转移到远程MLFLOW服务器。将实验数据从远程MLFLOOD服务器上。
  • 在带有本地目录存储的端口上设置本地HPC MLFLOW服务器。
  • 在运行机器学习实验时使用本地跟踪URL。
  • 机器学习
  • 将实验数据导出到本地临时文件夹。
  • 将实验数据从HPC上的本地温度文件夹转移到远程MLFLOW服务器。
  • mlflow
  • 将实验数据导入到远程MLFLOW服务器的数据库中。
  • 我使用JUJU部署了Charmed MLFlow(MLFLOW服务器,MySQL,Minio),并且整个内容托管在Microk8s localhost上。您可以在此处找到Canonical的安装指南。

    在这里

    先决条件

    确保您已加载了HPC上的Python并安装在MLFlow服务器上。对于整个文章,我假设您有Python 3.2。您可以进行相应的更改。

    python Python 3.2
    在HPC上:

    1)创建虚拟环境

    python3 -m venv mlflowsource mlflow/bin/activate

    2)安装mlflow

    pip安装mlflow
    在HPC和MLFlow服务器上:

    1)安装MLFlow-Export-Import

    pip安装git+https://github.com/mlflow/mlflow-export-import/#egg = mlflow-flow-export-import
    lsof -i:

    3)使用以下命令启动MLFlow服务器: