如何使用 Pandas Melt – pd.melt() 进行人工智能和机器学习

为什么重要:将宽数据框更改为长数据框使机器学习算法更容易高效运行。这可以使用 Pandas Melt 函数轻松完成。

来源:人工智能+

什么是 Pandas Melt?

什么是 Pandas Melt?

Pandas Melt 是目前用于重塑 Pandas 数据框的最有效和最灵活的函数。它将数据框从宽格式重塑为长格式,这使其在数据科学领域更有用。宽格式包含第一列中不重复的值。长格式包含第一列中重复的值。在代码格式中,可以使用“pd.melt ()”调用它。

代码的括号部分可以使用七个参数。这些是 df、id_vars、value_vars、var_name、value_name、col_level 和 ignore_index。唯一需要的参数是“df”,用于选择要对其执行操作的数据框。id_vars 用于命名要用作标识符参数的列。 Value_vars 用于命名将被融合的列。Var_name 用于命名输出中的变量列。Value_name 用于命名输出中的值列。当您需要多索引列时,使用 Col_level。最后,ignore_index 用于忽略或保留原始索引。

可以将其设置为 true 或 false。所有这些参数都可以一次使用,代码看起来像“pd.melt (df, id_vars = None, value_vars = None, var_name = ‘variable’, value_name = ‘value’, col_level = None, ignore_index = True)”。

另请阅读:Pandas 和大型 DataFrames:如何分块读取

另请阅读:Pandas 和大型 DataFrames:如何分块读取 另请阅读:Pandas 和大型 DataFrames:如何分块读取 Pandas 和大型 DataFrames:如何分块读取

长数据框与宽数据框

长数据框与宽数据框

宽数据框:

宽数据框:

人   年龄   体重   身高——–   —–    ——–     ——–鲍勃       32       168        180爱丽丝      24     150       175Steve     64      144       165

在此示例中,我们有四列。通过使用 melt 函数,我们可以有效地将这些数据转换为长数据框,如下所示:

import YouTube