如何使用 Pandas Melt – pd.melt() 进行人工智能和机器学习
为什么重要:将宽数据框更改为长数据框使机器学习算法更容易高效运行。这可以使用 Pandas Melt 函数轻松完成。
来源:人工智能+什么是 Pandas Melt?
什么是 Pandas Melt?Pandas Melt 是目前用于重塑 Pandas 数据框的最有效和最灵活的函数。它将数据框从宽格式重塑为长格式,这使其在数据科学领域更有用。宽格式包含第一列中不重复的值。长格式包含第一列中重复的值。在代码格式中,可以使用“pd.melt ()”调用它。
代码的括号部分可以使用七个参数。这些是 df、id_vars、value_vars、var_name、value_name、col_level 和 ignore_index。唯一需要的参数是“df”,用于选择要对其执行操作的数据框。id_vars 用于命名要用作标识符参数的列。 Value_vars 用于命名将被融合的列。Var_name 用于命名输出中的变量列。Value_name 用于命名输出中的值列。当您需要多索引列时,使用 Col_level。最后,ignore_index 用于忽略或保留原始索引。
可以将其设置为 true 或 false。所有这些参数都可以一次使用,代码看起来像“pd.melt (df, id_vars = None, value_vars = None, var_name = ‘variable’, value_name = ‘value’, col_level = None, ignore_index = True)”。
另请阅读:Pandas 和大型 DataFrames:如何分块读取
另请阅读:Pandas 和大型 DataFrames:如何分块读取 另请阅读:Pandas 和大型 DataFrames:如何分块读取 Pandas 和大型 DataFrames:如何分块读取长数据框与宽数据框
长数据框与宽数据框宽数据框:
宽数据框:人 年龄 体重 身高——– —– ——– ——–鲍勃 32 168 180爱丽丝 24 150 175Steve 64 144 165
在此示例中,我们有四列。通过使用 melt 函数,我们可以有效地将这些数据转换为长数据框,如下所示:
import YouTube