Merge函数用法Python
Merge函数是Python中非常常用的函数之一,它可以将两个或多个数据框按照一定的条件合并成一个新的数据框。在数据分析和处理中,经常需要将不同数据源的数据进行整合,此时就可以使用merge函数来完成。
_x000D_Merge函数的基本用法如下:
_x000D_`python
_x000D_pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None,
_x000D_left_index=False, right_index=False, sort=True, suffixes=('_x', '_y'),
_x000D_copy=True, indicator=False, validate=None)
_x000D_ _x000D_其中,left和right表示需要合并的两个数据框,how表示合并方式,on表示合并的列名,left_on和right_on表示左右数据框需要合并的列名,left_index和right_index表示是否以索引作为合并列,sort表示是否对合并后的数据框进行排序,suffixes表示重名列的后缀,copy表示是否复制数据框,indicator表示是否在合并后的数据框中添加一列指示合并方式,validate表示检查合并的数据框是否合法。
_x000D_Merge函数的常用合并方式包括:
_x000D_- inner:内连接,只保留两个数据框中都存在的行;
_x000D_- outer:外连接,保留两个数据框中所有的行,缺失值用NaN填充;
_x000D_- left:左连接,保留左侧数据框的所有行,右侧数据框中没有的行用NaN填充;
_x000D_- right:右连接,保留右侧数据框的所有行,左侧数据框中没有的行用NaN填充。
_x000D_Merge函数的应用场景非常广泛,比如:
_x000D_- 将两个表格按照某一列合并;
_x000D_- 将两个表格按照多列合并;
_x000D_- 将两个表格按照索引合并;
_x000D_- 将两个表格按照不同的列名合并。
_x000D_下面我们来看几个具体的例子。
_x000D_案例一:按照一列合并
_x000D_假设我们有两个数据框df1和df2,需要按照列名为key的列来合并,代码如下:
_x000D_`python
_x000D_import pandas as pd
_x000D_df1 = pd.DataFrame({'key': ['A', 'B', 'C', 'D'], 'value': [1, 2, 3, 4]})
_x000D_df2 = pd.DataFrame({'key': ['B', 'D', 'E', 'F'], 'value': [5, 6, 7, 8]})
_x000D_result = pd.merge(df1, df2, on='key')
_x000D_print(result)
_x000D_ _x000D_输出结果为:
_x000D_ _x000D_key value_x value_y
_x000D_0 B 2 5
_x000D_1 D 4 6
_x000D_ _x000D_可以看到,合并后的结果只包含df1和df2中key列相同的行。
_x000D_案例二:按照多列合并
_x000D_假设我们有两个数据框df1和df2,需要按照列名为key1和key2的列来合并,代码如下:
_x000D_`python
_x000D_import pandas as pd
_x000D_df1 = pd.DataFrame({'key1': ['A', 'B', 'C', 'D'], 'key2': ['X', 'Y', 'Z', 'W'], 'value': [1, 2, 3, 4]})
_x000D_df2 = pd.DataFrame({'key1': ['B', 'D', 'E', 'F'], 'key2': ['Y', 'W', 'X', 'Z'], 'value': [5, 6, 7, 8]})
_x000D_result = pd.merge(df1, df2, on=['key1', 'key2'])
_x000D_print(result)
_x000D_ _x000D_输出结果为:
_x000D_ _x000D_key1 key2 value_x value_y
_x000D_0 D W 4 6
_x000D_ _x000D_可以看到,合并后的结果只包含df1和df2中key1和key2列都相同的行。
_x000D_案例三:按照索引合并
_x000D_假设我们有两个数据框df1和df2,需要按照它们的索引来合并,代码如下:
_x000D_`python
_x000D_import pandas as pd
_x000D_df1 = pd.DataFrame({'value': [1, 2, 3, 4]}, index=['A', 'B', 'C', 'D'])
_x000D_df2 = pd.DataFrame({'value': [5, 6, 7, 8]}, index=['B', 'D', 'E', 'F'])
_x000D_result = pd.merge(df1, df2, left_index=True, right_index=True)
_x000D_print(result)
_x000D_ _x000D_输出结果为:
_x000D_ _x000D_value_x value_y
_x000D_B 2 5
_x000D_D 4 6
_x000D_ _x000D_可以看到,合并后的结果只包含df1和df2中索引相同的行。
_x000D_案例四:按照不同的列名合并
_x000D_假设我们有两个数据框df1和df2,需要按照df1中的列名为key1,df2中的列名为key2来合并,代码如下:
_x000D_`python
_x000D_import pandas as pd
_x000D_df1 = pd.DataFrame({'key1': ['A', 'B', 'C', 'D'], 'value': [1, 2, 3, 4]})
_x000D_df2 = pd.DataFrame({'key2': ['B', 'D', 'E', 'F'], 'value': [5, 6, 7, 8]})
_x000D_result = pd.merge(df1, df2, left_on='key1', right_on='key2')
_x000D_print(result)
_x000D_ _x000D_输出结果为:
_x000D_ _x000D_key1 value_x key2 value_y
_x000D_0 B 2 B 5
_x000D_1 D 4 D 6
_x000D_ _x000D_可以看到,合并后的结果包含df1和df2中key1和key2列相同的行,并且将它们合并在一起。
_x000D_问答
_x000D_1.什么是merge函数?
_x000D_Merge函数是Python中非常常用的函数之一,它可以将两个或多个数据框按照一定的条件合并成一个新的数据框。
_x000D_2.merge函数的常用合并方式有哪些?
_x000D_Merge函数的常用合并方式包括:inner、outer、left和right。
_x000D_3.merge函数的应用场景有哪些?
_x000D_Merge函数的应用场景非常广泛,比如将两个表格按照某一列合并、将两个表格按照多列合并、将两个表格按照索引合并、将两个表格按照不同的列名合并等。
_x000D_4.如何按照一列合并数据框?
_x000D_可以使用merge函数的on参数来指定需要合并的列名。
_x000D_5.如何按照多列合并数据框?
_x000D_可以使用merge函数的on参数来指定需要合并的列名列表。
_x000D_6.如何按照索引合并数据框?
_x000D_可以使用merge函数的left_index和right_index参数来指定是否以索引作为合并列。
_x000D_7.如何按照不同的列名合并数据框?
_x000D_可以使用merge函数的left_on和right_on参数来指定左右数据框需要合并的列名。
_x000D_