2022-10-01 13:20:42

어떤 곳으로부터 제공받은 데이터를 분석할 때 모든 컬럼, 모든 행이 필요하진 않은 경우가 많습니다. 그렇다면, 먼저 불필요한 컬럼과 행을 먼저 제거해주는 것이 좋습니다. 우선 문제를 작고, 간단하게 만드는 것이 항상 문제 해결에 도움이 되기 때문입니다.  

 

drop 메소드로  행 또는 컬럼 삭제하기

판다스 데이터프레임에서 어떤 컬럼이나 행을 삭제할 때 사용되는 메소드는 drop() 입니다. 설명을 위해 우선 간단한 데이터프레임을 만들겠습니다.  

 

import pandas as pd

dict_data = {'col1':[1, 2, 3, 4, 5], 'col2':[11, 12, 13, 14, 15], 'col3':[101, 102, 103, 104, 105], 'col4':[5, 4, 3, 2, 1]}
df = pd.DataFrame(dict_data)
print(df)

 

 

컬럼 삭제하기

먼저 컬럼부터 삭제해보겠습니다. col2 컬럼과 col4 컬럼을 제거해보겠습니다. 컬럼을 제거할 때는 axis 매개변수의 인자로 1을 넣어줘야 한다는 것을 기억해주세요. 

 

df1 = df.drop(['col2', 'col4'], axis=1)
print(df1)

 

 

col2, col4 컬럼이 잘 삭제되었죠?

 

 

행 삭제하기

이번에는 행을 삭제해보겠습니다. 행 인덱스로 2번 행과 3번 행을 제거해보겠습니다. 행을 제거할 때는 axis 매개변수의 인자로 0을 넣어주면 됩니다. 

 

df2 = df.drop([2, 3], axis=0)
print(df2)

 

 

2, 3 행이 잘 제거되었죠?