어떤 곳으로부터 제공받은 데이터를 분석할 때 모든 컬럼, 모든 행이 필요하진 않은 경우가 많습니다. 그렇다면, 먼저 불필요한 컬럼과 행을 먼저 제거해주는 것이 좋습니다. 우선 문제를 작고, 간단하게 만드는 것이 항상 문제 해결에 도움이 되기 때문입니다.
drop 메소드로 행 또는 컬럼 삭제하기
판다스 데이터프레임에서 어떤 컬럼이나 행을 삭제할 때 사용되는 메소드는 drop() 입니다. 설명을 위해 우선 간단한 데이터프레임을 만들겠습니다.
import pandas as pd
dict_data = {'col1':[1, 2, 3, 4, 5], 'col2':[11, 12, 13, 14, 15], 'col3':[101, 102, 103, 104, 105], 'col4':[5, 4, 3, 2, 1]}
df = pd.DataFrame(dict_data)
print(df)
컬럼 삭제하기
먼저 컬럼부터 삭제해보겠습니다. col2 컬럼과 col4 컬럼을 제거해보겠습니다. 컬럼을 제거할 때는 axis 매개변수의 인자로 1을 넣어줘야 한다는 것을 기억해주세요.
df1 = df.drop(['col2', 'col4'], axis=1)
print(df1)
col2, col4 컬럼이 잘 삭제되었죠?
행 삭제하기
이번에는 행을 삭제해보겠습니다. 행 인덱스로 2번 행과 3번 행을 제거해보겠습니다. 행을 제거할 때는 axis 매개변수의 인자로 0을 넣어주면 됩니다.
df2 = df.drop([2, 3], axis=0)
print(df2)
2, 3 행이 잘 제거되었죠?
'Dev > python' 카테고리의 다른 글
[python] scikit-learn의 confusion matrix 해석하기 (0) | 2022.10.08 |
---|---|
[python] 딕셔너리에서 value가 가장 큰 key 알아내는 방법 (0) | 2022.10.07 |
[python] 10진수를 2진수, 8진수, 16진수로 변환하는 방법 (4) | 2022.10.03 |
[pandas] 컬럼 값이 특정 조건에 부합하는 행들의 특정 컬럼 값 수정하기 (0) | 2022.10.02 |
[python] 010-1234-5678과 같은 전화번호 문자열에서 하이픈(-) 빼기 (0) | 2022.09.21 |
[python] 클래스(class), 객체(object), 인스턴스(instance) 용어 정리 (0) | 2022.09.21 |
[python] SQLAlchemy로 데이터 조회하는 방법, fetchall() (0) | 2022.09.07 |
[python] 딕셔너리 키 리스트, 값 리스트 생성하기 (7) | 2022.09.06 |