2022-04-27 21:43:21

오늘은 판다스 데이터 프레임의 특정 컬럼에서 고유값(선형대수학의 고유값 아님), 즉 유일한 값들을 리스트로 반환해주는 unique 메소드에 대해 알아보도록 하겠습니다. 

 

우선 예시를 위해 간단한 데이터프레임을 만들도록 하겠습니다. 8명의 국적과 연봉을 담은 데이터프레임입니다. 

 

import pandas as pd

dict_data = {'국적':['한국', '일본', '중국', '미국', '한국', '미국', '러시아', '한국'], '연봉':[4000, 6200, 2500, 8600, 5600, 6800, 3800, 5200]}
df = pd.DataFrame(dict_data)

print(df)

 

 

현재 보면, 한국, 일본, 중국 등 다양한 국적의 사람들이 있는데 어떤 국적의 사람들이 있는지를 확인하고 싶다면 어떻게 해야할까요? 이럴 때 사용하는 것이 바로 unique 메소드입니다.

 

print(df['국적'].unique())

 

위와 같이 코드를 작성해주면 국적 컬럼의 unique한 값들이 리스트의 형태로 반환됩니다. 

 

 

8명의 사람들은 이 5개 국적의 사람들이었군요.^^ 

 

 

관련 글

[1] [python] 리스트의 중복된 요소들 중에 고유한 요소들을 알고 싶다면, numpy.unique()