2022-07-19 20:24:23

판다스 데이터프레임의 value_counts() 메소드는 컬럼 내 고유값(unique value)의 개수를 알려줍니다. 예를 들어 다음과 같은 데이터프레임이 있다고 가정하겠습니다. 

 

 

저는 차 브랜드별로 몇 개의 데이터가 있는지를 value_counts() 메소드를 통해서 확인해보겠습니다. 즉, 현대 차는 몇 대가 있고, 기아 차는 몇 대가 있고, 벤츠는 몇 대가 있는지를 알고 싶은 것입니다. 

 

value_counts() 메소드 사용법

고유값의 개수를 구할 컬럼을 선택한 다음에 value_counts() 메소드를 사용하시면 됩니다. 

 

df['컬럼명'].value_counts()

 

df['브랜드'].value_counts()와 같이 코딩해주면, 각 브랜드별 차량 대수를 한 번에 파악할 수 있습니다. 

 

 

참고로 전체 코드는 다음과 같습니다.

 

import pandas as pd

data = {'브랜드':['현대', '기아', '아우디', '현대', '기아', '기아', '현대', '볼보', '볼보', '기아', '현대', '현대', '포르쉐', 'BMW', '벤츠', '벤츠', '볼보'],
        '가격(천만원)':[3.2, 2.1, 5.2, 2.9, 1.9, 2.5, 1.4, 6.8, 7.2, 3.5, 4.1, 3.3, 8.4, 9.2, 8.1, 7.2, 9.2]}

df = pd.DataFrame(data)
print(df)

print(df['브랜드'].value_counts())

 

관련 글

- [python+pandas] 판드스 데이터 프레임에서 컬럼의 고유값을 알고 싶으면, unique 메소드