[pandas] Auto MPG 데이터셋 소개
데이터 분석에 예시로 자주 사용되는 데이터셋 중에는 Auto MPG라는 데이터셋이 있습니다. mpg는 miles per gallon의 약자로 연비를 나타냅니다. 자동차의 연비와 관련된 데이터를 담고 있는 데이터셋이라고 보시면 됩니다. 이 데이터셋은 https://archive.ics.uci.edu/ml/datasets/auto+mpg 에서 다운로드 받으실 수 있습니다.
Auto MPG 데이터셋 명세서
Auto MPG 데이터셋은 398개 샘플로 구성되어 있습니다. 처음 다섯 개 샘플만 보여드리면 다음과 같습니다.
18.0 8 307.0 130.0 3504. 12.0 70 1 "chevrolet chevelle malibu"
15.0 8 350.0 165.0 3693. 11.5 70 1 "buick skylark 320"
18.0 8 318.0 150.0 3436. 11.0 70 1 "plymouth satellite"
16.0 8 304.0 150.0 3433. 12.0 70 1 "amc rebel sst"
17.0 8 302.0 140.0 3449. 10.5 70 1 "ford torino"
보시다시피 각 샘플은 9개의 특성을 갖고 있습니다.
1) mpg: 연비
2) cylinders: 실린더 개수
3) displacement: 배기량
4) horsepower: 마력
5) weight: 무게
6) acceleration: 엔진이 초당 얻을 수 있는 가속력
7) model year: 출시 년도
8) origin: 제조 장소(1: 미국 USA, 2: 유럽 EU, 3: 일본 JPN)
9) car name: 자동차 이름
참고자료
[1] https://www.kaggle.com/code/xshaimaa/auto-mpg-dataset-eda?scriptVersionId=93821948