데이터 분석에 예시로 자주 사용되는 데이터셋 중에는 Auto MPG라는 데이터셋이 있습니다. mpg는 miles per gallon의 약자로 연비를 나타냅니다. 자동차의 연비와 관련된 데이터를 담고 있는 데이터셋이라고 보시면 됩니다. 이 데이터셋은 https://archive.ics.uci.edu/ml/datasets/auto+mpg 에서 다운로드 받으실 수 있습니다.
Auto MPG 데이터셋 명세서
Auto MPG 데이터셋은 398개 샘플로 구성되어 있습니다. 처음 다섯 개 샘플만 보여드리면 다음과 같습니다.
18.0 8 307.0 130.0 3504. 12.0 70 1 "chevrolet chevelle malibu"
15.0 8 350.0 165.0 3693. 11.5 70 1 "buick skylark 320"
18.0 8 318.0 150.0 3436. 11.0 70 1 "plymouth satellite"
16.0 8 304.0 150.0 3433. 12.0 70 1 "amc rebel sst"
17.0 8 302.0 140.0 3449. 10.5 70 1 "ford torino"
보시다시피 각 샘플은 9개의 특성을 갖고 있습니다.
1) mpg: 연비
2) cylinders: 실린더 개수
3) displacement: 배기량
4) horsepower: 마력
5) weight: 무게
6) acceleration: 엔진이 초당 얻을 수 있는 가속력
7) model year: 출시 년도
8) origin: 제조 장소(1: 미국 USA, 2: 유럽 EU, 3: 일본 JPN)
9) car name: 자동차 이름
참고자료
[1] https://www.kaggle.com/code/xshaimaa/auto-mpg-dataset-eda?scriptVersionId=93821948
'Dev > python' 카테고리의 다른 글
[python, opencv] 웹캠 영상 출력하는 방법 (1) | 2022.07.01 |
---|---|
[pandas] 데이터프레임 컬럼 순서 변경 (0) | 2022.07.01 |
[selenium] 셀레니움 크롤링 준비, 크롬 드라이버 다운로드 (0) | 2022.07.01 |
[python] datetime 모듈 strftime 메소드, 포맷(format) 코드 정리 (0) | 2022.06.30 |
[pandas] 이전 데이터와 비교할 때 유용한 데이터프레임 shift() 메소드 (1) | 2022.06.29 |
[pandas, matplotlib] EPL 빅6 팀의 2010년 이후 순위 비교 그래프 그리기(선 그래프, 막대 그래프) (0) | 2022.06.28 |
[pandas] 데이터프레임 컬럼명 또는 행 인덱스 바꾸는 방법 (0) | 2022.06.28 |
[matplotlib] 그래프에 화살표 및 텍스트 삽입하기 (0) | 2022.06.27 |