728x90

2022/05 12

[MS Excel 2010] 중복된 데이터에서 고유값을 남겨 놓고 각 그룹의 데이터 개수, 평균, 최대값, 최소값, 중앙값, 표준편차 구하기

Sheet1에 다음과 같이 우리 동네에 있는 자동차 브랜드와 가격(천만원) 정보가 담긴 엑셀 파일이 있다고 가정해보겠습니다. 저는 Sheet2에서 각 브랜드별 차량 개수, 평균 금액, 금액의 표준편차, 최대값, 최소값, 중앙값을 일목요연하게 보고 싶습니다. 1. 우선 브랜드에 해당하는 영역을 복사해서 Sheet2에 적절한 위치에 붙여넣어줍니다. 2. Sheet2에서 열 A를 선택한 후에 데이터 탭에서 "중복된 항목 제거"를 클릭합니다. 그 다음에 열 A가 잘 체크되어 있는지 확인한 후에 확인 버튼을 클릭합니다. 고유값만 남은 것을 확인하실 수 있습니다. 3. COUNTIF 함수를 사용하여 Sheet1에서 브랜드가 현대로 되어 있는 행의 개수를 구합니다. Sheet1에서 A열에서 Sheet2의 A2 셀(현..

[python+pandas] 튜플의 리스트를 데이터프레임으로 만들기

튜플의 리스트를 데이터프레임으로 간단히 변환할 수 있습니다. 다음과 같이 튜플들을 원소로 하는 리스트가 있다고 가정해보겠습니다. 대괄호 안에 소괄호로 묶인 부분, 즉 (54, 100, 483, 668)과 같은 것들이 하나의 튜플입니다. 파이썬에서 대괄호로 묶인 것은 리스트를 의미하죠. [원소, 원소, 원소, ...] -> 리스트 {key1:value1, key2:value2, ...} -> 딕셔너리 (원소, 원소, 원소, ...) -> 튜플 각 튜플은 4개의 정수를 원소로 삼고 있고, 그 튜플들은 리스트의 원소가 되는 상황입니다. 이러한 튜플들로 구성된 리스트는 판다스의 DataFrame() 메소드를 활용하면 데이터프레임으로 쉽게 변환할 수 있습니다. df = pd.DataFrame(data, colum..

[python+pandas] 데이터프레임의 기술 통계 정보(평균, 표준편차, 최대값, 최소값, 분위수)를 요약해주는 describe() 메소드

관련 글 기술통계와 추론통계 자료를 대표하는 숫자, 대표값: 평균, 중앙값, 최빈값 오늘은 pandas 데이터프레임의 기술 통계 정보를 요약해주는 describe() 메소드에 대해 소개드리도록 하겠습니다. 기술통계란 수집한 데이터의 특성을 표현하고 요약해주는 통계 기법을 의미합니다. 평균, 분산, 표준편차, 중앙값 등이 기술통계에 속합니다. 데이터프레임의 describe() 메소드를 활용하면 평균, 표준편차, 최대값, 최소값 등의 기술통계 정보를 한번에 요약해서 보여줍니다. seaborn 패키지는 테스트를 위한 여러 데이터셋을 제공하는데 그 중 하나인 car_crashes 데이터셋을 오늘 예제에 활용하도록 하겠습니다. car_crashes 데이터셋은 자동차 사고와 관련된 데이터를 담고 있습니다. 총 51..

[워드] 마지막 빈 페이지 삭제하기 (구역 나누기 되어 있을 경우)

MS 워드를 사용하다보면 간혹 마지막 페이지에 빈 페이지들이 추가되어 있고 삭제가 잘 되지 않을 때가 있습니다. 이 경우 구역 나누기가 되어 있을 가능성을 의심해봐야 합니다. 먼저 홈 탭에서 '편집 기호 표시/숨기기'를 클릭해주세요. 그러면 아래와 같이 빈 페이지들에 구역 나누기(다음 페이지부터) 이런 것들이 들어가 있을 것입니다. 마우스 커서를 =========구역 나누기(다음 페이지부터)======== 앞쪽에 두시고 DELETE 키를 눌러주시면 삭제되면서 빈 페이지들이 제거 될 것입니다. 이제 답답함이 해소되셨나요?ㅎㅎ

PC/컴퓨터, 인터넷 2022.05.27 (5)

[세이버메트릭스] MLB 30개 팀의 한글명, 영어명, 팀ID 정리(2022년 기준)

2022년 현재 MLB는 30개 팀으로 구성되어 있다. 30개 팀 중 15개 팀은 아메리칸리그(AL)에 소속되어 있고, 나머지 15개 팀은 내셔널리그(NL)에 소속되어 있다. 그리고 아메리칸 리그와 내셔널 리그는 각각 서부(W), 중부(C), 동부(E)로 나뉘어져 있다. 서부지구, 중부지구, 동부지구는 각각 5개 팀으로 구성되어 있다. MLB 같은 경우는 팀 이름이 길기 때문에 어떤 팀을 부를 때 보통 세 글자로 이뤄진 team ID로 줄여서 지칭하곤 한다. 특히 MLB 기록 관련 DB에는 팀 이름 대신 team ID가 많이 사용된다. 오늘은 2022년 기준 MLB 팀 이름과 team ID에 대해 정리해보려고 한다. team ID는 사이트나 DB에 따라 조금씩 다른데, 여기서는 레먼데이터베이스에서 사용되..

[python+pandas] 여러 데이터프레임 하나의 엑셀 파일 내 각각 다른 시트에 저장하기

2개의 데이터프레임이 있습니다. 이 데이터프레임들을 하나의 엑셀 파일(.xlsx)에 저장하려고 하는데, 하나는 sheet1에 담고 싶고, 하나는 sheet2에 담고 싶습니다. 이런 경우에는 pandas의 ExcelWriter 함수를 활용하면 됩니다. 바로 간단한 예제 코드로 어떻게 하면 되는지 살펴보시죠. 2022년 5월 15일 밤 11시 기준 프리미어리그 4위까지 랭킹과 라리가 4위까지의 랭킹을 각각 데이터프레임으로 만든 후에 엑셀 파일로 변환하는 코드입니다. 프리미어리그 순위는 sheet1에 저장되게 했고, 라리가 순위는 sheet2에 저장되게 했습니다. import pandas as pd data1_dict = {'이름': ['맨체스터 시티 FC', '리버풀 FC', '첼시 FC', '토트넘 홋스퍼..

코딩/pandas, matplotlib 2022.05.15 (4)

[python] seaborn 라이브러리가 제공하는 타이타닉 데이터셋 설명

seaborn 라이브러리에는 여러 데이터셋이 내장되어 있습니다. 'anagrams', 'anscombe', 'attention', 'brain_networks', 'car_crashes', 'diamonds', 'dots', 'exercise', 'flights', 'fmri', 'gammas', 'geyser', 'iris', 'mpg', 'penguins', 'planets', 'taxis', 'tips', 'titanic' 이 중 우리에게 친숙한 타이타닉 데이터셋은 어떤 컬럼들로 구성되어 있는지 살펴보도록 하겠습니다. # -*- coding: utf-8 -*- import seaborn as sns titanic = sns.load_dataset('titanic') print(titanic.head..

코딩/python 2022.05.15

[vscode] 어떤 행을 복사해서 다른 곳에 붙여 넣고 싶을 때 빠르게 하는 방법

우리가 일반적으로 어떤 내용을 복사해서 붙여넣을 때는 복사하고자 하는 부분을 드래그해서 ctrl + c 한 다음에 원하는 위치에 커서를 놓고 ctrl + v를 합니다. vscode에서는 이 과정을 좀 더 간단하게 할 수 있습니다. 복사하고자 하는 행에 가서 드래그할 필요없이 ctrl + c 한 다음에 원하는 위치에 가서 ctrl + v를 해주면 붙여넣기가 됩니다. 행 전체를 드래그 하지 않고 그냥 커서만 갖다 놓고 ctrl + c만 했는데도 그 행 전체가 복사된 것입니다. 이 기능만 잘 활용해도 코딩 시간을 좀 더 단축시킬 수 있습니다.

코딩/vscode 2022.05.14

[세이버메트릭스] 투수가 승, 패, 세이브, 홀드를 기록하게 되는 조건

**작년(2021년)에 이어 올해(2022년)도 한국대학생스포츠협의회(KUSF)에서 주최하는 스포츠 데이터 분석 교육 프로그램에서 강사로 참여하게 되었습니다. 그래서 기존에 세이버메트릭스 관련해서 작성했던 글들을 리뉴얼하는 작업을 하고 있습니다. 야구 경기를 꽤 오래 시청해온 사람들도 정확히 알지 못하는 규정들이 꽤 많이 있습니다. 저는 투수가 승, 패, 세이브, 홀드를 기록하게 되는 조건도 그 중 하나라고 생각합니다. 도대체 어떤 요건을 충족해야만 승리투수가 되고, 세이브, 홀드를 기록할 수 있는지 지금부터 알아가보도록 하겠습니다. 승리투수가 되려면 선발투수의 경우 승리투수가 되려면 아래 3가지 조건을 모두 충족해야 합니다. 1) 5이닝 이상 투구해야 합니다. 2) 교체되는 시점에 팀이 이기고 있어야 ..

[구름IDE] 컨테이너 실행했는데 하단에 터미널이 안 보이는 경우

클라우드 통합개발환경 중에 구름IDE가 있습니다. 인기 개발 유튜버 조코딩 님을 통해 구름IDE에 대해 처음 접한 이후로 종종 사용하고 있습니다. 무료 서비스도 제공하기 때문에 강의를 진행할 때 리눅스 개발환경이 필요할 때 학생들에게 사용을 권하곤 합니다. 오늘은 구름IDE에서 컨테이너를 실행했는데 하단에 터미널이 안 보이는 경우 대처 방법에 대해 알려드리도록 하겠습니다. 컨테이너를 실행했는데 위와 같이 터미널 창이 없는 경우라면, 상단 메뉴바에서 '창'을 클릭한 후 화면 구성을 클릭한 후 '하단 영역 보기'를 클릭하시면 됩니다. 창 - 화면 구성 - 하단 영역 보기 그러면 아래와 같이 다시 터미널이 보입니다. 간단하죠?

PC/리눅스 2022.05.06