2022-05-30 20:02:35

튜플의 리스트를 데이터프레임으로 간단히 변환할 수 있습니다. 다음과 같이 튜플들을 원소로 하는 리스트가 있다고 가정해보겠습니다. 

 

 

대괄호 안에 소괄호로 묶인 부분, 즉 (54, 100, 483, 668)과 같은 것들이 하나의 튜플입니다. 파이썬에서 대괄호로 묶인 것은 리스트를 의미하죠. 

 

[원소, 원소, 원소, ...]  # 리스트

{key1:value1, key2:value2, ...}  # 딕셔너리

(원소, 원소, 원소, ...)  # 튜플

 

각 튜플은 4개의 정수를 원소로 삼고 있고, 그 튜플들은 리스트의 원소가 되는 상황입니다. 이러한 튜플들로 구성된 리스트는 판다스의 DataFrame() 메소드를 활용하면 데이터프레임으로 쉽게 변환할 수 있습니다. 

 

df = pd.DataFrame(data, columns=['col1', 'col2', 'col3', 'col4'])

 

df를 print 해보면 다음과 같이 데이터프레임으로 잘 변환된 것을 확인할 수 있습니다.

 

 

2차원 구조의 데이터는 데이터프레임으로 바꾸고 나면 통계 분석이 용이해지기 때문에 통계 분석이 필요하다면 데이터프레임으로 변환하는 것이 좋습니다. 

 

참고자료

[1] https://www.geeksforgeeks.org/creating-a-pandas-dataframe-using-list-of-tuples/, 튜플들의 리스트를 판다스 데이터 프레임으로 만드는 법