pandas 를 이용한 csv 저장
2023-04-07
파이썬이 가지고 있는 기본 모듈로 csv파일을 저장할 수도 있지만, pandas을 이용하고 있는 경우에는 pandas을 사용하는 편이 훨씬 편합니다. 우선 pandas를 임포트하고 예제 자료를 만들어 봅시다.
1import pandas as pd
2data = {'ID': ['A1', 'A2', 'A3', 'A4', 'A5'],'X1': [1, 2, 3, 4, 5], 'X2': [3.0, 4.5, 3.2, 4.0, 3.5]}
3data_df = pd.DataFrame(data, index=['a', 'b', 'c', 'd', 'e'])
실행 결과는 다음과 같습니다.
1>>> import pandas as pd
2>>> data = {'ID': ['A1', 'A2', 'A3', 'A4', 'A5'],'X1': [1, 2, 3, 4, 5], 'X2': [3.0, 4.5, 3.2, 4.0, 3.5]}
3>>> data
4{'ID': ['A1', 'A2', 'A3', 'A4', 'A5'], 'X1': [1, 2, 3, 4, 5], 'X2': [3.0, 4.5, 3.2, 4.0, 3.5]}
5>>> data_df = pd.DataFrame(data, index=['a', 'b', 'c', 'd', 'e'])
6>>> data_df
7 ID X1 X2
8a A1 1 3.0
9b A2 2 4.5
10c A3 3 3.2
11d A4 4 4.0
12e A5 5 3.5
그이렇게 만든 자료를 data_df.csv이라는 파일 이름으로 저장해봅시다. 여기서 index = False을 한 이유는 자료에 'a', 'b', 'c', 'd', 'e'라는 index를 저장하지 않으려고 이렇게 False로 설정했습니다. True라고 하면 index도 저장하게 됩니다.
1data_df.to_csv("data_df.csv", index = False)
그러면 실행하고 저장한 자료를 읽어서 확인해 봅시다.
1>>> data_df.to_csv("data_df.csv", index = False)
2>>> sample=pd.read_csv("data_df.csv")
3>>> sample
4 ID X1 X2
50 A1 1 3.0
61 A2 2 4.5
72 A3 3 3.2
83 A4 4 4.0
94 A5 5 3.5
잘 저장된 것을 확인할 수 있습니다.