Epistemology

The truth is out there.

pandas 를 이용한 csv 저장

2023-04-07

파이썬이 가지고 있는 기본 모듈로 csv파일을 저장할 수도 있지만, pandas을 이용하고 있는 경우에는 pandas을 사용하는 편이 훨씬 편합니다. 우선 pandas를 임포트하고 예제 자료를 만들어 봅시다.

1import pandas as pd
2data = {'ID': ['A1', 'A2', 'A3', 'A4', 'A5'],'X1': [1, 2, 3, 4, 5], 'X2': [3.0, 4.5, 3.2, 4.0, 3.5]}
3data_df = pd.DataFrame(data, index=['a', 'b', 'c', 'd', 'e'])

실행 결과는 다음과 같습니다.

 1>>> import pandas as pd
 2>>> data = {'ID': ['A1', 'A2', 'A3', 'A4', 'A5'],'X1': [1, 2, 3, 4, 5], 'X2': [3.0, 4.5, 3.2, 4.0, 3.5]}
 3>>> data
 4{'ID': ['A1', 'A2', 'A3', 'A4', 'A5'], 'X1': [1, 2, 3, 4, 5], 'X2': [3.0, 4.5, 3.2, 4.0, 3.5]}
 5>>> data_df = pd.DataFrame(data, index=['a', 'b', 'c', 'd', 'e'])
 6>>> data_df
 7   ID  X1   X2
 8a  A1   1  3.0
 9b  A2   2  4.5
10c  A3   3  3.2
11d  A4   4  4.0
12e  A5   5  3.5

그이렇게 만든 자료를 data_df.csv이라는 파일 이름으로 저장해봅시다. 여기서 index = False을 한 이유는 자료에 'a', 'b', 'c', 'd', 'e'라는 index를 저장하지 않으려고 이렇게 False로 설정했습니다. True라고 하면 index도 저장하게 됩니다.

1data_df.to_csv("data_df.csv", index = False)

그러면 실행하고 저장한 자료를 읽어서 확인해 봅시다.

1>>> data_df.to_csv("data_df.csv", index = False)
2>>> sample=pd.read_csv("data_df.csv")
3>>> sample
4   ID  X1   X2
50  A1   1  3.0
61  A2   2  4.5
72  A3   3  3.2
83  A4   4  4.0
94  A5   5  3.5

잘 저장된 것을 확인할 수 있습니다.