R에서 `csv`형식 파일을 압축하기

사용하고 있는 csv형식 파일들을 갯수도 많고 용량도 크다면, 이것들을 보관하거나 전달하기 위해서는 압축하는 것이 편리하다. archive라는 패키지를 이용해서 여러개의 csv형식 파일들을 한 파일로 압축해보자. 이 패키지에 대한 세부적인 내용은 아래 링크를 참고하자.

우선 해당 패키지를 설치해보자.

install.packages("archive")

아래 명령어로 현재 압축하고자 하는 csv형식 파일이 있는지 살펴보자. 참고로 “data.zip"라는 파일명으로 압축하니, 이 폴더에 이 파일이 없어야 한다. 만약 있으면 에러가 날 확률이 많다.

dir()

이제 압축하고자 하는 csv형식 파일을 한 파일로 압축해보자. 확장자가 소문자로 .csv인 것만 선택하고 있다. 참고하자. 그러면 압축을 해보자.

library(archive)
save_files <- list.files(pattern="*.csv")
archive_write_files("data.zip", save_files)

만약 파일 1개를 압축한다고 한다면, 다음과 같이 하면 된다. “aaa.csv"은 자신이 압축하고자 하는 파일명을 넣으면 된다.

save_files <- list.files(pattern="*.csv")
archive_write_files("data.zip", "aaa.csv")

윗 코드를 실행하면 압축 진행 과정이 보일 것이다. 다 끝났다면, 아래 코드로 압축된 파일을 확인할 수 있다.

archive("data.zip")

이 글을 쓰기 위해서 테스트한 csv형식 파일들의 용량이 총 4.37GB이었는데 압축한 ‘data.zip’ 파일은 707.6MB이었다. 거의 1/6로 줄었다.