Development Tip

R을 사용하여 gz 파일 압축 해제

yourdevel 2020. 12. 10. 21:23
반응형

R을 사용하여 gz 파일 압축 해제


나는 ?unzip과거에 R을 사용하여 압축 된 파일의 내용을 얻기 위해 사용했다. 이번에는 여기 에서 찾을 수있는 .gz 파일에서 파일을 추출하는 데 어려움을 겪고있다 .

나는 시도 ?gzfile하고 ?gzcon있지만 작업에 얻을 수 없었다. 당신이 제공 할 수있는 어떤 도움이라도 대단히 감사 할 것입니다.


정말로 파일의 압축을 풀고 싶다면 gzip을untar 지원 하는 함수를 사용하십시오 . 예 :

untar('chadwick-0.5.3.tar.gz')

다음은 용도 gzfile()gzcon()용도를 설명하는 데 도움이 될 수있는 실제 예입니다

foo <- data.frame(a=LETTERS[1:3], b=rnorm(3))
foo
#  a        b
#1 A 0.586882
#2 B 0.218608
#3 C 1.290776
write.table(foo, file="/tmp/foo.csv")
system("gzip /tmp/foo.csv")             # being very explicit

이제 파일이 작성되었으므로를 암시 적으로 사용하는 대신 다음을 file()사용하십시오 gzfile().

read.table(gzfile("/tmp/foo.csv.gz"))   
#  a        b
#1 A 0.586882
#2 B 0.218608
#3 C 1.290776

지적한 파일은 압축 된 tar 아카이브이며 내가 아는 한 R 자체에는 tar 아카이브에 대한 인터페이스가 없습니다. 예를 들어 R 패키지 및 R 소스와 같이 소스 코드를 배포하는 데 일반적으로 사용됩니다.


R에서 파일을 un-gz하려면 다음을 수행하십시오.

library(R.utils)
gunzip("file.gz", remove=FALSE)

또는

gunzip("file.gz")

그러나 출력 파일이 완전히 생성되고 닫힌 후 입력 파일이 제거되는 기본 (remove = TRUE) 동작을 얻습니다.


http://blog.revolutionanalytics.com/2009/12/r-tip-save-time-and-space-by-compressing-data-files.html

R은 최신 버전 (2.10)에서 특정 종류의 압축 파일에 대해 투명한 압축 해제를 추가했습니다. bzip2, xvz 또는 gzip으로 압축 된 파일이 있으면 일반 텍스트 파일 인 것처럼 R로 읽을 수 있습니다. 적절한 파일 이름 확장자가 있어야합니다.

명령 ...

myData <- read.table('myFile.gz')  

#gzip 압축 파일의 확장자는 "gz"입니다.

'myFile.gz'가 원시 텍스트 파일 인 것처럼 작동합니다.

참고 URL : https://stackoverflow.com/questions/5764499/decompress-gz-file-using-r

반응형