온라인에서 'Zip파일'을 R로 다운로드 시

2020. 1. 21. 00:05Data Science/Data Analytics

# 온라인 ZIP파일 수집할 때 쓰는 R 코드

 


# 파일을 다운로드할 폴더 생성.. 여기서는 데이터 폴더에 저장.

f(!file.exists("./data"))

{dir.create("./data")}

# Data 폴더에 dataset.zip 형태로 온라인 zip파일 저장
fileURL <- "https//주소/파일명.zip"
download.file(fileURL, destfile="./data/dataset.zip")

 

# 압축파일에서 zip파일 해제
unzip("./data/dataset.zip")  
list.dirs() # 압축 해제된 파일 중 폴더 보여주기

 

# 해당 폴더내의 폴더명으로 이동하기
setwd("./폴더명/")  
getwd()

 

# 해당 폴더내의 파일 확인하기

list.files() 

 

# 해당 폴더내의 폴더 확인하기

list.dirs()

 

#파일이 텍스트 파일일 경우 
textfile <- read.table("./파일명.txt")  

 

# 파일의 헤더 확인하기

head(textfile)

 

csv를 불러들였을때와 유사하게 'textfile'란 변수를 통해 데이터에 대한 구조를 파악해볼 수 있다.

- summary 함수

- str 함수

등의 함수를 활용하면 된다.

 

 

(참조: [Coursera]Data Science Specialization 내 Getting and Cleaning Data)