Data Science/Data Analytics
온라인에서 'Zip파일'을 R로 다운로드 시
GreenVegetables
2020. 1. 21. 00:05
# 온라인 ZIP파일 수집할 때 쓰는 R 코드
# 파일을 다운로드할 폴더 생성.. 여기서는 데이터 폴더에 저장.
f(!file.exists("./data"))
{dir.create("./data")}
# Data 폴더에 dataset.zip 형태로 온라인 zip파일 저장
fileURL <- "https//주소/파일명.zip"
download.file(fileURL, destfile="./data/dataset.zip")
# 압축파일에서 zip파일 해제
unzip("./data/dataset.zip")
list.dirs() # 압축 해제된 파일 중 폴더 보여주기
# 해당 폴더내의 폴더명으로 이동하기
setwd("./폴더명/")
getwd()
# 해당 폴더내의 파일 확인하기
list.files()
# 해당 폴더내의 폴더 확인하기
list.dirs()
#파일이 텍스트 파일일 경우
textfile <- read.table("./파일명.txt")
# 파일의 헤더 확인하기
head(textfile)
csv를 불러들였을때와 유사하게 'textfile'란 변수를 통해 데이터에 대한 구조를 파악해볼 수 있다.
- summary 함수
- str 함수
등의 함수를 활용하면 된다.
(참조: [Coursera]Data Science Specialization 내 Getting and Cleaning Data)