2019년 8월 17일 토요일

Chp1. R-Basic - 5

본론
"기초부터 차근차근"

1-2-6 dataFrame
1-2-6.zip 파일을 다운받는다
-->R에서 data를 table 처럼 제어하기 위해
NO NAME PRICE QTY
1 apple 500 3
2 banana 300 2
3 berry 50 4
-->R에서도 이렇게 만들자는것

> no <- c(1,2,3,4)
> name <- c("apple","banana","peach","berry")
> price <- c(500,200,300,50)
> qty <- c(2,5,7,9)
-->각각의 항목을 따로 생성한다

> fruits <- data.frame(NO=no , Name=name , Price=price , QTY=qty)
-->data.frame 함수를 사용해 항목을 묶는다

> fruits
  NO   Name Price QTY
1  1  apple   500   2
2  2 banana   200   5
3  3  peach   300   7
4  4  berry    50   9
-->결과값 확인

**일반 text파일을 읽어서 데이터 프레임 생성하기**
NO Name Price QTY
1 apple 500 2
2 banana 200 5
3 peach 300 7
4 berry 50 9

-->fruits.txt라는 파일을 제작한다
=============================================
파일 마지막줄에 enter를 넣어줘야한다
-->파일 마지막에 한줄띄기를 하고 파일을 저장하지 않으면 다음과같은 에러가 발생한다
In read.table("fruits.txt", header = T, sep = "\t") :
incomplete final line found by readTableHeader on 'fruits.txt'

엔터를 넣어도 다음과같은 에러가 발생하면
number of items read is not a multiple of the number of columns
> fruit2 <-read.table("fruits.txt",header = T,sep = "\t" , fill=T)
> fruit2
   X NO   Name Price QTY
1 NA  1  apple   500   2
2 NA  2 banana   200   5
3 NA  3  peach   300   7
4 NA  4  berry    50   9
5 NA NA           NA  NA
>
--> fruit2 <-read.table("fruits.txt",header = T,sep = "\t" , fill=T)
fill=T를 넣어서 파일을 불러와야한다
파일을 읽을때 592 columns가 되지않으면 에러가 나는데 이때 fill=T를 이용해서 부족한 부분을 채워준다
================================================

**csv 파일 읽어오기**
fruits_csv.csv 파일을생성한다
NO,Name,Price,QTY
1,apple,500,2
2,banana,200,5
3,peach,300,7
4,berry,50,9

-->마지막줄 엔터를 빼놓지 않는다
fruits_csv <-read.csv("fruits_csv.csv")
> fruits_csv <-read.csv("fruits_csv.csv",header=F)
> fruits_csv
  NO   Name Price QTY
1  1  apple   500   2
2  2 banana   200   5
3  3  peach   300   7
4  4  berry    50   9
-->csv는 read.table 보다 깔끔하게 정렬된다

> fruits_csv <-read.csv("fruits_csv.csv",header=F)
> fruits_csv
  V1     V2    V3  V4
1 NO   Name Price QTY
2  1  apple   500   2
3  2 banana   200   5
4  3  peach   300   7
5  4  berry    50   9

만약 header를 사용자가 지정하길 원하면
lanme <- c("col1","col2","col3","col4")
fruits_csv <-read.csv("fruits_csv.csv",header=F,col.names=lanme)
을 이용한다

1-2-7 xls 파일로 frame 생성
> install.packages("RODBC") - 32bit
> install.packages("XLConnect") - 64 bit
64 bit 환경이기때문에 XLConnect 패키지를 설치한다

댓글 없음:

댓글 쓰기