2019년 8월 17일 토요일

Chp1. R-Basic - 1

본론
"기초부터 차근차근"

작업전 디렉토리 지정
setwd() 함수로 작업 디렉토리를 지정한다
--> setwd('D:\002 Work')
--> 상단 매뉴 -> 파일 -> 작업디렉토리 변경

1-1 R의 데이터 Type

1-1-1 숫자형, 주요 산술 연산자
+,-,*,/,^(제곱)

1-1-2 문자형
R은 문자,문자열 구분없이 모두 "문자열"이다 ""로 묶어서 사용한다

1-1-3 True / False Type
& | !
-->and or not 연산자

1-1-4 NA type
값이 정해져있지 않은경우 사용 , na 와의 연산은 언제나 NA , SQL 처럼 NULL과의 연산은 NULL 인것과 같음
-->SQL의 NVL함수와 같은기능의 na.rm 함수가 있음
> a <- sum(c(1,2,NA))
> a
[1] NA
-->NA가 들어가면 결과값도 NA로 나온다

> a <-sum(c(1,2,NA),na.rm=T)
> a
[1] 3
-->na.rm=T 로 NA를 제거한다

1-1-5 Factor Type
문자 data의 숫자 형태 변환시 사용
-->그래프를 그릴때 문자보다 숫자가 좋으니까

> a <- c('서울','서울','부산','대전','대전','부산','광주','제주')
> fa <- factor(a)
--> 문자를 수치화 시켜서 항목당 수치를 먹힌다

> plot(a)
Error in plot.window(...) : 유한한 값들만이 'ylim'에 사용될 수 있습니다
추가정보: 경고메시지(들):
1: In xy.coords(x, y, xlabel, ylabel, log) :
  강제형변환에 의해 생성된 NA 입니다
2: In min(x) : min에 전달되는 인자들 중 누락이 있어 Inf를 반환합니다
3: In max(x) : max에 전달되는 인자들 중 누락이 있어 -Inf를 반환합니다
-->문자를 그래프화 시킬수 없기때문에 에러가 발생

> plot(fa)
-->정상 그래프 반환
1.png
> savePlot("fa.png",type="png")
-->P가 대문자 확인 fa.png는 workdirectory에 저장된다



1-1-6 날짜와 시간
-->특정기간을 지정해서 데이터를 분석하는 경우가 많기때문에 중요하다
-->날짜만, 날짜+시간을 보는 함수가 다르기때문에 중요

> Sys.Date()
[1] "2019-08-17"

년도 부분만 추출하기
> substr(Sys.Date(),1,4)
[1] "2019"

날짜의 빼기 연산
> h <-as.Date('2014-01-31')
> i <-as.Date('2014-01-01')
> i-h
Time difference of -30 days
> h-i
Time difference of 30 days

as.Date - 날짜를 가지고 연산하는것
> as.Date(31,origin='2014-05-01')
[1] "2014-06-01"
> as.Date(31,origin=Sys.Date())
[1] "2019-09-17"

1-1-7 주석
R코드에서 주석은 #을 이용해서 사용한다

1-2 변수 사용

1-2-1 변수
" "나 ' ' 로 감싸서 사용한다
주의사항
대소문자의 구분
시작은 반드시 문자로
예약어는 사용하지 못함

> a <- 1
> b <- 2
> a+b
[1] 3
-->변수 할당 및 값 확인

> (x <-1:5)
[1] 1 2 3 4 5
> x <- 1:5
-->활호로 감싸면 할당된 사항이 바로 출력된다

1-2-2 함수
기본 제공함수
abs(),cos() 등등이 있고 ()안에 argument를 삽입해서 사용한다
사용자 정의함수
함수명 <-function(argument){
계산식
return(반환값)
}
ex)어떤 값 x를 넣으면 제곱해서 반환하는 함수 func1 를 만들어라
func1 <- function(x){
result <- x^2
return (result)
}

댓글 없음:

댓글 쓰기