[R] 기본 문법 및 주요 함수

2023. 10. 21. 18:27R, 빅데이터 분석 실험

1. 열 벡터 정의 밑 참조

a <- c(1,2,3,1,2,3) 으로 열 벡터를 만들 수 있다. 

인덱스는 1부터 시작하고 :를 통해 범위로 가져올 수 있다.

 

2. matrix 만들기

a <- matrix(c(1,2,3,4,5,6),2,3) 명령어를 입력한다면? 

해당 행렬을 얻을 수 있다. 크기가 2인 열벡터 3개를 만들고 열벡터를 합쳐 matrix를 만든다.

 

a<-cbind(c(1,2) , c(3,4) , c(5,6)) 

cbind는  열 벡터를 합치는 역할을 한다.

열부터 정의함을 주의하는게 필요하다 !

 

a <- matrix(c(1,2,3,4,5,6),2,3,byrow=true)를 통해 행부터 행렬을 정의할 수 있다.

 

3. 연산 기호 다름( a*b , a%*%b 가 다름) 

각 행렬의 요소를 곱한다.

 

a행렬과 b행렬을 곱한다.

 

solve() : 역행렬 구하기

mean() : 각 요소의 평균

var() : (평균 - aij)^2 

sd() : 표준 편차 

 

통계로 돌아와서 분산이 있는데 왜 표준편차가 필요하지 ?

평균 키를 구하고 각 키마다 분산을 구했다. 그렇다면 그 분산은 cm^2 단위라 평균키와 단위가 달라 불편하다.

따라서 루트를 씌워 단위를 맞춘다. 그리고 우리가 흔히 아는 scale이 작아지는 장점도 있다.

 

4. 랜덤 변수 뽑기

rnorm(생성할 수 개수, mean, sd)

rpois( 생성할 수 개수, lambda ) // lambda : (단위 시간당 사건 발생 횟수)

rbinom(생성할 수 개수 ,n,p) 

이렇게 생성되는 값들은 열 벡터!!

 

5. 그외

rep(1,200) 1이 200개인 열 벡터 생성

X[-(1:150), ] 1번째 행부터 150번째 행을 제외한 모든 행, 모든 열 가져오기