2023. 10. 21. 18:27ㆍR, 빅데이터 분석 실험
1. 열 벡터 정의 밑 참조
a <- c(1,2,3,1,2,3) 으로 열 벡터를 만들 수 있다.
인덱스는 1부터 시작하고 :를 통해 범위로 가져올 수 있다.
2. matrix 만들기
a <- matrix(c(1,2,3,4,5,6),2,3) 명령어를 입력한다면?
해당 행렬을 얻을 수 있다. 크기가 2인 열벡터 3개를 만들고 열벡터를 합쳐 matrix를 만든다.
a<-cbind(c(1,2) , c(3,4) , c(5,6))
cbind는 열 벡터를 합치는 역할을 한다.
열부터 정의함을 주의하는게 필요하다 !
a <- matrix(c(1,2,3,4,5,6),2,3,byrow=true)를 통해 행부터 행렬을 정의할 수 있다.
3. 연산 기호 다름( a*b , a%*%b 가 다름)
각 행렬의 요소를 곱한다.
a행렬과 b행렬을 곱한다.
solve() : 역행렬 구하기
mean() : 각 요소의 평균
var() : (평균 - aij)^2
sd() : 표준 편차
통계로 돌아와서 분산이 있는데 왜 표준편차가 필요하지 ?
평균 키를 구하고 각 키마다 분산을 구했다. 그렇다면 그 분산은 cm^2 단위라 평균키와 단위가 달라 불편하다.
따라서 루트를 씌워 단위를 맞춘다. 그리고 우리가 흔히 아는 scale이 작아지는 장점도 있다.
4. 랜덤 변수 뽑기
rnorm(생성할 수 개수, mean, sd)
rpois( 생성할 수 개수, lambda ) // lambda : (단위 시간당 사건 발생 횟수)
rbinom(생성할 수 개수 ,n,p)
이렇게 생성되는 값들은 열 벡터!!
5. 그외
rep(1,200) 1이 200개인 열 벡터 생성
X[-(1:150), ] 1번째 행부터 150번째 행을 제외한 모든 행, 모든 열 가져오기
'R, 빅데이터 분석 실험' 카테고리의 다른 글
linear regression analysis (1) | 2023.10.21 |
---|---|
[R] lm함수를 통한 선형 회귀, 분할 정복을 통한 선형 회귀 (0) | 2023.10.21 |
빅데이터 문제 해결 방법 (0) | 2023.10.21 |
빅데이터 기초 지식 (1) | 2023.10.21 |
빅데이터란 무엇인가? (1) | 2023.10.21 |