빅데이터 기초 지식
2023. 10. 21. 17:12ㆍR, 빅데이터 분석 실험
data frame
행 -> subject
열 -> 독립 변수
normal distribution
-> 연속적인 양 음 실수. 평균을 그리면 가운데
poisson distribution
-> 0을 포함하는 양에 정수(k는 이산 데이터)
-> 단위 시간당 평균 사건 발생 r, 사건의 수 k
-> 사건이 동일한 간격으로 발생한다는 가정. (만약 특정시간에 사건이 몰려 발생한다면 포아송 분포를 적용할 수 없음.)
-> 특정시간에 버스가 1대 올 확률, 2대 올 확률 , 3대 올 확률
푸아송 분포, 직관적으로 이해하기
danbi-ncsoft.github.io
binomial distribution
-> 베르누이 시행(true or farse, 확률이 고정)을 n번하고 성공한 확률
-> 이산 데이터
'R, 빅데이터 분석 실험' 카테고리의 다른 글
linear regression analysis (1) | 2023.10.21 |
---|---|
[R] lm함수를 통한 선형 회귀, 분할 정복을 통한 선형 회귀 (0) | 2023.10.21 |
[R] 기본 문법 및 주요 함수 (1) | 2023.10.21 |
빅데이터 문제 해결 방법 (0) | 2023.10.21 |
빅데이터란 무엇인가? (1) | 2023.10.21 |