빅데이터 기초 지식

2023. 10. 21. 17:12R, 빅데이터 분석 실험

data frame

행 -> subject

열 -> 독립 변수

normal distribution

-> 연속적인 실수. 평균을 그리면 가운데

 

poisson distribution

-> 0을 포함하는 양에 정수(k는 이산 데이터)

-> 단위 시간당 평균 사건 발생 r, 사건의 수 k

-> 사건이 동일한 간격으로 발생한다는 가정. (만약 특정시간에 사건이 몰려 발생한다면 포아송 분포를 적용할 수 없음.)

-> 특정시간에 버스가 1 확률, 2 확률 , 3 확률

 

 

푸아송 분포, 직관적으로 이해하기

 

danbi-ncsoft.github.io

binomial distribution

-> 베르누이 시행(true or farse, 확률이 고정) n번하고 성공한 확률

-> 이산 데이터