Etc 표준편차 데이타마이닝 빅데이타
관련링크
본문
많은 자료를 대표하는 하나의 양이 평균이라면, 이 자료들이 얼마나 평균 주변에 모여 있는지를 알아야 할 때가 있다. 자료 하나하나가 평균에서 어느 정도 떨어져 있는지를 알려면 그냥 그 자료와 평균의 차를 구해보면 된다. 이것을 편차라 한다. 그러나 자료가 많으면 많을수록 편차 하나하나를 살펴보기가 어려우므로, 여러 편차들을 대표할 수 있는 하나의 양이 필요하다. 이것을 “흩어져 있는 정도”라는 뜻에서 산포도(散布度, dispersion)라 한다.