체험판 다운로드
분산 - variance,Var

2024. 3. 8. 10:12기술통계학/기술통계학 이론

 

 

분산(分散, 영어: variance)은 통계학에서 확률변수가 기댓값으로부터 얼마나 떨어져 분포하는지를 나타내는 척도입니다. 분산은 데이터가 평균값을 중심으로 얼마나 퍼져 있는지를 측정하며, 데이터의 변동성을 수치적으로 표현합니다. 분산이 크면 데이터가 평균값에서 넓게 퍼져 있음을, 분산이 작으면 데이터가 평균값 주변에 밀집해 있음을 의미합니다.

분산은 다음과 같은 공식으로 계산됩니다.

 

 

여기서 ( Var(X) )는 확률변수 ( X )의 분산, ( \sigma^2 )는 모분산, ( E )는 기댓값, ( X )는 확률변수, ( \mu )는 확률변수의 기댓값을 나타냅니다.

표본 데이터에 대한 분산은 다음과 같이 계산됩니다.

 

 

여기서 ( s^2 )는 표본분산, ( n )은 표본의 크기, ( x_i )는 각 데이터 포인트, ( \bar{x} )는 표본 평균을 나타냅니다. 

분산은 데이터의 퍼짐 정도를 이해하고, 다른 통계적 추정이나 예측 모델링에 중요한 기초가 됩니다. 또한, 분산은 표준편차의 제곱으로도 표현되며, 표준편차는 분산의 제곱근으로 계산됩니다. 이는 데이터의 퍼짐 정도를 원래의 단위로 이해하는 데 도움을 줍니다.

률론과 통계학에서 어떤 확률변수의 분산(分散영어: variance,Var)은 그 확률변수가 기댓값으로부터 얼마나 떨어진 곳에 분포하는지를 가늠하는 숫자이다.  기댓값은 확률변수의 위치를 나타내고 분산은 그것이 얼마나 넓게 퍼져 있는지를 나타낸다. 분산은 표본 평균이나 분산의 제곱근인 표준편차와 보다 밀접한 관련이 있다.

 

 

 

 

 

사업자 정보 표시
비드파일럿 | 김연식 | 서울특별시 강서구 공항대로 186, 12층 1206호(마곡동 로뎀타워) | 사업자 등록번호 : 202-10-79704 | TEL : 070-4617-7464 | Mail : misterblog@naver.com | 통신판매신고번호 : 제 2013-서울영등포-0251호 | 사이버몰의 이용약관 바로가기

'기술통계학 > 기술통계학 이론' 카테고리의 다른 글

기술통계학 - Descriptive analsys  (0) 2024.03.08
표준편차 - standard deviation(σ)  (0) 2024.03.08
첨도 - kurtosis  (0) 2024.03.08
왜도 - Skewness  (0) 2024.03.08