홈(15)
-
분산 - variance,Var
분산(分散, 영어: variance)은 통계학에서 확률변수가 기댓값으로부터 얼마나 떨어져 분포하는지를 나타내는 척도입니다. 분산은 데이터가 평균값을 중심으로 얼마나 퍼져 있는지를 측정하며, 데이터의 변동성을 수치적으로 표현합니다. 분산이 크면 데이터가 평균값에서 넓게 퍼져 있음을, 분산이 작으면 데이터가 평균값 주변에 밀집해 있음을 의미합니다. 분산은 다음과 같은 공식으로 계산됩니다. Var(X)=σ2=E[(X−μ)2] 여기서 ( Var(X) )는 확률변수 ( X )의 분산, ( \sigma^2 )는 모분산, ( E )는 기댓값, ( X )는 확률변수, ( \mu )는 확률변수의 기댓값을 나타냅니다. 표본 데이터에 대한 분산은 다음과 같이 계산됩니다. s2=n−11i=1∑n(xi−xˉ)2 여기서 (..
2024.03.08 -
첨도 - kurtosis
첨도는 데이터 분포의 뾰족함을 나타내는 척도입니다. 데이터가 중심에 많이 몰려 있을수록 뾰족한 모양이 되고, 두루 퍼지면 구릉모양을 보이게 됩니다. 첨도(尖度, 영어: kurtosis 커토시스[*])는 확률분포의 꼬리가 두꺼운 정도를 나타내는 척도이다. 극단적인 편차 또는 이상치가 많을 수록 큰 값을 나타낸다. 첨도값(K)이 3에 가까우면 산포도가 정규분포에 가깝다. 3보다 작을 경우에는(K3) 정규분포보다 꼬리가 두꺼운 분포로 판단할 수 있다. [자료출처-위키백과 참조]
2024.03.08 -
왜도 - Skewness
왜도(Skewness)는 데이터 분포의 좌우 비대칭도를 나타내는 척도입니다. 데이터가 얼마나 대칭적이지 않은지를 수치로 표현하는 것으로, 분포가 왼쪽이나 오른쪽으로 얼마나 치우쳐 있는지를 나타냅니다. 예를 들어, 정규분포는 왜도가 0이며, 분포가 오른쪽으로 긴 꼬리를 가지면 왜도는 양수가 되고, 왼쪽으로 긴 꼬리를 가지면 음수가 됩니다 왜도를 측정하는 방법에는 여러 가지가 있지만, 피어슨의 비대칭 계수(Pearson’s skewness coefficients)가 간단하고 이해하기 쉽습니다. 이는 평균값(mean), 중앙값(median), 최빈값(mode) 간의 차이를 비교한 후, 그 차이를 표준편차(standard deviation)로 나눈 값을 사용합니다. 수식으로는 다음과 같이 표현할 수 있습니다: ..
2024.03.08