상관계수

    분산(Variance), 표준편차, 공분산(Covariance), 상관계수, Span, 기저(Basis), Rank

    ◎ 분산(Variance) 분산(variance)은 관측값에서 평균을 뺀 값을 제곱하고, 그것을 모두 더한 후 전체 개수로 나눠서 구한다. 즉, 차이값의 제곱의 평균이다. 관측값에서 평균을 뺀 값인 편차를 모두 더하면 0이 나오므로 제곱해서 더한다. 분산은, 데이터가 얼마나 퍼져있는지를 측정하는 방법입니다. 이는 각 값들의 평균으로부터 차이의 제곱 평균입니다. 즉, 분산을 구하기 위해서는 일반적으로 평균을 먼저 계산하여야 합니다. - 모분산 σ2은 모집단의 분산이다. 관측값에서 모평균을 빼고 그것을 제곱한 값을 모두 더하여 전체 데이터 수 n으로 나눈 것이다. - 표본분산 s2은 표본의 분산이다. 관측값에서 표본 평균을 빼고 제곱한 값을 모두 더한 것을 n-1로 나눈 것이다. ◎ 표준편차 분산을 구하는 ..