*조건부 확률, 공분산에 대한 개념을 아셔야 이 포스팅*을 이해하실 수 있으실 겁니다.

 

 

유한 수정 계수 :

평균이 μ, 분산이 σ2"무한" 모집단에서 크기가 n인 표본을 추출 할 때의 표본평균의 분산은 σ2n 이지만, 평균이  μ, 분산이 σ2이며, 크기가 N"유한" 모집단에서 크기가 n인 표본을 추출 할 때, 그 표본평균의 분산은 NnN1σ2n입니다. 이때 σ2n 의 앞에 붙는 계수인  NnN1유한 수정 계수라고 합니다.

(모집단으로부터 크기가 n인 표본을 추출 할 때, 이는 복원 추출이 아닌 비복원 추출입니다. 예를 들어서, 명재와 동현이가 포함된 50명의 학급으로부터 표본 2명을 추출 시에, 표본을 이루는 원소로 이루어진 집합의 형태가 {명재, 동현}은 있지만 {명재, 명재}는 없을 테니깐요. 표본 내에 중복되는 원소가 없다는 뜻입니다.)

 

*확률 변수 Xi=(크기가 n인 표본을 추출하는 과정에서 i번째 뽑힌 원소)라고 설정하고 이야기를 시작하겠습니다.(확률 변수 Xi는 이 포스팅 내에서 계속 쓸 것이기 때문에 잘 봐두세요!)

 

이에 대한 설명을 차근차근 이어나가려고 하는데, 아래와 같은 순서로 이어나가려고 합니다.

🔑1 : 무한모집단에서 크기가 n인 표본을 추출할 시, i번째 뽑히는 원소 Xij번째 뽑히는 원소 Xj는 서로 독립이다.

🔑2 : 유한모집단에서 크기가 n인 표본을 추출할 시, i번째 뽑히는 원소 Xij번째 뽑히는 원소 Xj는 서로 독립이 아니다.

🔑3 : 유한 수정 계수 증명 1

🔑4 : 유한 수정 계수 증명 2

 

시작해 보겠습니다😉

 

 

 

-🔑1  : 무한모집단에서 크기가 n인 표본을 추출할 시, i번째 뽑히는 원소 Xij번째 뽑히는 원소 Xj는 서로 독립이다-

고등학교 확률과 통계에서 표본을 추출하는 것은 무한 모집단에서 표본을 추출하는 것이었습니다.

모집단으로부터 표본을 하나씩 차례차례 추출해 나간다고 할 때, 만약 모집단이 무한하다면,

하나 하나를 뽑아 나가더라도, 남아 있는 모집단 원소들의 평균과 분산(특성치들)이 변화하지 않을 것입니다.

 

어느 정도 직관적으로도 모집단의 특성치에 변화가 없을 것이라 예상되지만, 평균이 변하지 않는다는 것을 수학적으로 보여드리자면

 

limNk=1NxkN=μ일 때, 모집단을 구성하는 어떤 특정한 원소 xi가 빠지더라도, limNx1+x2+x3++xi1+xi+1++xNN=limN[k=1NxkNxiN]=limNk=1NxkNlimNxiN=μ0=μ

 

여기서 xi하나만 뽑지 않고, 크기가 n 유한한 표본을 추출하더라도 limNk=1nxkN=0이 유한한 크기 n에 대하여 반드시 성립하므로, 추출하는 표본의 크기가 얼마나 되든, 남아있는 원소들(사실 남아있는 원소가 무한하므로 셀수가 없죠)의 평균이 μ에서 변하지 않음을 알 수 있습니다. 같은 방법으로 분산 또한 변하지 않음을 보일 수 있죠.(limN(xiμ)2N=0이니까요)

 

 

 

무한모집단에서 크기가 n인 표본을 추출 시에, i번째에 뽑히는 원소와 j번째에 뽑히는 원소가 서로 독립임을 가정 할 수 있기 때문에, 서로 독립인 두 확률변수 X1, X2에 대하여, Var(X1+X2)=Var(X1)+Var(X2)가 성립하므로,

Var(X¯)=Var(X1+X2++Xnn)=1n2Var(X1+X2++Xn)

=1n2(Var(X1)+Var(X2)++Var(Xn))=1n2[σ2+σ2++σ2]=1n2[nσ2]=σ2n

이 식이 고등학교 확률과 통계에서 배운 내용입니다.

 

 

 

 

-🔑2 : 유한모집단에서 크기가 n인 표본을 추출할 시, i번째 뽑히는 원소 Xij번째 뽑히는 원소 Xj는 서로 독립이 아니다-

 

하지만 유한 모집단에서는 이야기가 다릅니다. 예를 들어서 크기가 100(=N)인 모집단에서 크기가 50(=n)인 표본을 추출 하는 경우를 생각해보죠. 크기가 50인 표본을 하나하나 차례로 추출 할 시에, 맨 처음 100명에서 표본 원소 1개를 추출할 때 그 원소가 가지는 수에 대한 기댓값과 분산, 표본 크기 50명 중 49명까지 추출을 하고, 남은 51명에서 마지막 표본 원소를 추출 할 때 그 원소가 가지는 수에 대한 특성치가 무조건 같을 것이라고 보장 할 수 없을 것입니다.

즉, i<j인 자연수 i,j에 대하여, 유한모집단으로부터 i번째에 뽑히는 원소 XiXj가 서로 독립이 아니라는 것입니다.

예를 들어 1,2,3,4,5 로 이루어진 모집단으로부터 크기가 2인 표본을 추출할 시에, 첫 번째로 뽑히는 원소 X1=5이면, X2는 절대로 5가 될 수 없습니다. 첫 번째로 뽑히는 원소가 무엇인지에 따라서, 두 번째로 뽑힐 수 있는 원소가 달라지고, 이는 즉 X2X1에 의해 영향을 받기에, X1X2는 독립이 아닙니다.

 

자연수 i, j (i<j)에 대하여, XiXj가 서로 독립이 아님을 조건부 확률을 이용하여 증명해 보겠습니다.

크기가 N인 모집단 내에서 특정 원소 x, x에 대하여, 

Pr(Xj=x,Xi=x),

Pr(Xj=x)Pr(Xi=x)

두가지를 구해보겠습니다.(독립이라면, 이 둘이 같은 값을 가져야 하겠죠)

 

 

Pr(Xj=x,Xi=x)=Pr(Xj=x|Xi=x)Pr(Xi=x)

 

Pr(Xj=x|Xi=x) 를 다음과 같이 구하겠습니다.

 

Pr(Xj=x|Xi=x)=N2Pj2N1Pj21Nj+1=(N2)!/(Nj)!(N1)!/(Nj+1)!1Nj+1

=(N2)!(Nj+1)!(N1)!(Nj)!1Nj+1=(N2)!(Nj+1)!(N1)!(Nj+1)!=1N1

(확인 : 이 식에서 N2Pj2N1Pj2i번째에 x가 있는 상황에서 (j1) 번째 까지 x가 등장하지 않는 확률을 의미하고,

1Nj+1j 번째에 x가 뽑힐 확률을 의미하는 것 이해하시죠?)

 

이렇게

Pr(Xj=x|Xi=x)=1N1

임이 밝혀졌습니다.

 

Pr(Xi=x)도 마저 구해보죠.

 

Pr(Xi=x) => (i1) 번째 까지 x가 뽑히지 않고, i 번째에 x가 뽑힐 확률 = (i1)개의 칸이 x를 제외한 값으로 채워지고, i번째 칸이 (i1)번째 칸 까지 채워진 (i1)개의 원소를 제외한 것들 중 x로 채워질 확률

Pr(Xi=x)=N1Pi1NPi11Ni+1=(N1)!/(Ni)!N!/(Ni+1)!1Ni+1=(N1)!(Ni+1)!N!(Ni)!1Ni+1=1N

 

Pr(Xj=x|Xi=x)=1N1 , Pr(Xi=x)=1N

 

이렇게

Pr(Xj=x,Xi=x)=Pr(Xj=x|Xi=x)Pr(Xi=x)=1N11N=1N(N1) 임이 밝혀졌습니다.

 

위의 과정에서 Pr(Xi=x)의 의미는 임의의 자연수 i에 대하여 i번째 뽑히는 표본 원소가 어떤 특정한 값일 확률을 의미하고, 이 식이 i의 값에 관계 없이 1N의 확률 값을 가지므로, Pr(Xi=x)의 확률이나, Pr(Xj=x)의 확률 모두 1N의 값을 가지게 됩니다.

 

Pr(Xj=x)Pr(Xi=x)=1N1N=1N2

 

결과적으로 Pr(Xj=x,Xi=x)=1N(N1)Pr(Xj=x)Pr(Xi=x)=1N2

 

이렇게 유한 모집단에서 표본을 추출할 시에 XiXj가 독립이 아님임이 밝혀졌습니다.

 

 

아무튼 🔑2에서 결론적으로 나온 두개의 식

Pr(Xk=x)=1N, Pr(Xj=x,Xi=x)=1N(N1)

은 아래 증명과정에서도 계속 쓸 것이라 반드시 이해하고 넘어가셔야 합니다.

 

 

 

🔑3 : 증명 1 : 유한모집단에서 추출한 표본평균 X¯에 대하여, Var(X¯)=NnN1σ2n

 

시작전 헷갈리지 말아야 할 점은, 크기가 N인 모집단을 원소나열법으로 표기하면 {x1, x2, x3, , xN}으로 나타낼 수 있고, 이 모집단으로부터 크기가 n인 표본을 차례로 추출 할 때, 확률변수 Xii 번째로 추출된 모집단의 원소입니다.

모집단의 원소들은 소문자 x, 표본 추출시 i 번째로 추출되는 표본은 대문자 Xi입니다.

 

증명하기 위해서 몇가지 식을 미리 정리해두겠습니다.

먼저 기본적으로 모집단의 평균인 μ와 분산 σ2의 식을 정리해두면,(분산 식을 잘 보셔야합니다)

μ=E(X)=k=1NxkN,

σ2=E(X2)[E(X)]2=k=1Nxk2N[k=1NxkN]2=k=1Nxk2N(k=1Nxk)2N2=k=1Nxk2N(x1+x2+x3++xN)2N2

=k=1Nxk2Nx12+x22++xN2+2(x1x2+x1x3++x1xN++xN1xN)N2=k=1Nxk2Nk=1Nxk2+2j>iNi=1NxixjN2

 

 

----------------------------------------------------------------------------------------------------------------------

*참고

여기서 (x1+x2+x3++xN)2=k=1Nxk2+2j>iNi=1Nxixj으로 표기하는 것이 고등학교 과정에서는 잘 나오지 않는 표기 형태이기에 간단히만 설명드리겠습니다.(일일이 설명하려니깐 주제에서 벗어나는 설명이 너무 장황해지는 것 같아서..)

 

(x1+x2+x3++xN)2=(x1+x2+x3++xN)(x1+x2+x3++xN)

=x12+x22++xN2+(x1x2+x2x1+x1x3+x3x1++x1xN+xNx1++xN1xN+xNxN1)

 

여기서 밑줄 친 x1x2+x2x1+x1x3+x3x1++x1xN+xNx1++xN1xN+xNxN1 해당 부분을 두가지 방법으로 표현할 수 있습니다.

 

 

x1x2+x2x1+x1x3+x3x1++x1xN+xNx1++xN1xN+xNxN1=jiNi=1Nxixj=2j>iNi=1Nxixj

 

여기서 첫번째 식 jiNi=1Nxixj=jiNxj(i=1Nxi)=jiN(x1xj+x2xj+x3xj++xNxj)로 표현할 수 있고,

jiN(x1xj+x2xj+x3xj++xNxj)의 의미는 곱해져 있는 형태의 각 항 x1xj, x2xj, , xNxj 들 내에서 앞에 곱해져 있는 xi에서의 i값과 같지 않은 모든 1부터 N까지의 자연수를 j에 넣어 모두 합친다는 것을 의미합니다. 그래서,

jiN(x1xj+x2xj+x3xj++xNxj)=j1Nx1xj+j2Nx2xj+j3Nx3xj++jNNxNxj

=(x1x2+x1x3+x1x4++x1xN)+(x2x1+x2x3+x2x4++x2xN)

+(x3x1+x3x2+x3x4++x3xN)++(xNx1+xNx2+xNx3++xNxN1)

이렇게 표현이 됩니다.

이 전개식에서는 동류항이 각각 2개씩 쌍을 이루며 존재합니다.(예를 들어 첫 번째 괄호 안의 x1x3와 세 번째 괄호 안의 x3x1은 동류항이므로, 중복되는 항(동류항)이 2개로 쌍을 이룸)

 

마찬가지의 방법으로 두번째 식 2j>iNi=1Nxixj2j>iN(x1xj+x2xj+x3xj++xNxj)로 풀어서 봤을 때,

j>iN(x1xj+x2xj+x3xj++xNxj)의 의미는 곱해져 있는 형태의 각 항 x1xj, x2xj, , xNxj 들 내에서 앞에 곱해져 있는 xi에서의 i값보다 큰 모든 1부터 N까지의 자연수를 j에 넣어 모두 합친다는 것을 의미합니다. 그래서,

2j>iN(x1xj+x2xj+x3xj++xNxj)=2(j>1Nx1xj+j>2Nx2xj++j>N1NxN1xj+j>NNxNxj)

=2[(x1x2+x1x3++x1xN)+(x2x3+x2x4++x2xN)++(xN1xN)+0]의 형태로 정리됨을 알 수 있습니다.

이 전개식에서는 각 항끼리 중복되는 부분(합쳐지지 않은 동류항)이 없습니다.

또한 2xixj 형태의 항의 갯수가 총 NC2=N(N1)2개로 나타납니다. (서로 다른 N개 중 2개를 뽑는 경우의 수)

----------------------------------------------------------------------------------------------------------------------

 

이제 크기가 N인 모집단으로부터 크기가 n인 표본을 추출할 때 k번째로 추출되는 표본 원소의 확률변수 Xk에 대한 몇가지 식을 정리하겠습니다. 위에서 구한 Pr(Xk=x) (k번째로 추출된 원소가 어떤 모집단의 특정 원소 x일 확률은) k의 값에 관계 없이  1N임을 구했으므로,

 

E(Xk)=i=1NxiPr(Xk=xi)=i=1Nxi1N=μ

k번째로 추출된 원소의 기댓값은 모집단의 평균인 μ와 동일합니다.

 

Var(Xk)=E(Xk2)(E(Xk))2=i=1Nxi2Pr(Xk2=xi2)μ2=i=1Nxi21Nμ2=σ2

(Pr(Xk2=xi2)=Pr(Xk=xi)=1N)

 

Cov(Xi,Xj)=E[(XiμXi)(XjμXj)]=E[XiXjμXiXjμXjXi+μXiμXj]

=E[XiXj]E[μXiXj]E[μXjXi]+E[μXiμXj]=E[XiXj]μXiE[Xj]μXjE[Xi]+μXiμXj

=E[XiXj]μE[Xj]μE[Xi]+μ2=E[XiXj]μ2μ2+μ2=E[XiXj]μ2

(μXi=μXj=E[Xi]=E[Xj]=μ) (k번째로 뽑히는 원소의 평균이나 기댓값 모두 i, j값에 관계 없이 모집단의 평균 μ와 같음)

 

Cov(Xi,Xj)=E[XiXj]μ2=2N(N1)[j>iNi=1Nxixj]μ2

(Pr(XiXj=xx)=Pr(Xi=x,Xj=x)+Pr(Xi=x,Xj=x)=1N(N1)+1N(N1)=2N(N1)

E[XiXj]=j>iNi=1NxixjPr(XiXj=xx)=j>iNi=1Nxixj2N(N1))

 

 

위의 과정으로 확률변수 Xk에 대한 식을 정리하면,

E(Xk)=μ2,Var(Xk)=σ2,Cov(Xi,Xj)=2N(N1)[j>iNi=1Nxixj]μ2

 

으로 정리되었습니다. 여기서 중요한 점은 Xk의 기댓값, 평균, 서로 다른 원소끼리의 공분산 모두 i, j값에 관계없이(몇 번째로 추출되었는지에 전혀 상관없이) 어떤 상수라는 것입니다. 공분산 식이 얼핏 보면 정해지지 않은 값으로 보일 수 있지만, 모집단의 원소는 정해진 상수들이고, 이 모집단의 서로 다른 두 원소를 택해서 곱한 것들을 모두 합친 것에 2N(N1)라는 상수를 곱하고, 거기서 모집단의 평균인 μ라는 상수의 제곱을 뺀 것이니깐요.

 

 

 

이렇게 정리한 모든 식들에 대해서 정리하면,

**모집단의 평균과 분산에 대한 식으로 μ=i=1NxiN,  σ2=k=1Nxk2Nk=1Nxk2+2j>iNi=1NxixjN2

**확률변수 Xk에 대한 식으로 E(Xk)=μ2,Var(Xk)=σ2,Cov(Xi,Xj)=2N(N1)[j>iNi=1Nxixj]μ2

 

이렇게 다섯개의 "상수값"을 이용하여, 이제 정말로 Var(X¯)를 구하겠습니다.

 

Var(X1+X2+X3++Xn)=i=1nVar(Xi)+2j>ini=1nCov(Xi,Xj)

=nσ2+2Cov(Xi,Xj)j>ini=1n(1)=nσ2+2[2N(N1)j>iNi=1Nxixjμ2]j>ini=1n(1)

=nσ2+2[2N(N1)j>iNi=1Nxixjμ2]n(n1)2=nσ2+n(n1)[2N(N1)j>iNi=1Nxixjμ2]

 

여기서 μ2=(i=1NxiN)2=(i=1Nxi)2N2=i=1Nxi2+2j>iNi=1NxixjN2이므로 μ의 자리에 해당 식을 대입하면,

nσ2+n(n1)[2N(N1)j>iNi=1Nxixjμ2]=nσ2+n(n1)[2N(N1)j>iNi=1Nxixji=1Nxi2+2j>iNi=1NxixjN2]

=nσ2+n(n1)2Nj>iNi=1Nxixj(N1)i=1Nxi22(N1)j>iNi=1NxixjN2(N1)

=nσ2+n(n1)(N1)[1NN2i=1Nxi2+2j>iNi=1NxixjN2]=nσ2+n(n1)N1[i=1Nxi2+2j>iNi=1NxixjN2i=1Nxi2N]

=nσ2+n(n1)N1[σ2]=nσ2nσ2n1N1=nσ2(1n1N1)=nσ2NnN1

 

Var(X¯)=Var(X1+X2++Xnn)=1n2Var(X1+X2++Xn)=1n2NnN1nσ2=NnN1σ2n

 

 

 

 

 

 

🔑4 : 증명 2 : 유한모집단에서 추출한 표본의 평균 X¯에 대하여, Var(X¯)=NnN1σ2n

 

 

위에서 했던 증명 1과 다르게, 확률변수 Xk에 대한 식을 정리하지 않고, 바로 Var(X¯)를 구할 수도 있습니다.

X¯=X1+X2++Xnn 이고, E(X¯)=μ임을 알고 있고, 분산 Var(X¯)=E(X¯2)E(X¯)2 이므로 여기서 E(X¯2)를 구해보죠

 

Step 1.

E(X¯2)=1NCn[(x1+x2++xn1+xnn)2+(x2+x3++xn+xn+1n)2++(xNn+1+xNn+2++xNn)2]

 

위 식의 우변을 살펴보면, 대괄호 []안의 (x1+x2++xn1+xnn)2 각 항들은,

N개의 원소로 이루어진 모집단으로 부터 n개의 표본을 추출하는 경우, 모든 NCn의 경우에서 나온 원소들에 대한 평균의 제곱 들의 합이라고 볼 수 있습니다.

 

모집단의 집합을 원소나열법으로 {x1,x2,x3,,xN}라고 나타냈을 때, n개의 원소를 추출하는  NCn개의 경우들 중 한가지 경우인 x1,x2,xn의 경우로 추출했다면,

x1,x2,xn들의 평균 X¯=x1+x2+xnn이 되고,

X¯2=(x1+x2+xnn)2이 되며, 이렇게 X¯2=(x1+x2+xnn)2이 될 확률은

(추출한 원소가 (x1, x2, , xn)인 경우의 수)/(서로 다른 N개 중 n개를 뽑는 경우의 수) = 1NCn이 됩니다.

 

그러므로 E(X¯2)=1NCn[(x1+x2++xn1+xnn)2+(x2+x3++xn+xn+1n)2++(xNn+1+xNn+2++xNn)2]

이라는 식이 나왔고, 여기서 대괄호 [] 안의 (x1+x2++xn1+xnn)2 꼴의 항의 갯수는 총 NCn개 입니다.

 

E(X¯2)=1NCn[(x1+x2++xn1+xnn)2+(x2+x3++xn+xn+1n)2++(xNn+1+xNn+2++xNn)2]

 

 

 

Step 2. 

E(X¯2)=1NCn[(x1+x2++xn1+xnn)2+(x2+x3++xn+xn+1n)2++(xNn+1+xNn+2++xNn)2]

=1NCn1n2[(x1+x2++xn1+xn)2+(x2+x3++xn+xn+1)2++(xNn+1+xNn+2++xN)2]

 

-위 식을 전개했을 때, xi의 계수는 N1Cn1입니다.

(NCn)개의 항을 전개시 xi2xi가 포함된 항으로부터 xi2 형태로 나오므로, 위 (NCn)개 항 중 xi를 포함하는 항의 갯수

=N개 중 특정 xi를 포함하여 총 n개의 표본을 추출하는 경우의 수 = xi를 뽑아 놓고, 나머지 (N1)개 중 (n1)개를 뽑는 경우의 수

=N1Cn1)

 

-위 식을 전개 했을 때, xixj  (ij) 의 계수는 2N2Cn2입니다.

(NCn)개의 항을 전개시  xixj  (ij)xixj를 포함하는 항으로 부터 2xixj의 형태로 나오므로,

위 (NCn)개 항 중 xixj 두 개를 포함하는 항의 갯수 = N2Cn2

 

(x1+x2++xn1+xn)2+(x2+x3++xn+xn+1)2++(xNn+1+xNn+2++xN)2

=N1Cn1i=1Nxi2+2N2Cn2j>iNi=1Nxixj

 

 

E(X¯2)=1NCn1n2[N1Cn1i=1Nxi2+2N2Cn2j>iNi=1Nxixj]

 

 

 

Step 3.

Var[X¯]=E[X¯2](E[X])2 식 정리하기

 

Var[X¯]=E[X¯2](E[X])2=1NCn1n2[N1Cn1i=1Nxi2+2N2Cn2j>iNi=1Nxixj]μ2

=1NCn1n2[N1Cn1i=1Nxi2+2N2Cn2j>iNi=1Nxixj](i=1Nxi)2N2

=1NCn1n2[N1Cn1i=1Nxi2+2N2Cn2j>iNi=1Nxixj]i=1Nxi2+2j>iNi=1NxixjN2

=(Nn)!n!N!1n2(N1)!(Nn)!(n1)!i=1Nxi2+2(Nn)!n!N!1n2(N2)!(Nn)!(n2)!j>iNi=1Nxixj

1N2i=1Nxi22N2j>iNi=1Nxixj

=1Nni=1Nxi2+2(n1)N(N1)nj>iNi=1Nxixj1N2i=1Nxi22N2j>iNi=1Nxixj

=NnN2n[i=1Nxi2]+2N(n1)2n(N1)N2(N1)n[j>iNi=1Nxixj]

=1N2(N1)n[(Nn)(N1)i=1Nxi22(Nn)j>iNi=1Nxixj]

=Nn(N1)n[(N1)i=1Nxi2N22j>iNi=1NxixjN2]=Nn(N1)n[i=1Nxi2Ni=1Nxi2+2j>iNi=1NxixjN2]

=Nn(N1)n[i=1Nxi2N(i=1Nxi)2N2]=Nn(N1)n[i=1Nxi2N(i=1NxiN)2]

=Nn(N1)nσ2=NnN1σ2n

 

 

Var[X¯]=NnN1σ2n

 

이렇게 증명을 마치겠습니다.

 

 

 

유한 수정 계수는 모집단의 크기(N)에 비해 추출되는 표본의 크기(n)가 무시할 수 없을 정도로 클 때 표본분산 앞에 붙여줌으로써 표본평균 추정의 정밀도를 높이는 데에 사용됩니다.

NnN11이므로, 유한 수정 계수를 표본 평균의 분산 σ2n앞에 곱해주면, 분산의 크기가 줄어들게 되므로, 동일 신뢰도 내에서 더 정밀한(구간의 크기가 더 작아지는) 신뢰구간을 얻을 수 있습니다.

 

-만약 모집단의 크기 N=10000이고, 추출되는 표본의 크기 n=20이라면, 유한 수정 계수의 값은 10000201000010.9980으로, 표본 평균의 신뢰구간을 줄이는 데에 큰 기여를 하지 못하기 때문에 이런 경우에는 유한 수정 계수는 생략되기도 합니다.

-반면에 모집단의 크기 N=10000이고, 추출되는 표본의 크기 n=2000이라면, 유한 수정 계수의 값은 1000020001000010.8000으로, 표본 평균의 신뢰구간의 크기가 꽤 고려할 만한 수준으로 줄어들기 때문에 이러한 경우에 유한 수정 계수를 고려하여 표본평균의 분산을 계산합니다.

 

일반적으로 모집단의 크기 대비 표본의 크기가 5% 이상일 때(nN0.05) 유한 수정 계수를 고려한 표본평균의 분산을 이용합니다.

 

 

 

사실 학부 과정에서 큰 비중으로 다루어지는 주제가 아니기에 제 교수님은 그냥 간단히 언급만 하고 넘어가셔서, 제 스스로 호기심이 들어서 증명해놓았던 것을 정리해서 올립니다.

충분히 고등학교 과정에서 배운 확률과 이항정리 개념만 가지고도 증명이 가능하기에(물론 식 정리하기가 쉽지만은 않지만요🥲), 가볍게 생각해본다는 느낌으로 한 번 봐주시면 좋을 것 같습니다.

 

이상 포스팅을 마치겠습니다.

 

 

 

+ Recent posts