*조건부 확률, 공분산에 대한 개념을 아셔야 이 포스팅*을 이해하실 수 있으실 겁니다.
유한 수정 계수 :
평균이
(모집단으로부터 크기가 n인 표본을 추출 할 때, 이는 복원 추출이 아닌 비복원 추출입니다. 예를 들어서, 명재와 동현이가 포함된 50명의 학급으로부터 표본 2명을 추출 시에, 표본을 이루는 원소로 이루어진 집합의 형태가 {명재, 동현}은 있지만 {명재, 명재}는 없을 테니깐요. 표본 내에 중복되는 원소가 없다는 뜻입니다.)
*확률 변수
이에 대한 설명을 차근차근 이어나가려고 하는데, 아래와 같은 순서로 이어나가려고 합니다.
🔑1 : 무한모집단에서 크기가 n인 표본을 추출할 시,
🔑2 : 유한모집단에서 크기가 n인 표본을 추출할 시,
🔑3 : 유한 수정 계수 증명 1
🔑4 : 유한 수정 계수 증명 2
시작해 보겠습니다😉
-🔑1 : 무한모집단에서 크기가 n인 표본을 추출할 시,
고등학교 확률과 통계에서 표본을 추출하는 것은 무한 모집단에서 표본을 추출하는 것이었습니다.
모집단으로부터 표본을 하나씩 차례차례 추출해 나간다고 할 때, 만약 모집단이 무한하다면,
하나 하나를 뽑아 나가더라도, 남아 있는 모집단 원소들의 평균과 분산(특성치들)이 변화하지 않을 것입니다.
어느 정도 직관적으로도 모집단의 특성치에 변화가 없을 것이라 예상되지만, 평균이 변하지 않는다는 것을 수학적으로 보여드리자면
여기서
무한모집단에서 크기가 n인 표본을 추출 시에,
이 식이 고등학교 확률과 통계에서 배운 내용입니다.
-🔑2 : 유한모집단에서 크기가 n인 표본을 추출할 시,
하지만 유한 모집단에서는 이야기가 다릅니다. 예를 들어서 크기가 100(=N)인 모집단에서 크기가 50(=n)인 표본을 추출 하는 경우를 생각해보죠. 크기가 50인 표본을 하나하나 차례로 추출 할 시에, 맨 처음 100명에서 표본 원소 1개를 추출할 때 그 원소가 가지는 수에 대한 기댓값과 분산, 표본 크기 50명 중 49명까지 추출을 하고, 남은 51명에서 마지막 표본 원소를 추출 할 때 그 원소가 가지는 수에 대한 특성치가 무조건 같을 것이라고 보장 할 수 없을 것입니다.
즉,
예를 들어 1,2,3,4,5 로 이루어진 모집단으로부터 크기가 2인 표본을 추출할 시에, 첫 번째로 뽑히는 원소
자연수
크기가 N인 모집단 내에서 특정 원소
①
②
두가지를 구해보겠습니다.(독립이라면, 이 둘이 같은 값을 가져야 하겠죠)
①

(확인 : 이 식에서
이렇게
임이 밝혀졌습니다.
이렇게
①
위의 과정에서
②
결과적으로
이렇게 유한 모집단에서 표본을 추출할 시에
아무튼 🔑2에서 결론적으로 나온 두개의 식
은 아래 증명과정에서도 계속 쓸 것이라 반드시 이해하고 넘어가셔야 합니다.
🔑3 : 증명 1 : 유한모집단에서 추출한 표본평균
시작전 헷갈리지 말아야 할 점은, 크기가 N인 모집단을 원소나열법으로 표기하면 {
모집단의 원소들은 소문자
증명하기 위해서 몇가지 식을 미리 정리해두겠습니다.
먼저 기본적으로 모집단의 평균인
----------------------------------------------------------------------------------------------------------------------
*참고
여기서
여기서 밑줄 친
여기서 첫번째 식
이렇게 표현이 됩니다.
이 전개식에서는 동류항이 각각 2개씩 쌍을 이루며 존재합니다.(예를 들어 첫 번째 괄호 안의
마찬가지의 방법으로 두번째 식
이 전개식에서는 각 항끼리 중복되는 부분(합쳐지지 않은 동류항)이 없습니다.
또한
----------------------------------------------------------------------------------------------------------------------
이제 크기가 N인 모집단으로부터 크기가 n인 표본을 추출할 때
즉
(
위의 과정으로 확률변수
으로 정리되었습니다. 여기서 중요한 점은
이렇게 정리한 모든 식들에 대해서 정리하면,
**모집단의 평균과 분산에 대한 식으로
**확률변수
이렇게 다섯개의 "상수값"을 이용하여, 이제 정말로
여기서
🔑4 : 증명 2 : 유한모집단에서 추출한 표본의 평균
위에서 했던 증명 1과 다르게, 확률변수
Step 1.
위 식의 우변을 살펴보면, 대괄호 []안의
N개의 원소로 이루어진 모집단으로 부터 n개의 표본을 추출하는 경우, 모든
모집단의 집합을 원소나열법으로 {
(추출한 원소가 (
그러므로
이라는 식이 나왔고, 여기서 대괄호 [] 안의
Step 2.
-위 식을 전개했을 때,
(
=
=
-위 식을 전개 했을 때,
(
위 (
Step 3.
이렇게 증명을 마치겠습니다.
유한 수정 계수는 모집단의 크기(N)에 비해 추출되는 표본의 크기(n)가 무시할 수 없을 정도로 클 때 표본분산 앞에 붙여줌으로써 표본평균 추정의 정밀도를 높이는 데에 사용됩니다.
-만약 모집단의 크기
-반면에 모집단의 크기
일반적으로 모집단의 크기 대비 표본의 크기가 5% 이상일 때(
사실 학부 과정에서 큰 비중으로 다루어지는 주제가 아니기에 제 교수님은 그냥 간단히 언급만 하고 넘어가셔서, 제 스스로 호기심이 들어서 증명해놓았던 것을 정리해서 올립니다.
충분히 고등학교 과정에서 배운 확률과 이항정리 개념만 가지고도 증명이 가능하기에(물론 식 정리하기가 쉽지만은 않지만요🥲), 가볍게 생각해본다는 느낌으로 한 번 봐주시면 좋을 것 같습니다.
이상 포스팅을 마치겠습니다.