1>정규 분포와 그 역사
정규 분포(正規分布)는 많은 분야에 적용되는 매우 중요한 연속 확률 분포로 ‘가우스 분포’라고도 한다. 정규 분포는 2개의 매개 변수 평균 m과 표준편차 σ에 대해 모양이 결정되고 이때의 분포를 N(m,)로 표기한다. 특히, 평균이 0이고 표준편차가 1일 정규 분포 N(0,1)을 ‘표준 정규 분포’라고 한다.
정규 분포는 드무아브르가 1733년 쓴 글에서 특정 이항 분포의 n이 클 때 그 분포의 근사치를 계산하는 것과 관련하여 처음 소개되었고 라플라스는 그의 저서 《확률론의 해석이론》(1812년)에서 이 결과를 확장하였는데 이는 오늘날 ‘드무아브르-라플라스의 정리’로 알려져 있다.
라플라스는 실험 오차를 분석하면서 정규 분포를 사용했다.
정규 분포의 예로는 학교에서 학생들의 성적, 학생들의 키의 분포도, 공학에서 열에 의해서 발생하는 노이즈가 정규 분포와 유사한 형태를 띤다. 정규 분포를 기반으로 하는 분포들로는 로그 정규 분포, 레일레이 정규 분포, 복소 정규 분포 등이 있다. 이중 복소 정규 분포는 실수와 허수 부분이 각각 독립적이고 동일하게 (i.i.d.) 정규 분포 형태를 가질 때를 의미한다.
2> 정규 분포의 의미
①가우스 분포(Gaussian distribution)라고도 불리는 정규 분포는 연속 분포 중에서 가장 널리 이용되는 분포로서 표본을 통한 통계적 추정 및 가설 검증이론의 기본이 된다.
②대부분의 연속적인 자료의 분포는 종 모양의 곡선을 갖고 있으며 이산적인 분포를 갖는 자료들도 이와 비슷한 곡선에 근사되는 성질을 갖고 있다.
③데이터가 이와 같은 형태를 보일 때 정규 분포를 따른다고 한다.
3> 정규 분포가 통계학에서 중요한 이유
①자연 현상에서 측정치들의 대부분 예를 들어 사람들의 키, 공산품의 직경이나 부피 등과 같은 측정치들은 거의 다 정규 분포를 한다.
②정규 분포를 하지 않는 측정치들에 있어서도 측정 척도에 대한 간단한 변환에 의해서 정규 분포에 근사하도록 유도할 수 있다.
―변환 방법은 제곱근 변환이나 대수 변환이 많이 사용된다.
③정규 분포는 수학적으로 다루기 쉬우며 정규 분포에서 유도되는 수리 통계학적 여러 가지 결과는 정규 분포를 하지 않는 경우에 대해서도 유용하게 활용된다.
―정규 분포에서 얻은 이론적 결과는 정규 분포를 하지 않거나 이산변수의 분포에 대해서도 잘 적용된다.
④정규 분포를 하지 않는 집단에서도 표본 평균의 분포는 표본이 클 때에 근사적으로 정규분포를 한다.
‘제시문’ 정규 분포의 확률 밀도 함수에 대하여 정규 분포를 이루는 변량 의 평균과 분산은 아래와 같다.
표준화식에 의하여 변환된 표준 정규 분포의 확률 밀도 함수와 그래프는 아래와 같다.
‘논제’
위의 주어진 사실을 이용하여 평균을 계산하는 과정을 서술하시오.
‘예시 답안’
로 치환
,
여기서는 기함수의 적분이므로 0이고
는 표준정규분포함수로 확률밀도함수이므로 1이다
∴
―신우형, ㈜엘림에듀 집필위원/위즈만 아카데미 대표
※ 저작권자 ⓒ 파이낸셜뉴스, 무단전재-재배포 금지