정규분포 (Normal Distribution)

정의

기원

정규분포드무아브르가 1733년 쓴 글에서 특정 이항분포의 n이 클 때 그 분포의 근사치를 계산하는 것과 관련하여 처음 소개되었고 이 글은 그의 저서 《우연의 교의》 2판(1738년)에 다시 실렸다. 라플라스는 그의 저서 《확률론의 해석이론》(1812년)에서 이 결과를 확장하였고 이는 오늘날 드무아브르-라플라스의 정리로 알려져있다.

라플라스는 실험 오차를 분석하면서 정규분포를 사용했다. 1805년에는 르장드르가 매우 중요한 방법인 최소 제곱법을 도입했다. 가우스는 이 방법을 1794년부터 사용해왔다고 주장했는데 1809년에는 실험 오차가 정규분포를 따른다는 가정하에 최소 제곱법을 이론적으로 엄밀히 정당화했다.

이 분포가 최초의 발견자 이름을 따지 않고 가우스 분포로 불리는 것은 과학적 발견은 그 최초 발견자의 이름을 따지 않는다는 스티글러의 명명법칙의 한 예이다.

표기

확률변수 X평균 μ, 분산 σ2을 갖는 정규분포라 한다면 아래와 같이 표기 한다.

  • XN(μ,σ2)
    • μ(  ,  )
    • σ2( 0 ,  )

받침

x(  ,  )

확률밀도함수

f(x)=12πσexp[(xμ)22σ2]

누적분포함수

F(x)=12[1+erf(xμσ2)]

기대값

E(X)=μ

중앙값

Mdn=μ

최빈값

Mo=μ

분산

Var(X)=σ2

왜도

γ1=0

첨도

γ2=0

특성함수

ϕ (t)=exp(μ i tσ2t22)

적률생성함수

M(t)=exp(μ t+σ2t22)

M(t)=(μ+σ2t)exp[μt+σ2t2/2]

M

원적률

\mu'_{0} = 1

\mu'_{1} = \mu

\mu'_{2} = \mu^{2} + \sigam^{2}

\mu'_{3} = \mu^{3} + 3 \mu \sigma^{2}

\mu'_{4} = \mu^{4} + 6 \mu^{2} \sigma^{2} + 3 \sigma^{4}

중심적률

\mu_{1} = 0

\mu_{2} = \sigma^{2}

\mu_{3} = 0

\mu_{4} = 3 \sigma^{4}

특징

  • 재생성을 가진다.
    • X_{i} \sim N(\mu_{i},\sigma_{i}^{2})이면 \sum X_{i} \sim N(\sum \mu_{i},\sum \sigma_{i}^{2})이 성립한다.
  • 만약 X \sim N(\mu,\sigma^{2})이고 a, \ c \ (c \neq 0)상수이며, Y=a+cX라는 관계가 있으면 Y \sim N(a + c \mu,c^{2} \sigma^{2})과 같은 분포를 가진다.

타 분포와의 관계