본문 바로가기
Data Science/통계용어

통계용어 - 확률변수(random variable) :: Data 쿡북

by 쿡북 2017. 9. 8.

| 확률변수란?


일정한 확률을 갖고 발생하는 사건(event)[1]에 수치가 부여되는 변수. 일반적으로 대문자 

X로 나타낸다. 확률변수 X의 구체적인 값에 대해서는 보통 소문자를 사용해서, 예를 들어 X가 p의 확률로 x의 값을 가진다는 것은 P\left(X=x\right)=p 등의 확률함수로 표현할 수 있다.

보통 확률변수 X가 가질 수 있는 값의 범위가 이산적인지/연속적인지(셀 수 있는지/없는지)에 따라 이산확률변수(離散確率變數, discrete random variable)와 연속확률변수(連續確率變數, continuous random variable)로 나뉜다.
출처 : 나무위키 


다른 표현으로 보자

표본공간의 각 원소에 하나의 실수값을 대응 시키는 함수


예를 들어 설명하면,

동전을 던질 때 앞면을 H, 뒷면을 T 라고 할 경우 도전을 두번 던졌을 때의 표본 공간은 다음과 같다.

S = {HH, HT, TH, TT}


이렇게 표현하기보다 수리적으로 다루기 쉽게 하기 위해 숫자로 어떤 조건을 표현한다.

즉 앞면 출현 횟수가 중요할 경우 H 발생을 1로 정의하면 

HH 는 2

HT 는 1

TH 는 1

TT 는 0

의 확률변수로 정의가 된다. 


확률변수는 1개만 있는 것이 아니라 목적에 따라서 다양하게 정의될 수 있다. 


주사위와 같이 이산값(유한한 값)을 갖고 있으면 이산확률변수라 하고

키등과 같이 연속된(무한한 값)을 갖고 있으면 연속확률변수 라고 한다. 




댓글