본문 바로가기

Data Science29

통계용어 - 모수적, 비모수적 방법 :: Data 쿡북 수정이력 : | 배경통계를 통해서 우리가 확인하고 싶은것은 모집단(전체집단)의 특성이다.그러나 모집단은 어떤 경우 대상이 너무 클 뿐 아니라 신약의 경우 모든 사람에게 테스트 할 수 없기 때문에 적절하게 표본집단을 선택하고 어떤 가정을 통해 추론하게 된다. | 모수적 방법어떤 대상의 표본을 뽑아서 실험을 하게 되면 중요한 지표가 나오게 되는데, 그것이 평균, 표준편차, 분산이다.그런데 중심 극한 정리에 의해서 일정 수 이상(보통 30개)의 표본은 모집단의 분포가 연속형이든, 이산형이든, 한쪽으로 치우졌든 표본평균의 분포는 정규본포에 근접하게 된다.따라서 두 표본이 정규분포를 띈다고 가정한다면 이를 바탕으로 평균, 표준편차 비교등을 통해 집단간 차이를 밝혀낼 수 있다.이렇듯 정규성을 갖는다는 모수적 특징을.. 2017. 9. 9.
통계용어 - 자유도(degrees of freedom) :: Data 쿡북 | 자유도(degrees of freedom) 자유도(degrees of freedom)는 통계적 추정을 할 때 표본자료 중 모집단에 대한 정보를 주는 독립적인 자료의 수를 말한다. 크기가 n인 표본의 관측값({\displaystyle x_{1},x_{2},\dots ,x_{n}})의 자유도는 n-1이다(출처 : 위키피디아) 다시 표현해보자 A + B = 10 이라고 할때 A가 값이 정해지면 B는 선택의 여지 없이 정해진다. 즉 A가 자유도를 가지면 B는 자유도가 없다.따라서 관측값이 n 개가 있다고 할때 여기서의 자유도는 n-1 이 된다. 위키피디아의 예시를 다시한번 보자어떤 실험에서 4개 집단에 피험자들이 각 30명씩 무선배치되었을 때, 는?전체 자유도 집단내 자유도 집단간 자유도 2017. 9. 8.
통계용어 - 독립변수(Independent variable), 종속변수(Dependent variable) :: Data 쿡북 | 독립변수 란함수 관계에서, 다른 변수의 변화와는 관계없이 독립적으로 변화할 수 있는 변수 (출처 : google)- 연구자가 의도적으로 변화시키는 변수- 다른 변수의 영향을 받지 않는 변수- 종속 변수에 영향을 주는 변수 - 입력값 - 원인변수(Explanatory variable), 예측변수(Predictor variable) 이라고도 함 예) y=f(x) 일때 x y=f(x,y) 일 때 y | 종속변수 란 ↔ (독립변수)두 변수 중 한 변수의 값이 결정되는 데 따라 그 값이 결정되는 다른 변수. 함수 y=f(x)에 있어서, 독립 변수 x가 변하는 데 따라 변하는 y를 이름 (출처 : google)- 연구자가 독립변수의 변화에 따라 어떻게 변하는지 알고 싶어 하는 변수- 반응변수(Response v.. 2017. 9. 8.
통계용어 - 확률변수(random variable) :: Data 쿡북 | 확률변수란? 일정한 확률을 갖고 발생하는 사건(event)[1]에 수치가 부여되는 변수. 일반적으로 대문자 XX로 나타낸다. 확률변수 XX의 구체적인 값에 대해서는 보통 소문자를 사용해서, 예를 들어 XX가 pp의 확률로 xx의 값을 가진다는 것은 P\left(X=x\right)=pP(X=x)=p 등의 확률함수로 표현할 수 있다. 보통 확률변수 XX가 가질 수 있는 값의 범위가 이산적인지/연속적인지(셀 수 있는지/없는지)에 따라 이산확률변수(離散確率變數, discrete random variable)와 연속확률변수(連續確率變數, continuous random variable)로 나뉜다. 출처 : 나무위키 다른 표현으로 보자표본공간의 각 원소에 하나의 실수값을 대응 시키는 함수 예를 들어 설명하면,동.. 2017. 9. 8.