본문 바로가기
사회복지사1급/사회복지조사론

[사회복지조사론]표본설계 관련 용어 정리(모집단/요소/표집오차/분산 등)

by 정보덕보기 2021. 9. 19.
728x90
반응형

1. 표본설계 관련 용어

1) 모집단

: 연구자가 표본을 통해 찾아낸 사실을 일반화시키기 위한 전체집단

(요소들의 집합체, 요소들이 모여서 하나의 모집단을 이룬다.

이 요소들 중에 모집단을 대표할 단위를 선정하여 요소들을 뽑아낸다면 그 요소들을 각각 하나의 표본으로 취급한다.)

 

모수 - 모집단의 특성을 나타내는 수치(ex. 평균, 표준편차, 비율, 분산 등)

: 통계적 조사의 대상이 되는 집단 전체를 모집단이라고 한다. 이런 모집단의 특성을 나타내는 수치가 모수이다.

[네이버 지식백과] 모수 (수학백과, 2015.5)


통계량 - 표본의 특성을 나타내는 수치

표본조사는 표본을 통해 밝혀진 특성을

모집단에게 적용했을 때 일반화시키기 위한 조사라고 볼 수 있다.

여기서 표본이 가지고 있는 특성을 나타낸 수치가 통계량 인데

통계량과 모집단의 일반적 특성을 나타낸 모수의 분포가 비슷할수록,

표본은 모집단을 대표한다고 이해할 수 있다.

2) 요소

: 자료수집의 기본단위이자 분석의 기초가 되는 모집단을 구성하는 개별단위

(즉, 모집단에서 표본추출을 통해 모집단을 대표하게 된다면 이 요소들은 각각 하나의 표본이 된다.)

ex. 00고등학교 1학년 이라는 모집단이 있다면, 여기서 1학년을 구성하는 학생들 각각이 요소가 되고, 여기서 무작위표집 등을 통해 추출된 각 학생들이 1학년(모집단)을 대표하는 표본이 된다.

: 요소는 모집단의 선정 범위에 따라 개인, 집단, 조직, 지역 등의 집단적 단위(즉, 포괄적인 단위)들도 하나의 요소가 될 수 있다.

(ex. 부산의 각구의 인구분포를 파악한다고 했을 때, 부산은 모집단이 되고, 부산을 구성하는 각 금정구, 동래구 등의 구 단위는 각각의 요소가 된다.

3) 표본추출단위

: 모집단에서 표본을 추출하는 과정에서 표본이 될 가능성이 있는 요소

표본추출단계(과정)

모집단 선정
표본프레임 확보
표본추출방법 결정
표본크기 결정
표본추출 실시

표본프레임

: 표본추출을 위해 모집단을 전체 목록 리스트로 작성한 것

ex. ㅇㅇ노인복지관에서 지역주민의 욕구조사를 실시할 때, 지역주민의 전화번호나 주소를 활용하기 쉽게 리스트를 작성한다면 여기서 만들어진, 전화번호부와 주소록을 표본프레임이라 한다.

4) 표집간격

: 모집단으로부터 표본을 추출할 때, 추출되는 요소와 요소간의 간격

: 즉, 00 학교 1학년 학생 중 1명을 무작위 표집하고 그 후 3명 단위로 1,4,7 --- 나열 했을 때 1번과 4번, 4번과 7번 사이의 간격을 말함.

5) 표본의 대표성

: 말 그대로 표본이 모집단의 특성을 그대로 나타낼 수 있어야 한다는 것.

: 표본의 대표성이 높다는 말은, 그 만큼 표본의 특성을 나타내는 통계량과 모집단의 특성을 나타내는 모수 간에 분포가 전반적으로 유사하게 퍼져있다는 의미

6) 표집오차(샘플링 오차)

: 표본의 통계량과 모수 간의 분포가 차이가 나는 정도(→ 통계량과 모수의 분포차이)

: 이는 표본의 통계량에서 모집단의 모수를 추정하는 과정에서 발생하는 차이로 표본조사에서 발생하는데, 표본이 모집단을 대표하지 못할 수록 이는 더 커진다.

: 즉, 표본을 통해 알게된 특성을 가지고 모집단 전체의 특성을 예상해보는 과정 속에서 표본이 모집단의 특성을 대표하지 못하는 정도를 나타낸 값으로 볼 수 있다.


모집단모수를 추정하기 위하여, 표본에서 표본통계량을 구하였을 때, 추정대상인 모수와 표본통계량과의 차이이다. 즉 추정치(estimate)인 표본통계량의 값과 모수값과의 차이는 표집과정에서 발생한 것이기 때문이다. 이를 달리 표현하면, 표집오차는 추정량의 표집분포에서 변산에 해당한다. 예를 들어, 표본에서 구한 평균값과 모평균값과의 차이는 표집오차이다. 동시에 표집오차는 평균의 표집분포에서 변산에 해당한다.

[네이버 지식백과] 표집오차 [sampling error] (교육평가용어사전, 2004. 5. 31., 한국교육평가학회)


728x90


7) 비
표본오차 - 조사자의 실수 로 인해 생긴 오차

: 조사 개념의 규정 및 조사표 설계 등의 잘못으로 발생하거나, 기입 등 실사(實査) 단계 또는 집계·정리 단계의 잘못에 의해 발생하는 오차

: 즉, 조사 중에 조사자의 실수로 인해 발생한다.

: 잘못된 표본의 선택( 즉, 표본의 대표성이 낮은)으로 생기는 표본오차의 반대가 된다고 하고 비표본오차라고 명명되었다.


8) 표본오차(=표준편차) - 표본이 모집단을 대표하지 못해서 생기는 오차

: 모집단을 대표하지 못하는 잘못된 표본의 선택 으로 인해 생겨난 오차로서 모집단의 평균으로 부터 표본이 떨어져 있는 거리를 나타내는데 사용한다.

표준편차를 활용하는 이유?

: 보통 통계에서 보면 분산, 평균 보다는 표준편차를 자주 활용한다.

그 이유는 평균은 데이터의 이상값의 영향을 받아 데이터의 분포가 달라도 눈에 보이는 값은 같기 때문에 집단과 집단 간의 차이를 비교할 수 없다는 점에서 한계를 지니며,

(즉 모집단의 평균과 표본의 평균을 비교하기에는 제약)

분산의 경우에는 평균으로 부터 데이터(변량, 관찰값 등)가 떨어진 거리의 평균 즉, 편차를 제곱하여 나타냈기 때문에, 이 자체로는 변량의 분포값이 평균으로 부터 어느 정도차이가 있는지 가늠하기에는 불편한 감이 없지 않아 있다.

따라서, 이에 편차들의 평균의 제곱값(분산)을 제거하여 실제 데이터(변량)와 평균 간 거리의 평균, 즉 편차의 평균을 나타내는 표준편차를 활용하여 모수와 통계량 간에 어느 정도 분포 차이가 나고 있는가를 확인하는 것이다.

편차

: 평균값으로 부터 변량(관찰값 등을 포함한 데이터)이 떨어진 거리

분산

: 변량이 데이터로 부터 얼마나 떨어져 있는지 평균(편차의 평균)으로 알아보기 위해 변량을 모두 더한다면, -와 + 값이 모두 더해진 값은 0이 되고 만다. 따라서 이들 편차값을 제곱하여 평균으로 나타난 것이 분산이다.

: 하지만, 분산은 편차들의 평균을 제곱하여 나타낸 값이기 때문에, 실제 편차의 평균이 아니다. 따라서, 제곱값에 루트를 씌워 실제 편차들의 평균을 구한 것이 앞서 설명한 표본오차(=표준편차)이다.


9) 분편차

: 변량 전체를 크기 순서로 벌여 놓아 작은 쪽에서 1/4, 3/4인 위치에 있는 변량의 차이를 2로 나눈 값. 자료가 흩어져 있는 상태를 보여 준다.


10) 신뢰수준/ 신뢰구간

신뢰수준

: 표본이 모집단의 특성(모집단의 평균)을 반영하고 있는 정도를 의미한다.

: 사회과학에서는 95% 나 99%를 일반적으로 사용한다.

: 즉 신뢰수준이 99% 라면 모집단의 특성을 추정하고자 어떤 행위를100번 반복했을 때 99번은 같은 결과를 가져오고, 나머지 1번은 다른 결과를 가져올 정도로 반영하고 있다는 것.

ex. 총선에서 어떤 정치후보자의 지지율이 신뢰수준 95%에서 30%의 지지율을 보일 것이라 추정하며 표준오차는 ± 3 이라고 보았다.

여기서, 신뢰수준은 95% 이기 때문에 100번 정도 지지율 조사를 실시하면 그중 95번 정도는 27~33% 사이에서 지지율이 나올 것임을 신뢰할 수 있다는 것.

신뢰구간

: 이는 신뢰수준(95%, 99% 등)을 나타낸 범위에서 자신이 표본을 통해 추정한 모집단의 값이 무조건 나타날 것임을 확신하는 구간(폭)을 설정을 하였을 때, 이를 신뢰구간이라고 한다.

: 즉, 추정된 구간이 옳다는 것의 신뢰정도를 나타내는 구간(폭)으로 만일 신뢰수준 95% 에서 30% 지지율과 오차범위 ± 3을 주었다면, 95%의 구간 중에서 신뢰를 가지는 27~33%의 구간을 신뢰구간이라 한다.

정규분포곡선

: 좌우대칭의 종모양을 지닌다.

: 최빈값, 중위수, 산술평균이 한 점에 일치한다.

: 표준정규분포의 평균은 0이고, 표준편차는 1(여기서는 분산과 동일)이다.

: 표본의 대표성에 관한 유용한 정보를 제공한다.

: 정규분포의 모양은 평균과 표준편차에 의해 결정된다

--- 관련문제 --- 5

47. 신뢰수준에 관한 설명으로 옳은 것을 모두 고른 것은?

① ㄱ,ㄴ,ㄷ ② ㄱ,ㄴ,ㄹ

③ ㄱ,ㄷ,ㄹ ④ ㄴ,ㄷ,ㄹ

⑤ ㄱ,ㄴ,ㄷ,ㄹ

 


2. 표본조사의 장점과 단점

 

1) 장점


- 일부 표본을 대상으로 하기 때문에 비용과 시간이 절약

- 비표본오차(조사자의 실수로 인해 생기는 오차)를 줄여 정확도를 높임
(전수조사는 엄청 많은 표본을 상대하기 때문에 조사자의 집중력 저하나 코딩 실수 등으로인해 오차가 발생하기 쉽다.)
- 표본크기에 따라 정확한 결과를 얻을 수 있다.
- 관련 현상이 변화기전에 조사를 마칠 수 있다.

 

2) 단점


- 표본의 대표성을 갖추기가 어렵다.

- 모집단의 크기가 작다면 굳이 표본조사의 의미는 없다.

 

728x90
반응형

댓글