집 / 질병에 대하여/ 연구에 일반 인구는 어떤 경우에 있는가. 일반 모집단과 표본 모집단. 대표성의 개념

어떤 경우에 일반 인구가 연구에 참여합니까? 일반 모집단과 표본 모집단. 대표성의 개념

통계적 인구- 대중적 특성, 전형성, 질적 동질성 및 변이의 존재를 지닌 단위 집합입니다.

통계적 인구는 물질적으로 존재하는 개체(직원, 기업, 국가, 지역)로 구성되며 개체입니다.

인구의 단위— 통계적 모집단의 각 특정 단위.

동일한 통계적 모집단은 한 특성에서는 동질적일 수 있고 다른 특성에서는 이질적일 수 있습니다.

질적 균일성- 어떤 기준에서는 인구의 모든 단위가 유사하고 다른 모든 단위에서는 유사하지 않습니다.

통계적 모집단에서 한 모집단 단위와 다른 모집단 단위 사이의 차이는 종종 정량적 성격을 갖습니다. 특성값의 양적 변화 다른 단위집계를 변형이라고 합니다.

특성의 변형- 인구의 한 단위에서 다른 단위로 전환하는 동안 특성(양적 특성에 대한)의 양적 변화.

징후- 이것은 재산이다 특성또는 관찰되거나 측정될 수 있는 단위, 물체 및 현상의 다른 특성. 징후는 양적 징후와 질적 징후로 구분됩니다. 인구의 개별 단위에서 특성 값의 다양성과 가변성을 호출합니다. 변화.

속성적(질적) 특성은 숫자로 표현될 수 없습니다(성별 인구 구성). 정량적 특성은 숫자 표현(연령별 인구 구성).

색인- 이는 특정 시간과 장소의 조건 하에서 전체 단위 또는 집합체의 모든 속성의 일반화되는 양적 및 질적 특성입니다.

스코어카드연구 중인 현상을 종합적으로 반영하는 일련의 지표입니다.

예를 들어 급여를 연구합니다.

로그인 - 임금
통계적 인구 - 모든 직원
인구의 단위는 직원 1인입니다.
질적 동질성 - 발생임금
기호의 변형 - 일련의 숫자

인구 및 표본

기초는 하나 이상의 특성을 측정한 결과 얻은 데이터 집합입니다. 무작위 변수에 대한 수많은 관찰로 통계적으로 표현되는 실제로 관찰된 개체 집합은 다음과 같습니다. 견본 추출, 그리고 가설적으로 존재하는 (추측) - 일반 인구. 모집단은 유한할 수 있습니다(관찰 횟수 N = 불변) 또는 무한( 엔 =) 및 샘플 인구항상 제한된 일련의 관찰의 결과입니다. 표본을 구성하는 관측치의 수를 표본의 크기. 표본 크기가 충분히 큰 경우( n → 무한) 샘플이 고려됩니다 큰그렇지 않으면 샘플링이라고 합니다. 제한된 양. 샘플이 고려됩니다. 작은, 1차원 확률변수를 측정할 때 표본 크기가 30( N<= 30 ), 여러 개를 동시에 측정하는 경우( 케이) 다차원 관계 공간의 특징 N에게 케이초과하지 않습니다 10(n/k< 10) . 샘플 양식 변형 시리즈, 그 구성원이 다음과 같은 경우 순서통계, 즉 무작위 변수의 샘플 값 엑스오름차순 (순위)으로 정렬되며 특성 값을 호출합니다. 옵션.

예. 거의 동일한 무작위로 선택된 개체 세트(모스크바의 한 행정 구역에 있는 상업 은행)는 이 구역에 있는 모든 상업 은행의 일반 인구의 샘플로 간주될 수 있으며 모스크바의 모든 상업 은행의 일반 인구의 샘플로 간주될 수 있습니다. , 국가 상업 은행의 샘플 등

샘플링을 구성하는 기본 방법

통계적 결론의 신뢰성과 결과의 의미 있는 해석은 다음에 달려 있습니다. 대표성샘플, 즉 이 표본이 대표적인 것으로 간주될 수 있는 일반 인구의 속성 표현의 완전성과 적절성. 모집단의 통계적 특성에 대한 연구는 두 가지 방법으로 구성될 수 있습니다. 마디 없는그리고 연속적이지 않음. 지속적인 관찰모든 검사를 제공합니다. 단위공부했다 전체, ㅏ 부분적(선택적) 관찰- 일부만요.

표본 관찰을 구성하는 다섯 가지 주요 방법은 다음과 같습니다.

1. 단순 무작위 선택, 객체는 객체 모집단에서 무작위로 선택됩니다(예: 테이블 또는 난수 생성기를 사용하여). 가능한 각 샘플은 동일한 확률을 갖습니다. 이러한 샘플을 호출합니다. 실제로 무작위;

2. 일반적인 절차를 통한 간단한 선택기계적 구성 요소(예: 날짜, 요일, 아파트 번호, 알파벳 문자 등)를 사용하여 수행되며 이러한 방식으로 얻은 샘플을 호출합니다. 기계적인;

3. 계층화된선택은 볼륨의 일반 모집단이 볼륨의 하위 모집단 또는 레이어(지층)로 분할되어 . 계층은 통계적 특성 측면에서 동질적인 개체입니다(예: 인구는 연령 그룹이나 사회 계층에 따라 계층으로 구분되고 기업은 산업별로 구분됩니다). 이 경우 샘플이 호출됩니다. 계층화된(그렇지 않으면, 계층화된, 전형적인, 지역화된);

4. 방법 연속물선택은 형성에 사용됩니다 연속물또는 둥지 샘플. 한 번에 "블록"이나 일련의 개체(예: 상품 배치, 특정 시리즈의 제품 또는 국가 영토 및 행정 구역의 인구)를 조사해야 하는 경우 편리합니다. 시리즈 선택은 순전히 무작위로 또는 기계적으로 수행될 수 있습니다. 이 경우 특정 상품 배치 또는 전체 지역 단위(주거용 건물 또는 블록)에 대한 완전한 검사가 수행됩니다.

5. 결합된(단계적) 선택은 여러 선택 방법을 동시에 결합할 수 있습니다(예: 계층화 및 무작위 또는 무작위 및 기계적). 그러한 샘플이 호출됩니다. 결합된.

선택 유형

에 의해 정신개인, 그룹, 복합선택이 구분됩니다. ~에 개별 선택일반 모집단의 개별 단위가 표본 모집단으로 선택됩니다. 그룹 선택- 질적으로 동질적인 단위 그룹(시리즈) 결합 선택첫 번째 유형과 두 번째 유형의 조합이 포함됩니다.

에 의해 방법선택이 차별화된다 반복적이고 비반복적인견본.

반복 없음표본에 포함된 단위가 원래 모집단으로 돌아가지 않고 추가 선택에 참여하지 않는 것을 선택이라고 합니다. 반면 일반 인구의 단위 수는 N선택 과정에서 감소됩니다. ~에 반복선택 잡았다표본에서 등록 후 단위는 일반 대중에게 반환되므로 다른 단위와 함께 추가 선택 절차에 사용될 동등한 기회가 유지됩니다. 반면 일반 인구의 단위 수는 N변경되지 않은 상태로 유지됩니다(이 방법은 사회경제적 연구에서는 거의 사용되지 않음). 그러나, 큰 N (N → )에 대한 공식 반복 가능선택은 반복선택하고 후자가 실제로 더 자주 사용됩니다( N = 불변).

일반 모집단과 표본 모집단 매개변수의 기본 특성

연구의 통계적 결론은 무작위 변수의 분포와 관찰된 값을 기반으로 합니다. (x1,x2,...,xn)확률변수의 실현이라 불린다. 엑스(n은 표본 크기입니다). 일반 모집단에서 무작위 변수의 분포는 이론적이고 이상적인 성격을 띠고 있으며 그 샘플 유사체는 다음과 같습니다. 경험적분포. 일부 이론적 분포는 분석적으로 지정됩니다. 그들의 옵션확률 변수의 가능한 값 공간의 각 지점에서 분포 함수의 값을 결정합니다. 표본의 경우 분포함수를 결정하는 것이 어렵고 때로는 불가능합니다. 옵션경험적 데이터로부터 추정한 다음 이론적 분포를 설명하는 분석적 표현으로 대체합니다. 이 경우 가정(또는 가설) 분포 유형에 대한 정보는 통계적으로 정확하거나 오류가 있을 수 있습니다. 그러나 어떤 경우에도 표본에서 재구성된 경험적 분포는 실제 분포의 특징을 대략적으로만 나타냅니다. 가장 중요한 분포 매개변수는 다음과 같습니다. 기대값그리고 변화.

성격상 배포는 다음과 같습니다. 마디 없는그리고 이산적인. 가장 잘 알려진 연속 분포는 다음과 같습니다. 정상. 매개변수의 샘플 유사체는 평균값과 경험적 분산입니다. 사회경제적 연구에서 개별적인 것 중에서 가장 자주 사용되는 것은 대안(이분법)분포. 이 분포의 수학적 기대 매개변수는 상대값(또는 공유하다) 연구되는 특성을 가진 인구 단위 (문자로 표시됨) 이 특성을 갖지 않는 인구의 비율은 문자로 표시됩니다. q(q = 1 - p). 대체 분포의 분산도 경험적 유사성을 갖습니다.

분포 유형과 모집단 단위 선택 방법에 따라 분포 모수의 특성이 다르게 계산됩니다. 이론적 및 경험적 분포에 대한 주요 분포가 표에 나와 있습니다. 9.1.

표본분율 kn일반 모집단의 단위 수에 대한 표본 모집단의 단위 수의 비율을 다음과 같이 부릅니다.

kn = n/N.

표본분율 w연구되는 특성을 지닌 단위의 비율입니다. 엑스샘플 크기에 맞춰 N:

w = n n /n.

예. 1000개 단위를 포함하는 제품 배치에서 5% 샘플 포함 샘플 공유 k n절대값은 50단위입니다. (n = N*0.05); 이 샘플에서 결함이 있는 제품이 2개 발견되면 샘플 결함률 w 0.04(w = 2/50 = 0.04 또는 4%)가 됩니다.

표본 모집단은 일반 모집단과 다르기 때문에 샘플링 오류.

표 9.1 일반 모집단과 표본 모집단의 주요 매개변수

샘플링 오류

어떤 경우든(지속적 및 선택적) 등록 및 대표성이라는 두 가지 유형의 오류가 발생할 수 있습니다. 오류 등록가질 수 있다 무작위의그리고 체계적인성격. 무작위의오류는 통제할 수 없는 다양한 원인으로 구성되며, 의도하지 않은 것이며 일반적으로 서로 균형을 이룹니다(예: 실내 온도 변화로 인한 장치 성능의 변화).

체계적인오류는 샘플 개체 선택 규칙을 위반하기 때문에 편향됩니다(예: 측정 장치의 설정을 변경할 때 측정 편차).

예.도시 인구의 사회적 상황을 평가하기 위해 가족의 25%를 조사할 계획이다. 네 번째 아파트마다 아파트 수를 기준으로 선택하는 경우 한 가지 유형(예: 원룸 아파트)의 아파트만 모두 선택하면 체계적인 오류가 발생하고 결과가 왜곡될 위험이 있습니다. 오류는 무작위로 발생하므로 아파트 번호를 추첨으로 선택하는 것이 더 바람직합니다.

대표성 오류이는 표본 관찰에만 내재되어 있으며 피할 수 없으며 표본 모집단이 일반 모집단을 완전히 재현하지 못한다는 사실의 결과로 발생합니다. 표본에서 얻은 지표의 값은 일반 모집단의 동일한 값(또는 지속적인 관찰을 통해 얻은) 지표와 다릅니다.

샘플링 편향모집단의 모수 값과 표본 값의 차이입니다. 정량적 특성의 평균값은 다음과 같습니다. , 점유율(대체 특성) - .

샘플링 오류는 샘플 관찰에만 내재되어 있습니다. 이러한 오류가 클수록 경험적 분포는 이론적 분포와 더 많이 다릅니다. 경험적 분포의 매개 변수는 확률 변수이므로 샘플링 오류도 확률 변수이며 표본마다 다른 값을 취할 수 있으므로 계산하는 것이 일반적입니다. 평균 오류.

평균 샘플링 오류수학적 기대치로부터 표본 평균의 표준 편차를 나타내는 양입니다. 무작위 선택의 원칙에 따라 이 값은 주로 표본 크기와 특성의 변동 정도에 따라 달라집니다. 특성의 변동(따라서 값)이 크고 작을수록 평균 샘플링 오류는 작아집니다. . 일반 모집단과 표본 모집단의 분산 간의 관계는 다음 공식으로 표현됩니다.

저것들. 충분히 크면 이라고 가정할 수 있습니다. 평균 표본 추출 오류는 일반 모집단 모수와 표본 모집단 모수의 가능한 편차를 보여줍니다. 테이블에 표 9.2는 관찰을 구성하는 다양한 방법에 대한 평균 샘플링 오류를 계산하는 수식을 보여줍니다.

표 9.2 표본 평균의 평균 오차(m)와 다양한 표본 유형에 대한 비율

연속 속성에 대한 그룹 내 표본 분산의 평균은 어디에 있습니까?

비율의 그룹 내 분산 평균.

— 선택된 시리즈의 수 — 시리즈의 총 수

번째 계열의 평균은 어디에 있습니까?

- 연속 특성에 대한 전체 표본 모집단의 전체 평균;

번째 시리즈의 특성 점유율은 어디에 있습니까?

— 전체 표본 모집단에 대한 특성의 총 점유율.

그러나 평균 오류의 크기는 특정 확률 P(P ≤ 1)로만 판단할 수 있습니다. 리아푸노프 A.M. 일반 모집단이 유한한 평균과 제한된 분산을 갖는다면 표본 평균의 분포와 그에 따른 일반 평균으로부터의 편차는 충분히 큰 수에 대해 대략 정규 분포 법칙을 따른다는 것을 증명했습니다.

수학적으로 평균에 대한 이 설명은 다음과 같이 표현됩니다.

공유의 경우 식 (1)은 다음과 같은 형식을 취합니다.

어디 - 있다 한계 샘플링 오류, 이는 평균 샘플링 오류의 배수입니다. , 다중성 계수는 W.S.가 제안한 학생 기준("신뢰 계수")입니다. Gosset(가명 "학생"); 다양한 표본 크기에 대한 값은 특수 테이블에 저장됩니다.

t의 일부 값에 대한 함수 Ф(t)의 값은 다음과 같습니다.

따라서 식 (3)은 다음과 같이 읽을 수 있습니다. P = 0.683(68.3%)표본평균과 일반평균의 차이는 평균오차의 한 값을 초과하지 않을 것이라고 주장할 수 있다. m(티=1), 확률적으로 P = 0.954(95.4%)- 두 개의 평균 오류 값을 초과하지 않을 것 m (t = 2) ,확률적으로 P = 0.997(99.7%)- 3개 값을 초과하지 않습니다. m (t = 3) .따라서 이 차이가 평균 오류의 3배를 초과할 확률은 다음과 같이 결정됩니다. 오류 수준그리고 그 이상은 아니다 0,3% .

테이블에 9.3은 최대 샘플링 오류를 계산하는 공식을 보여줍니다.

표 9.3 다양한 유형의 표본 관찰에 대한 평균 및 비율(p)에 대한 표본의 한계 오차(D)

모집단에 대한 표본 결과의 일반화

표본 관찰의 궁극적인 목표는 일반 모집단의 특성을 파악하는 것입니다. 표본 크기가 작을 경우 매개변수( 및 )의 경험적 추정치는 실제 값( 및 )에서 크게 벗어날 수 있습니다. 따라서 매개변수( 및 )의 표본값에 대해 참값( 및 )이 놓이는 경계를 설정할 필요가 있습니다.

신뢰 구간일반 모집단의 매개변수 θ 중 이 매개변수 값의 무작위 범위는 1에 가까운 확률로( 신뢰할 수 있음)에는 이 매개변수의 실제 값이 포함되어 있습니다.

한계 오류견본 Δ 일반 인구의 특성과 그 특성의 제한 값을 결정할 수 있습니다. 신뢰 구간, 이는 동일합니다:

결론 신뢰 구간뺄셈으로 얻은 최대 오류표본 평균(점유율)에서 상위 값을 추가합니다.

신뢰 구간평균의 경우 최대 샘플링 오류를 사용하고 주어진 신뢰도 수준은 다음 공식에 의해 결정됩니다.

즉, 주어진 확률로 아르 자형, 이는 신뢰 수준이라고 하며 값에 의해 고유하게 결정됩니다. 티, 평균의 실제 값은 다음 범위에 있다고 주장할 수 있습니다. , 그리고 주식의 실제 가치는 다음 범위에 있습니다.

세 가지 표준 신뢰 수준에 대한 신뢰 구간을 계산할 때 P = 95%, P = 99% 및 P = 99.9%값은 에 의해 선택됩니다. 자유도 수에 따라 적용됩니다. 표본 크기가 충분히 크면 이러한 확률에 해당하는 값 티같다: 1,96, 2,58 그리고 3,29 . 따라서 한계 샘플링 오류를 통해 모집단 특성의 제한 값과 신뢰 구간을 결정할 수 있습니다.

사회 경제적 연구에서 일반 인구에 대한 표본 관찰 결과의 분포는 모든 유형과 그룹의 완전한 대표가 필요하기 때문에 고유한 특성을 가지고 있습니다. 그러한 배포 가능성의 기초는 계산입니다. 상대오차:

어디 Δ % - 상대 최대 샘플링 오류; , .

표본 관찰을 모집단으로 확장하는 두 가지 주요 방법이 있습니다. 직접 재계산 및 계수 방법.

본질 직접 변환표본 평균!!\overline(x)에 모집단의 크기를 곱하는 것으로 구성됩니다.

예. 그 도시의 평균 유아 수를 표본 추출 방법으로 추정하여 1명으로 계산합니다. 도시에 1000명의 젊은 가족이 있는 경우, 시립 보육원에 필요한 장소 수는 이 평균에 일반 인구 N = 1000의 규모를 곱하여 구합니다. 즉, 1200석을 차지하게 됩니다.

확률 방식연속 관찰의 데이터를 명확히 하기 위해 선택적 관찰을 하는 경우에 사용하는 것이 좋습니다.

다음 공식이 사용됩니다.

여기서 모든 변수는 인구 규모입니다.

필요한 샘플 크기

표 9.4 다양한 유형의 표본 관찰 조직에 필요한 표본 크기(n)

미리 결정된 허용 샘플링 오차 값으로 샘플 관찰을 계획할 때 필요한 오차를 정확하게 추정하는 것이 필요합니다. 표본의 크기. 이 볼륨은 오류 수준의 허용 가능한 값을 보장하는 주어진 확률을 기반으로 샘플 관찰 중 허용되는 오류를 기반으로 결정될 수 있습니다(관찰 구성 방법 고려). 필요한 샘플 크기 n을 결정하는 공식은 최대 샘플링 오류에 대한 공식에서 직접 쉽게 얻을 수 있습니다. 따라서 한계 오류에 대한 표현식에서 다음과 같습니다.

표본 크기는 직접 결정됩니다. N:

이 공식은 최대 샘플링 오류가 감소함에 따라 Δ 필요한 표본 크기는 크게 증가하며 이는 스튜던트 t 검정의 분산과 제곱에 비례합니다.

관찰을 구성하는 특정 방법의 경우 필요한 표본 크기는 표에 제공된 공식에 따라 계산됩니다. 9.4.

실제 계산 예

예 1. 연속 정량적 특성에 대한 평균값 및 신뢰 구간 계산.

채권자와의 결제 속도를 평가하기 위해 은행에서 10개의 결제 문서에 대한 무작위 샘플을 실시했습니다. 그들의 값은 (일수) : 10과 같습니다. 삼; 15; 15; 22; 7; 8; 1; 19; 20.

확률적으로 필요함 P = 0.954한계 오차를 결정하다 Δ 평균 계산 시간의 샘플 평균 및 신뢰 한계.

해결책.평균값은 표의 공식을 사용하여 계산됩니다. 9.1 표본 집단의 경우

분산은 표의 공식을 사용하여 계산됩니다. 9.1.

오늘의 평균 제곱 오차입니다.

평균 오류는 다음 공식을 사용하여 계산됩니다.

저것들. 평균은 x ± m = 12.0 ± 2.3일.

평균의 신뢰도는 이랬다.

표의 공식을 사용하여 최대 오류를 계산합니다. 9.3 반복 샘플링의 경우 모집단 규모를 알 수 없으므로 P = 0.954자신감 수준.

따라서 평균값은 `x ± D = `x ± 2m = 12.0 ± 4.6입니다. 즉 실제 값은 7.4~16.6일 범위에 있습니다.

학생의 t-테이블을 사용합니다. 응용 프로그램을 통해 n = 10 - 1 = 9 자유도에 대해 얻은 값은 £ 0.001의 유의 수준으로 신뢰할 수 있다는 결론을 내릴 수 있습니다. 결과 평균값은 0과 크게 다릅니다.

예시 2. 확률 추정(일반 점유율) p.

1000가구의 사회적 지위를 기계적으로 조사한 결과, 저소득 가구의 비율은 w = 0.3(30%)(샘플은 2% , 즉. n/N = 0.02). 신뢰도 수준에 필수 p = 0.997지표를 결정하다 아르 자형지역 전체의 저소득층 가족.

해결책.제시된 기능 값을 기반으로 Ф(t)주어진 신뢰도 수준 찾기 P = 0.997의미 티 = 3(공식 3 참조) 분수의 한계오차 승표의 공식으로 결정하십시오. 9.3 비반복 샘플링의 경우(기계적 샘플링은 항상 비반복적임):

최대 상대 샘플링 오류 % 될거야:

지역 내 저소득층 가구의 확률(일반 점유율)은 다음과 같습니다. р=w±Δw, 신뢰한계 p는 이중 부등식을 기반으로 계산됩니다.

w — Δ w ≤ p ≤ w — Δ w, 즉. p의 실제 값은 다음에 있습니다.

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

따라서 0.997의 확률로 지역 내 전체 가구 중 저소득층 가구의 비율이 28.6%에서 31.4% 범위에 있다고 말할 수 있다.

예시 3.구간 계열로 지정된 이산 특성에 대한 평균값 및 신뢰 구간을 계산합니다.

테이블에 9.5. 기업의 구현시기에 따라 주문 생산을위한 응용 프로그램 배포가 지정됩니다.

표 9.5 출현 시점별 관찰 분포

해결책. 주문 완료에 소요되는 평균 시간은 다음 공식을 사용하여 계산됩니다.

평균 기간은 다음과 같습니다.

= (3*20 + 9*80 + 24*60 + 48*20 + 72*20)/200 = 23.1개월.

테이블의 두 번째 열에서 p i에 대한 데이터를 사용하면 동일한 답을 얻습니다. 9.5, 다음 공식을 사용합니다.

마지막 그라데이션 간격의 중간은 이전 그라데이션 간격의 너비인 60 - 36 = 24개월을 인위적으로 보완하여 구합니다.

분산은 다음 공식을 사용하여 계산됩니다.

어디 x 나는- 간격 시리즈의 중간.

그러므로!!\sigma = \frac (20^2 + 14^2 + 1 + 25^2 + 49^2)(4)이고 평균 제곱 오차는 입니다.

평균 오류는 월별 공식을 사용하여 계산됩니다. 평균값은 !!\overline(x) ± m = 23.1 ± 13.4입니다.

표의 공식을 사용하여 최대 오류를 계산합니다. 반복 선택의 경우 9.3(인구 규모를 알 수 없으므로 신뢰 수준 0.954):

따라서 평균은 다음과 같습니다.

저것들. 실제 값은 0~50개월 범위에 있습니다.

예시 4.상업은행에서 N=500개 법인기업의 채권자와의 결제속도를 알아보기 위해서는 무작위 비반복선택방법을 이용한 표본연구를 실시할 필요가 있다. 시험 추정 결과 표준 편차 s가 10일인 경우 확률 P = 0.954에서 표본 평균의 오차가 3일을 초과하지 않도록 필요한 표본 크기 n을 결정합니다.

해결책. 필요한 연구 수 n을 결정하기 위해 표에서 비반복 선택 공식을 사용합니다. 9.4:

여기서 t 값은 P = 0.954의 신뢰 수준에서 결정됩니다. 2와 같습니다. 평균 제곱값은 s = 10이고 모집단 크기는 N = 500이며 평균의 최대 오차는 다음과 같습니다. Δ x = 3. 이 값을 공식에 대입하면 다음과 같은 결과를 얻습니다.

저것들. 필요한 매개변수, 즉 채권자와의 합의 속도를 추정하려면 41개 기업의 샘플을 수집하는 것으로 충분합니다.

연구는 일반적으로 사실에 대한 테스트가 필요한 몇 가지 가정으로 시작됩니다. 이 가정(가설)은 특정 개체 집합의 현상이나 속성의 연결과 관련하여 공식화됩니다. 이러한 가정을 사실과 비교하여 테스트하려면 해당 가정의 해당 속성을 측정해야 합니다. 그러나 예를 들어 모든 청소년의 불안을 측정하는 것은 불가능합니다. 따라서 연구를 수행할 때 관련 인구 집단을 대표하는 상대적으로 작은 그룹으로만 제한됩니다.

인구-이것은 연구 가설이 수립되는 것과 관련된 전체 개체 집합입니다. 이론적으로 인구의 규모는 무제한이라고 믿어집니다. 실제로 일반 인구의 규모는 항상 제한되어 있으며 관찰 주제와 심리학자가 해결해야 하는 작업에 따라 달라질 수 있습니다. 일반적으로 일반 인구에는 대학생, 학생, 기업 직원, 연금 수령자 등 매우 많은 수의 개체가 포함됩니다. 일반 인구에 대한 완전한 연구는 극히 어렵기 때문에 일반적으로 표본 인구 또는 표본이라고 하는 일반 인구의 작은 부분을 연구합니다.

샘플링 -이것은 속성을 연구하기 위해 일반 인구 중에서 특별히 선택된 제한된 수의 개체(심리학-피험자, 응답자)입니다. 따라서 표본을 이용하여 모집단의 특성을 연구하는 것을 표본추출연구라고 한다. 거의 모든 심리학 연구는 선택적이며 그 결론은 일반 인구에게 적용됩니다.

주로 연구의 목표와 목표에 따라 결정되는 여러 필수 요구 사항이 샘플에 적용됩니다. 표본 연구 결과의 일반화, 즉 일반화, 일반 인구로의 확장이 정당화되어야 합니다.

샘플은 다음 조건을 충족해야 합니다.

1. 연구에 사용할 수 있는 개체 그룹입니다. 표본 크기는 관찰과 실험의 작업과 능력에 따라 결정됩니다.

2. 미리 지정된 인구의 일부입니다.

3. 이는 모집단의 모든 항목이 표본에 포함될 확률이 동일하도록 무작위로 선택된 그룹입니다.

연구 결과의 타당성에 대한 주요 기준은 표본의 대표성과 (경험적) 결과의 통계적 신뢰성입니다.

대표성 -즉, 대표성은 특정 정확성과 충분한 신뢰성으로 해당 모집단의 특성을 분석하는 능력입니다. 피험자 표본이 그 특성상 일반 인구를 대표한다면 연구에서 얻은 결과를 일반 인구 전체로 확장할 이유가 있습니다.

이상적으로, 대표 표본은 심리학자가 연구한 각 주요 특성, 특성, 성격 특성 등이 일반 인구의 동일한 특성에 비례하여 표현되도록 해야 합니다.

대표성 오류는 두 가지 경우에 발생합니다.

1. 일반 인구를 특징짓는 작은 표본입니다.

2. 표본의 속성(매개변수)과 일반 모집단의 매개변수 간의 불일치.

통계 학적으로 유의연구 결과의 통계적 유의성은 통계적 추론 방법을 사용하여 결정됩니다. 이러한 방법은 "가설 테스트" 주제에서 더 자세히 논의됩니다. 표본의 크기나 크기에 대해 특정 요구 사항을 부과한다는 점에 유의하십시오.

진단 기술을 개발할 때는 200명에서 1000~2500명까지 가장 큰 표본 크기가 필요합니다.

2개의 샘플을 비교해야 하는 경우 총 인원은 50명 이상이어야 합니다. 비교되는 샘플의 수는 대략 동일해야 합니다.

부동산 간의 관계를 연구하는 경우 표본 크기는 최소 30~35명이어야 합니다.

연구되는 특성의 변동성이 클수록 표본 크기도 커져야 합니다. 따라서 성별, 연령 등에 따라 표본의 동질성을 높이면 변동성을 줄일 수 있습니다. 이는 자연스럽게 결론을 일반화할 가능성을 감소시킵니다.

종속 및 독립 표본.일반적인 연구 상황은 추가 비교를 목적으로 연구자가 관심 있는 속성을 두 개 이상의 샘플에 대해 연구하는 경우입니다. 이러한 샘플은 조직의 절차에 따라 비율이 다를 수 있습니다. 독립 표본은 한 표본에서 임의의 대상을 선택할 확률이 다른 표본에서 임의의 대상을 선택하는 것과 무관하다는 사실이 특징입니다. 반대로, 종속 표본은 한 표본의 각 피험자가 특정 기준에 따라 다른 표본의 피험자와 일치한다는 사실이 특징입니다.

독립표본의 가장 대표적인 예는 지능 측면에서 남성과 여성을 비교하는 것이다.

대표성의 개념. 개념적 객체와 인구. 디자인된 개체입니다. 설계 및 실제 인구.

우리는 사회학이 삶의 유동적 직접성을 다루는 것이 아니라, 특징 공간의 특정 규칙에 따라 구성된 데이터를 다룬다는 것을 알고 있습니다. 데이터란 연구 단위(객체)에 할당된 변수의 값을 의미합니다. 커뮤니티, 기관, 사람, 텍스트, 사물 등 이러한 개체는 속성 공간에서 다양하고 종종 기괴한 구성을 형성하여 연구자가 현실에 대해 일반화된 판단을 내릴 수 있는 기회를 제공합니다.

현실에 대해 이야기하자마자 얻은 데이터는 엄밀히 말하면 등록 문서(설문지, 인터뷰 양식, 관찰 프로토콜 등)에만 관련된다는 것이 밝혀졌습니다. 실험실 창 밖의 현실(예: 저울 반대편)이 다르지 않을 것이라는 보장은 없습니다. 아직 샘플링 절차에 도달하지 않았지만 데이터의 대표성에 대한 질문이 이미 제기되었습니다. 설문 조사 중에 얻은 정보를 특정 경험 외부에 있는 개체로 확장할 수 있습니까? 대답은 분명합니다. 할 수 있습니다. 그렇지 않으면 우리의 관찰은 지금 여기 전체를 넘어서지 못할 것입니다. 그들은 모스크바 사람들에게 적용되지 않고 모스크바에서 방금 전화 인터뷰를 한 사람들에게 적용됩니다. Nedelya 신문의 독자가 아니라 완성된 분리 쿠폰을 편집자에게 우편으로 보낸 사람들에게. 설문 조사를 마친 후 우리는 "Muscovites"와 "독자"가 모두 동일하게 유지되었다고 가정해야 합니다. 과학적 관찰이 놀라운 불변성을 보여주기 때문에 우리는 세계의 안정성을 믿습니다.

단일 관찰은 더 넓은 관찰 분야로 확장되며 표현의 문제는 조사 대상 인구의 매개변수와 대상의 "실제" 특성 간의 일치 정도를 설정하는 것입니다. 샘플링 절차는 개별 순간 관찰을 통해 실제 연구 대상과 일반 인구를 정확하게 재구성하기 위한 것입니다.

표본 대표성의 개념은 외부 타당도의 개념에 가깝습니다. 첫 번째 경우에만 동일한 특성을 더 넓은 단위 세트로 추정하고 두 번째 경우에는 하나의 의미 컨텍스트에서 다른 의미 컨텍스트로 전환합니다. 샘플링 절차는 각 사람에 의해 하루에 천 번 수행되며 실제로 관찰의 대표성에 대해 생각하는 사람은 없습니다. 경험이 계산을 대체합니다. 죽이 잘 소금에 절였는지 확인하려면 팬 전체를 먹을 필요가 전혀 없습니다. 여기에서는 즉석 검사를 포함하여 비파괴 검사 방법이 더 효과적입니다. 한 숟가락을 시도해야합니다. 동시에 죽이 잘 섞였는지 확인해야 합니다. 죽이 잘 섞이지 않은 경우 한 번 측정하는 것이 아니라 일련의 측정, 즉 팬의 다른 위치에서 시도하는 것이 합리적입니다. 이것은 이미 샘플입니다. 시험에 대한 학생의 답변이 학생의 지식을 나타내는지, 무작위 성공이나 실패가 아닌지 확인하는 것이 더 어렵습니다. 이를 위해 몇 가지 질문이 필요합니다. 학생이 특정 주제에 대해 가능한 모든 질문에 대답하면 결과는 "참", 즉 실제 지식을 반영한다고 가정됩니다. 하지만 그렇게 되면 누구도 시험에 합격할 수 없습니다.

샘플링 절차의 기본은 항상 "if"입니다. 즉, 관찰 결과를 외삽해도 얻은 결과가 크게 변경되지 않는다는 가정입니다. 따라서 모집단은 표본 모집단의 “객관적 가능성”으로 정의할 수 있습니다.

연구 대상이 의미하는 바를 이해하면 문제는 다소 복잡해집니다. 상당히 많은 인구를 연구한 사회학자는 "급진주의-보수주의" 변수가 연령과 양의 상관관계가 있다는 결론에 도달했습니다. 특히 노년층은 혁명적 세대보다 보수적입니다. 그러나 조사 대상인 표본 모집단은 실제로는 존재하지 않습니다. 응답자를 선정하고 인터뷰를 진행하는 절차에 의해 구성되며, 즉시 사라지고 배열에 용해됩니다. 실제로 데이터가 직접 "제거"되는 표본 모집단은 절차에 의해 생성되지만 동시에 더 큰 모집단으로 용해되어 다양한 수준의 정확성과 신뢰성을 나타내거나 나타냅니다. 사회학적 결론은 지난주에 조사된 응답자에게 적용되는 것이 아니라 이상화된 대상, 즉 "기성세대", "청년", "급진주의" 또는 "보수주의"를 보이는 사람들에게 적용됩니다. 우리는 시공간적 상황에 의해 제한되지 않는 범주형 일반화에 대해 이야기하고 있습니다. 이런 점에서 선별적 절차는 관찰에서 벗어나 아이디어의 세계로 나아가는 데 도움이 된다.

따라서 우리는 연구 대상과 일반 인구를 구별할 수 있는 기회를 갖게 됩니다. 대상은 단순한 단위 모음이 아니라 연구 단위의 식별 및 선택이 수행되는 개념입니다. 이런 점에서, 자신의 개념에 상응하는 존재만을 참으로 고려하라는 헤겔의 명령은 옳다. 이론적으로 연구 대상을 나타내는 개념의 양은 일반 인구의 양과 일치해야 합니다. 그러나 그러한 서신은 극히 드물게 이루어집니다.

개념이 필요하겠습니다 개념적 객체 -주제의 틀을 나타내는 이상적인 구성. "러시아인", "중앙 신문 독자", "유권자", "민주적 대중"- 이들은 사회 학자들의 연구 관심 분야의 전형적인 대상입니다. 의심할 바 없이, 완전히 실제적인 일반 인구는 개념적 대상에 해당해야 합니다. 이를 위해서는 또 다른 연구 대상을 제공해야 합니다. 디자인된 개체.설계된 개체는 연구자가 사용할 수 있는 단위 집합입니다. 문제는 데이터 수집을 위해 접근할 수 없거나 접근하기 어려운 그룹을 식별하는 것입니다.

“러시아인”으로 지정된 개체를 조사하는 것은 거의 불가능하다는 것은 분명합니다. 러시아인 중에는 감옥, 노동교화소, 미결구치소 등 면접관이 접근하기 어려운 곳에 있는 사람이 많다. 이 그룹은 설계된 개체에서 "제외"되어야 합니다. 정신병원에 입원한 많은 환자와 어린이, 일부 노인들도 '뺄셈'을 해야 할 것이다. 민간 사회학자가 군인이 표본에 포함될 수 있는 일반적인 기회를 제공할 수 있을 것 같지 않습니다. 독자, 유권자, 소도시 주민, 극장 방문객을 대상으로 한 설문조사에서도 비슷한 문제가 발생합니다.

나열된 어려움은 사회학자가 연구 현장 단계에서 직면하는 극복할 수 없는 장애물 중 일부일 뿐입니다. 전문가는 이러한 어려움을 예상해야 하며 설계된 개체의 완전한 구현에 대한 환상을 만들어서는 안 됩니다. 그렇지 않으면 그는 실망할 것이다.

따라서 지역 지도가 지역 자체와 일치하지 않는 것과 마찬가지로 연구 대상은 일반 인구와 일치하지 않습니다.

우리는 오랫동안 생각하고 고민했습니다. 장군들은 큰 종이에 모든 것을 썼습니다. 서류상으로는 매끄러웠지만 그들은 계곡을 잊어버리고 그 길을 따라 걸었습니다.

아파트에서 아파트까지 걸어가야 한다는 점을 고려하면, 늙은 군인의 노래에 나오는 이 가사는 샘플 디자인에 꽤 적용 가능합니다.

물론 모집단은 단위가 표본으로 추출되는 모집단입니다. 그러나 그것은 단지 그렇게 보인다. 표본은 실제 응답자가 선정되는 모집단에서 추출됩니다. 그녀에게 전화하자 진짜.예상인구와 실제인구의 차이는 '예상' 응답자 목록과 실제 인터뷰한 응답자를 비교하면 직접 확인할 수 있다.

실제 목적은 1차 사회학적 정보의 가용성 한계를 고려하여 현장 조사 단계에서 형성된 총체입니다. 수감자, 군인 및 환자 외에도 교통 통신에서 멀리 떨어진 마을 주민들은 표본에 포함될 가능성이 적습니다. 특히 조사가 가을에 수행되는 경우에는 더욱 그렇습니다. 원칙적으로 집에없고 낯선 사람과 이야기하는 경향이없는 사람 등. 면접관은 통제력 부족을 이용하여 직무를 정확하게 수행하지 않고 인터뷰해야 할 사람이 아닌 사람을 인터뷰하는 경우가 발생합니다. 지시에 따라 인터뷰했지만 "얻기"가 더 쉬운 사람들. 예를 들어, 면접관은 집에서 응답자를 찾기 쉬운 저녁 시간에 응답자의 아파트를 방문하라는 명령을 받았습니다. 예를 들어 연구가 11월에 수행된다면 러시아 중부에서는 저녁 5시에 거리가 완전히 어두워집니다. 많은 도시에서는 거리 이름과 집 번호가 적힌 표지판을 흔히 볼 수 없습니다. 면접관의 업무가 지역 교육 기관의 학생들에 의해 수행된다면, 실제 사물이 설계된 사물과 어느 정도 차이가 나는지 상상할 수 있습니다. 때로는 연구자들이 더 간단하게 설문지를 작성하는 경우도 있습니다. 이러한 어려움은 소위 샘플링 편향의 원인 중 하나입니다.

설문지 완성을 제어하는 매우 효과적인 방법과 샘플 복구 방법, 특히 응답자의 주요 유형 그룹을 "가중"하는 방법이 있습니다. 누락 된 그룹은 증가하고 초과 그룹은 감소합니다. 이런 방식으로 실제 배열이 설계된 배열에 맞게 조정되며 이는 상당히 타당합니다.

http://www.hi-edu.ru/e-books/xbook096/01/index.html?part-011.htm– 매우 유용한 사이트!

연구의 샘플링 방법은 주요 통계 방법입니다. 연구되는 대상의 양은 일반적으로 무한하기 때문에 이것은 자연스러운 일입니다(그리고 유한하더라도 모든 대상을 분류하는 것은 매우 어렵습니다. 그중 일부, 즉 선택만으로 만족해야 합니다).

일반 모집단과 표본 모집단

일반 모집단은 주어진 실험에서 연구된 모든 요소의 총합입니다.

표본 모집단(또는 표본)은 모집단에서 무작위로 선택된 개체의 유한한 모음입니다.

모집단(표본 또는 일반)의 부피는 이 모집단에 있는 객체의 수입니다.

일반 모집단과 표본 모집단의 예

황금 비율과 관련하여 특정 세그먼트를 나누는 사람의 심리적 성향을 연구한다고 가정해 보겠습니다. 황금 분할 개념의 기원은 인체의 인체 측정법에 의해 결정되므로 이 경우 일반 인구는 신체적 성숙에 도달하고 최종 비율, 즉 전체를 획득한 인위적 생물이라는 것이 분명합니다. 인류의 성인 부분. 이 컬렉션의 양은 사실상 무한합니다.

이 경향이 예술적 환경에서만 연구된다면 일반 인구는 예술가, 건축가, 디자이너 등 디자인과 직접 관련된 사람들입니다. 그런 사람들도 많이 있고, 이 경우 일반 인구의 규모도 무한하다고 가정할 수 있습니다.

두 경우 모두, 연구를 위해 우리는 합리적인 표본 크기로 제한해야 하며, 기술 전문 분야 학생(예술계와는 거리가 먼 사람) 또는 디자인 학생(예술계와 직접적으로 관련된 사람)을 대표로 선택해야 합니다. 세계 예술적 이미지).

대표성

표본추출 방법의 가장 큰 문제점은 일반 모집단에서 연구 대상으로 선정된 대상이 일반 모집단의 연구 특성을 얼마나 정확하게 나타내는가 하는 문제, 즉 표본의 대표성에 대한 문제이다.

따라서 표본이 일반 모집단의 양적 관계를 충분히 정확하게 나타내는 경우 표본을 대표성이라고 합니다.

물론 모호한 표현 뒤에 무엇이 숨겨져 있는지 정확히 말하기는 어렵습니다. 꽤 정확하게. 대표성 문제는 일반적으로 모든 실험 연구에서 가장 논란의 여지가 있습니다. 표본의 대표성이 부족하여 실험자가 터무니없는 결과를 얻은 경우 이미 고전이 된 많은 예가 있습니다.

일반적으로 대표성 문제는 과학계가 연구의 정확성에 관해 권위 있는 전문가 집단의 관점을 받아들일 때 전문가 평가를 통해 해결됩니다.

대표성 예시

세그먼트를 나누는 예로 돌아가 보겠습니다. 샘플의 대표성 문제는 여기 연구의 기초에 있습니다. 어떠한 경우에도 예술적 환경에 속하는 주제 그룹을 혼합해서는 안됩니다.

관찰된 특성의 통계적 분포

관찰된 값의 빈도

볼륨의 샘플에서 테스트한 결과, 관찰된 속성이 값,,...을 취하고, 값이 한 번 관찰되고, 값이 한 번 관찰되고, 값이 한 번 관찰되었습니다. 그러면 관찰된 값의 빈도를 숫자라고 하고, 값을 숫자라고 합니다.

관측된 값의 상대 빈도

관측값의 상대 빈도는 표본 크기에 대한 빈도의 비율입니다.

관찰된 특성의 빈도의 합이 표본 크기를 제공해야 한다는 것은 분명합니다.

상대 빈도의 합은 통일성을 제공해야 합니다.

이러한 고려사항은 통계표를 작성할 때 제어에 사용될 수 있습니다. 동등성이 충족되지 않으면 실험 결과를 기록할 때 오류가 발생한 것입니다.

관측값의 통계적 분포

관찰된 특성의 통계적 분포는 관찰된 특성 값과 해당 빈도(또는 상대 빈도) 사이의 일치입니다.

원칙적으로 통계분포는 2선형 표 형태로 작성되는데, 첫 번째 줄에는 특성의 관찰값을 표시하고, 두 번째 줄에는 해당 빈도(또는 상대도수)를 표시한다. 선:

따라서 연구 중인 확률 변수가 적용되는 패턴은 관찰(또는 실험)을 위한 실제 조건 세트에 의해 물리적으로 완전히 결정되며 해당 확률 공간 또는 동일하게 해당 확률 공간에 의해 수학적으로 지정됩니다. 확률 분포의 법칙. 그러나 통계 연구를 수행할 때 일반 인구 개념과 관련된 또 다른 용어가 다소 더 편리한 것으로 나타났습니다.

일반 모집단은 주어진 실제 조건에서 이루어질 수 있는 모든 상상할 수 있는 관찰(또는 관찰이 "제거"되는, 우리가 관심 있는 유형의 정신적으로 가능한 모든 대상)의 총체입니다. 정의는 정신적으로 가능한 모든 관찰(또는 대상)을 지칭하므로 일반 모집단의 개념은 조건부로 수학적, 추상적인 개념이므로 통계 조사 대상이 되는 실제 모집단과 혼동해서는 안 됩니다. 따라서 하위 산업의 모든 기업을 특성화하는 기술 및 경제 지표의 가치를 기록하는 관점에서 조사한 결과, 조사 대상 인구는 가정적으로 가능한 더 넓은 기업 인구를 대표하는 것으로 간주할 수 있습니다. 동일한 실제 조건 세트 내에서 작동할 수 있는

실제 작업에서는 선택을 관찰 대상의 특성보다는 관찰 대상과 연관시키는 것이 더 편리합니다. 우리는 연구를 위해 기계, 지질 샘플, 사람을 선택하지만 기계, 샘플, 사람의 특성 값은 선택하지 않습니다. 반면, 수학적 이론에서는 대상과 그 특성 집합이 다르지 않으며 도입된 정의의 이중성이 사라집니다.

보시다시피, "일반 인구"라는 수학적 개념은 물리적으로 완전히 결정되며 "확률 공간", "무작위 변수" 및 "확률 분포 법칙"의 개념도 해당 실제 조건 집합에 의해 결정됩니다. 이 네 가지 수학적 개념은 특정 의미의 동의어로 간주될 수 있습니다. 생각할 수 있는 모든 관측값의 집합이 유한한지 무한한지에 따라 모집단을 유한 또는 무한이라고 합니다.

정의에 따르면 연속적인 인구(연속적인 성격의 징후에 대한 관찰로 구성됨)는 항상 무한합니다. 이산 일반 모집단은 무한할 수도 있고 유한할 수도 있습니다. 예를 들어, N개 제품 배치를 등급별로 분석하는 경우(4.1.3절의 예 참조) 각 제품이 4개 등급 중 하나에 할당될 수 있을 때 연구 중인 무작위 변수는 다음에서 무작위로 추출된 제품의 등급 번호입니다. 배치와 가능한 값 세트인 확률 변수는 각각 4개의 점(1, 2, 3, 4)으로 구성되며, 그러면 분명히 모집단은 유한할 것입니다(N개의 가능한 관측치만 가능).

무한 모집단의 개념은 확률 변수의 측정이 무한히 반복될 수 있다는 생각과 마찬가지로 수학적 추상입니다. 대략 무한한 일반 인구는 주어진 실제 조건 집합에 의해 생성되는 객체의 수가 무한정 증가하는 유한 인구의 제한적인 경우로 해석될 수 있습니다. 따라서 방금 주어진 예에서 제품 배치 대신 동일한 제품의 지속적인 대량 생산을 고려하면 무한한 일반 인구의 개념에 도달하게 됩니다. 실제로 이러한 수정은 요구 사항과 동일합니다.

주어진 모집단의 표본은 무작위 변수에 대한 제한된 일련의 관찰 결과입니다. 표본은 일반 인구에 대한 일종의 경험적 유사체로 간주될 수 있습니다. 전체 일반 인구를 조사하는 것은 너무 노동 집약적이거나(N이 큰 경우) 근본적으로 불가능하기 때문에 우리가 실제로 가장 자주 다루는 것입니다. (무한한 일반 모집단의 경우).

표본을 구성하는 관측치의 수를 표본 크기라고 합니다.

표본 크기가 크고 1차원 연속 값(또는 가능한 값의 수가 10개 이상으로 상당히 큰 1차원 이산 값)을 다루는 경우 다음과 같은 경우가 많습니다. 관찰 결과의 추가 통계 처리를 단순화한다는 관점에서 소위 "그룹화된" 샘플 데이터로 이동하는 것이 더 편리합니다. 이 전환은 일반적으로 다음과 같이 수행됩니다.

a) 샘플의 가장 작은 값과 가장 큰 값이 기록됩니다.

b) 전체 조사 범위는 특정 수의 5개의 동일한 그룹화 간격으로 나뉩니다. 이 경우 간격 s의 수는 8-10보다 작고 20-25보다 커야 합니다. 간격 수의 선택은 선택 5의 대략적인 방향에 대한 샘플 크기에 따라 크게 달라집니다. 대략적인 공식

이는 오히려 s에 대해 더 낮은 추정치로 받아들여야 합니다(특히 대규모의 경우).

c) 각 간격의 극단점은 중간점뿐만 아니라 오름차순으로 표시됩니다.

d) 각 간격에 속하는 샘플 데이터의 수가 계산됩니다. (당연히) 간격의 경계에 속하는 샘플 데이터는 두 개의 인접한 간격에 균등하게 분포되거나 그 중 하나(예: 왼쪽 간격)에만 할당되도록 합의됩니다.

문제의 특정 내용에 따라 이 그룹화 체계에 일부 수정이 이루어질 수 있습니다(예를 들어, 동일한 길이의 그룹화 간격 요구 사항을 포기하는 것이 바람직한 경우도 있습니다).

샘플 데이터를 사용하는 모든 추가 인수에서는 방금 설명한 표기법을 따릅니다.

통계적 방법의 본질은 전체 모집단의 특정 부분(즉, 표본)을 사용하여 그 속성을 전체적으로 판단하는 것임을 기억합시다.

데이터의 통계적 처리 결과 얻은 결론의 신뢰성을 결정하는 성공적인 솔루션인 가장 중요한 문제 중 하나는 표본의 대표성 문제입니다. 우리가 관심을 갖고 있는 분석된 일반 인구의 속성 표현의 완전성과 타당성에 대한 문제입니다. 실제 작업에서는 연구를 위해 가져온 동일한 개체 그룹이 다양한 일반 모집단의 표본으로 간주될 수 있습니다. 따라서 상세한 사회학적 조사를 위해 도시 지역의 주택 관리 사무소(ZhEK) 중 하나의 협동 주택에서 무작위로 선택된 가족 그룹은 일반 가족 인구의 표본으로 간주될 수 있습니다. 주택 형태) 이 ZhEK의 샘플, 특정 지역의 일반 인구 가족의 샘플, 도시의 모든 가족의 일반 인구 샘플, 마지막으로 모든 일반 인구의 샘플 협동 주택에 거주하는 도시의 가족. 테스트 결과의 의미 있는 해석은 선택한 가족 그룹을 대표자로 간주하는 일반 인구가 누구인지, 이 표본이 대표로 간주될 수 있는 일반 인구에 따라 크게 달라집니다. 이 질문에 대한 답은 여러 요인에 따라 달라집니다. 특히 위의 예에서 이는 가족이 특정 주택 사무실이나 구역 전체에 속하는지 결정하는 특별한(아마도 숨겨진) 요소의 존재 여부에 따라 달라집니다(이러한 요소는 예를 들어 다음과 같을 수 있습니다). 가족의 1인당 평균 소득, 도시 내 지구의 지리적 위치, 해당 지역의 "나이" 등).