집 / 욕창/일반 모집단과 표본 모집단 중 어느 쪽이 더 큰가요? 모집단 및 표본

어떤 모집단이 더 크나요, 일반 모집단인가요, 아니면 표본 모집단인가요? 모집단 및 표본

대표성의 개념. 개념적 객체와 인구. 디자인된 개체입니다. 설계 및 실제 인구.

우리는 사회학이 삶의 유동적 직접성을 다루는 것이 아니라, 특징 공간의 특정 규칙에 따라 구성된 데이터를 다룬다는 것을 알고 있습니다. 데이터란 연구 단위(객체)에 할당된 변수의 값을 의미합니다. 커뮤니티, 기관, 사람, 텍스트, 사물 등 이러한 개체는 속성 공간에서 다양하고 종종 기괴한 구성을 형성하여 연구자가 현실에 대해 일반화된 판단을 내릴 수 있는 기회를 제공합니다.

현실에 대해 이야기하자마자 얻은 데이터는 엄밀히 말하면 등록 문서(설문지, 인터뷰 양식, 관찰 프로토콜 등)에만 관련된다는 것이 밝혀졌습니다. 실험실 창 밖의 현실(예: 저울 반대편)이 다르지 않을 것이라는 보장은 없습니다. 아직 샘플링 절차에 도달하지 않았지만 데이터의 대표성에 대한 질문이 이미 제기되었습니다. 설문 조사 중에 얻은 정보를 특정 경험 외부에 있는 개체로 확장할 수 있습니까? 대답은 분명합니다. 할 수 있습니다. 그렇지 않으면 우리의 관찰은 지금 여기 전체를 넘어서지 못할 것입니다. 그들은 모스크바 사람들에게 적용되지 않고 모스크바에서 방금 전화 인터뷰를 한 사람들에게 적용됩니다. Nedelya 신문의 독자가 아니라 완성된 분리 쿠폰을 편집자에게 우편으로 보낸 사람들에게. 설문 조사를 마친 후 우리는 "Muscovites"와 "독자"가 모두 동일하게 유지되었다고 가정해야 합니다. 우리는 세상의 안정을 믿습니다. 과학적 관찰놀라운 일관성을 보여줍니다.

단일 관찰은 더 넓은 관찰 분야로 확장되며 표현의 문제는 조사 대상 인구의 매개변수와 대상의 "실제" 특성 간의 일치 정도를 설정하는 것입니다. 샘플링 절차는 개별 순간 관찰을 통해 실제 연구 대상과 일반 인구를 정확하게 재구성하기 위한 것입니다.

개념 표본 대표성외적 타당성 개념에 가깝다. 첫 번째 경우에만 동일한 특성을 더 넓은 단위 세트로 추정하고 두 번째 경우에는 하나의 의미 컨텍스트에서 다른 의미 컨텍스트로 전환합니다. 샘플링 절차는 각 사람에 의해 하루에 천 번 수행되며 실제로 관찰의 대표성에 대해 생각하는 사람은 없습니다. 경험이 계산을 대체합니다. 죽이 잘 소금에 절였는지 확인하려면 팬 전체를 먹을 필요가 전혀 없습니다. 여기에서는 즉석 검사를 포함하여 비파괴 검사 방법이 더 효과적입니다. 한 숟가락을 시도해야합니다. 동시에 죽이 잘 섞였는지 확인해야 합니다. 죽이 잘 섞이지 않은 경우 한 번 측정하는 것이 아니라 일련의 측정, 즉 팬의 다른 위치에서 시도하는 것이 합리적입니다. 이것은 이미 샘플입니다. 시험에 대한 학생의 답변이 학생의 지식을 나타내는지, 무작위 성공이나 실패가 아닌지 확인하는 것이 더 어렵습니다. 이를 위해 몇 가지 질문이 제기됩니다. 학생이 특정 주제에 대해 가능한 모든 질문에 대답하면 결과는 "참", 즉 실제 지식을 반영한다고 가정됩니다. 하지만 그렇게 되면 누구도 시험에 합격할 수 없습니다.

샘플링 절차의 기본은 항상 "if"입니다. 즉, 관찰 결과를 외삽해도 얻은 결과가 크게 변경되지 않는다는 가정입니다. 따라서 인구는 '객관적 가능성'으로 정의할 수 있다. 표본 모집단.

연구 대상이 의미하는 바를 이해하면 문제는 다소 복잡해집니다. 상당히 많은 인구를 연구한 사회학자는 "급진주의-보수주의" 변수가 연령과 양의 상관관계가 있다는 결론에 도달했습니다. 특히 노년층은 혁명적 세대보다 보수적입니다. 그러나 조사 대상인 표본 모집단은 실제로는 존재하지 않습니다. 응답자를 선정하고 인터뷰를 진행하는 절차에 의해 구성되며, 즉시 사라지고 배열에 용해됩니다. 실제로 데이터가 직접 "제거"되는 표본 모집단은 절차에 의해 생성되지만 동시에 더 큰 모집단으로 용해되어 다양한 수준의 정확성과 신뢰성을 나타내거나 나타냅니다. 사회학적 결론은 지난 주에 조사된 응답자에게는 적용되지 않고 이상화된 대상, 즉 "기성세대", "청년", "급진주의" 또는 "보수주의"를 보이는 사람들에게 적용됩니다. 우리는 시공간적 상황에 의해 제한되지 않는 범주형 일반화에 대해 이야기하고 있습니다. 이런 점에서 선별적 절차는 관찰에서 벗어나 아이디어의 세계로 나아가는 데 도움이 된다.

따라서 우리는 연구 대상과 일반 인구를 구별할 수 있는 기회를 갖게 됩니다. 대상은 단순한 단위 모음이 아니라 연구 단위의 식별 및 선택이 수행되는 개념입니다. 이런 점에서, 자신의 개념에 상응하는 존재만을 참으로 고려하라는 헤겔의 명령은 옳다. 이론적으로 연구 대상을 나타내는 개념의 양은 일반 인구의 양과 일치해야 합니다. 그러나 그러한 서신은 극히 드물게 이루어집니다.

개념이 필요하겠습니다 개념적 객체 -주제의 틀을 나타내는 이상적인 구성. "러시아인", "중앙 신문 독자", "유권자", "민주적 대중"- 이들은 사회 학자들의 연구 관심 분야의 전형적인 대상입니다. 의심할 바 없이, 완전히 실제적인 일반 인구는 개념적 대상과 일치해야 합니다. 이를 위해서는 또 다른 연구 대상을 제공해야 합니다. 디자인된 개체.설계된 개체는 연구자가 사용할 수 있는 단위 집합입니다. 문제는 데이터 수집을 위해 접근할 수 없거나 접근하기 어려운 그룹을 식별하는 것입니다.

“러시아인”으로 지정된 개체를 조사하는 것은 거의 불가능하다는 것은 분명합니다. 러시아인 중에는 감옥, 노동교화소, 미결구치소 등 면접관이 접근하기 어려운 곳에 있는 사람이 많다. 이 그룹은 설계된 개체에서 "제외"되어야 합니다. 정신병원에 입원한 많은 환자와 어린이, 일부 노인들도 '뺄셈'을 해야 할 것이다. 민간 사회학자가 군인이 표본에 포함될 수 있는 일반적인 기회를 제공할 수 있을 것 같지 않습니다. 독자, 유권자, 소도시 주민, 극장 방문객을 대상으로 한 설문조사에서도 비슷한 문제가 발생합니다.

나열된 어려움은 사회학자가 연구 현장 단계에서 직면하는 극복할 수 없는 장애물 중 일부일 뿐입니다. 전문가는 이러한 어려움을 예상해야 하며 설계된 개체의 완전한 구현에 대한 환상을 만들어서는 안 됩니다. 그렇지 않으면 그는 실망할 것이다.

따라서 지역 지도가 지역 자체와 일치하지 않는 것과 마찬가지로 연구 대상은 일반 인구와 일치하지 않습니다.

우리는 오랫동안 생각하고 고민했습니다. 장군들은 큰 종이에 모든 것을 썼습니다. 서류상으로는 매끄러웠지만 그들은 계곡을 잊어버리고 그 길을 따라 걸었습니다.

아파트에서 아파트까지 걸어가야 한다는 점을 고려하면, 늙은 군인의 노래에 나오는 이 가사는 샘플 디자인에 상당히 적용 가능합니다.

물론 모집단은 단위가 표본으로 추출되는 모집단입니다. 그러나 그것은 단지 그렇게 보인다. 표본은 실제 응답자가 선정되는 모집단에서 추출됩니다. 그녀에게 전화하자 진짜.예상인구와 실제인구의 차이는 '예상' 응답자 목록과 실제 인터뷰한 응답자를 비교함으로써 직접 확인할 수 있다.

실제 목적은 1차 사회학적 정보의 가용성 한계를 고려하여 현장 조사 단계에서 형성된 총체입니다. 수감자, 군인 및 환자 외에도 교통 통신에서 멀리 떨어진 마을 주민들은 표본에 포함될 가능성이 적습니다. 특히 조사가 가을에 수행되는 경우에는 더욱 그렇습니다. 원칙적으로 집에 있지 않고 낯선 사람과 이야기하는 경향이없는 사람 등. 면접관은 통제력 부족을 이용하여 정확한 직무 수행을 무시하고 인터뷰해야 할 사람을 인터뷰하지 않는 경우가 있습니다. 지시에 따라 인터뷰를 해야 하지만, "얻기"가 더 쉬운 사람들입니다. 예를 들어, 면접관은 집에서 응답자를 찾기 쉬운 저녁 시간에 응답자의 아파트를 방문하라는 명령을 받았습니다. 예를 들어 11월에 연구가 수행된다면 이미 저녁 5시에 중간 차선러시아 밖은 완전히 어두워요. 많은 도시에서는 거리 이름과 집 번호가 적힌 표지판을 흔히 볼 수 없습니다. 면접관의 업무가 지역 교육 기관의 학생들에 의해 수행된다면, 실제 사물이 설계된 사물과 어느 정도 차이가 나는지 상상할 수 있습니다. 때로는 연구자들이 더 간단하게 설문지를 작성하는 경우도 있습니다. 이러한 어려움은 소위 샘플링 편향의 원인 중 하나입니다.

충분하다 효과적인 방법설문지 완성 및 샘플링 수리 기술에 대한 제어, 특히 응답자의 주요 유형 그룹에 대한 "무게 측정": 누락된 그룹은 증가하고 초과 그룹은 감소합니다. 이런 방식으로 실제 배열이 설계된 배열에 맞게 조정되며 이는 상당히 타당합니다.

인구 (영어로 - 인구) - 과학자가 특정 문제를 연구할 때 결론을 도출하려는 모든 개체(단위)의 집합입니다.

인구는 연구 대상이 되는 모든 개체로 구성됩니다. 인구의 구성은 연구 목적에 따라 다릅니다. 때로는 일반 인구가 특정 지역의 전체 인구인 경우도 있습니다(예: 후보자에 대한 잠재적 유권자의 태도를 연구할 때). 대부분 연구 대상을 결정하는 몇 가지 기준이 지정됩니다. 예를 들어, 특정 브랜드의 면도기를 일주일에 한 번 이상 사용하고 가족당 소득이 최소 $100인 30~50세 남성입니다.

견본또는 표본 모집단- 특정 절차를 사용하여 연구에 참여하기 위해 일반 모집단에서 선택한 일련의 사례(주제, 객체, 이벤트, 샘플)입니다.

샘플 특성:

· 샘플의 질적 특성 - 우리가 정확히 누구를 선택하고 이를 위해 어떤 샘플링 방법을 사용하는지.

· 표본의 정량적 특성 - 선택한 사례 수, 즉 표본 크기입니다.

샘플링의 필요성

· 연구 대상은 매우 광범위합니다. 예를 들어, 글로벌 기업 제품의 소비자는 지리적으로 분산된 수많은 시장으로 대표됩니다.

· 기본적인 정보를 수집할 필요가 있습니다.

표본의 크기

표본의 크기- 표본 모집단에 포함된 사례 수. 통계적인 이유로 사례 수는 최소 30~35개 이상인 것이 좋습니다.

종속 및 독립 표본

두 개 이상의 샘플을 비교할 때 중요한 매개변수는 종속성입니다. 두 표본의 각 사례에 대해 동형 쌍이 확립될 수 있는 경우(즉, 표본 X의 한 사례가 표본 Y의 단 하나의 사례에 해당하고 그 반대인 경우)(그리고 이러한 관계의 기초는 측정되는 특성에 중요합니다) 샘플에서) 이러한 샘플을 호출합니다. 매달린. 종속 표본의 예:

· 쌍둥이 한 쌍,

· 실험 노출 전후의 특성에 대한 두 가지 측정,

· 남편과 아내

· 등등.

샘플 간에 그러한 관계가 없으면 이러한 샘플이 고려됩니다. 독립적인, 예를 들어:

· 남자와 여자,

· 심리학자와 수학자.

따라서 종속 표본의 크기는 항상 동일하지만 독립 표본의 크기는 다를 수 있습니다.

샘플 비교는 다양한 통계 기준을 사용하여 이루어집니다.

· 학생의 t- 테스트

· 윌콕슨 테스트

· Mann-Whitney U 테스트

· 서명 기준

· 등등

대표성

표본은 대표성 또는 비대표성으로 간주될 수 있습니다.

대표성이 없는 표본의 예

미국에서 비대표적 표본추출의 가장 유명한 역사적 사례 중 하나로 꼽히는 사건은 다음과 같다. 대통령 선거 1936년에. 이전 여러 선거의 사건을 성공적으로 예측했던 Literary Digest는 구독자뿐만 아니라 전국 전화번호부에서 선정된 사람들과 자동차 등록 목록에서 선정된 사람들에게 천만 장의 시험 투표용지를 발송했을 때 예측이 틀렸습니다. 반환된 투표지의 25%(거의 250만 개)에서 투표는 다음과 같이 분배되었습니다.

· 57%가 선호하는 공화당 후보 Alf Landon

· 40%가 당시 민주당 대통령이었던 프랭클린 루즈벨트를 선택했습니다.

알려진 바와 같이 실제 선거에서 루즈벨트는 60% 이상의 득표율을 얻어 승리했습니다. Literary Digest의 실수는 다음과 같습니다. 표본의 대표성을 높이고자 - 대부분의 구독자가 자신을 공화당원으로 간주한다는 것을 알고 있었기 때문에 - 전화번호부 및 등록 목록에서 선택한 사람들을 포함하도록 표본을 확장했습니다. 그러나 그들은 현대 현실을 고려하지 않았고 실제로 더 많은 공화당 원을 모집했습니다. 대공황 기간 동안 전화기와 자동차를 소유할 여유가 있었던 것은 주로 중산층 대표였습니다. 상류층(즉, 민주당이 아닌 공화당의 대다수).

샘플로부터 그룹을 구성하기 위한 계획 유형

그룹 구축 계획에는 몇 가지 주요 유형이 있습니다.

1. 서로 다른 조건에 배치된 실험군과 대조군을 대상으로 한 연구입니다.

2. 쌍별 선택 전략을 사용하여 실험군과 대조군을 대상으로 연구

3. 단 하나의 그룹, 즉 실험 그룹만을 사용한 연구입니다.

4. 혼합(요인) 설계를 사용한 연구 - 모든 그룹이 서로 다른 조건에 배치됩니다.

샘플링 유형

샘플은 두 가지 유형으로 나뉩니다.

· 확률적인

· 비확률적

확률 샘플

1. 단순 확률 샘플링:

영형간단한 리샘플링. 이러한 표본의 사용은 각 응답자가 표본에 포함될 가능성이 동일하다는 가정에 기초합니다. 일반 인구 목록을 기반으로 응답자 번호가 적힌 카드가 작성됩니다. 카드를 덱에 넣고 섞은 후 무작위로 카드를 꺼낸 다음 숫자를 기록한 다음 다시 반환합니다. 다음으로, 필요한 표본 크기만큼 절차가 반복됩니다. 단점: 선택 단위가 반복됩니다.

단순 무작위 표본을 구성하는 절차에는 다음 단계가 포함됩니다.

1. 반드시 받아야 한다 전체 목록인구의 구성원과 이 목록에 번호를 매깁니다. 이러한 목록, 즉 회상을 샘플링 프레임이라고 합니다.

2. 예상 표본 크기, 즉 예상 응답자 수를 결정합니다.

3. 난수표에서 필요한 샘플 단위만큼의 숫자를 추출합니다. 표본에 100명이 있어야 한다면 테이블에서 무작위로 100개의 숫자를 가져옵니다. 이러한 난수는 컴퓨터 프로그램에 의해 생성될 수 있습니다.

4. 숫자가 기록된 난수와 일치하는 관측치를 기본 목록에서 선택합니다.

· 간단한 무작위 표본은 분명한 장점. 이 방법은 이해하기 매우 쉽습니다. 연구 결과는 연구 대상 인구 집단에 일반화될 수 있습니다. 통계적 추론에 대한 대부분의 접근 방식에는 단순 무작위 표본을 사용하여 정보를 수집하는 작업이 포함됩니다. 그러나 단순 무작위 샘플링 방법에는 최소한 네 가지 중요한 제한 사항이 있습니다.

1. 단순 무작위 샘플링을 허용하는 샘플링 프레임을 만드는 것이 어려운 경우가 많습니다.

2. 단순 무작위 샘플링으로 인해 인구가 많아지거나 지리적으로 넓은 지역에 인구가 분산되어 데이터 수집 시간과 비용이 크게 증가할 수 있습니다.

3. 단순임의추출법의 결과는 다른 확률법의 결과에 비해 정밀도가 낮고 표준오차가 더 큰 특징을 갖는 경우가 많습니다.

4. SRS를 활용한 결과, 비대표표본이 형성될 수 있다. 단순 무작위 샘플링으로 얻은 표본은 평균적으로 모집단을 적절하게 대표하지만 일부는 연구 대상 모집단을 극도로 잘못 대표합니다. 특히 표본 크기가 작을 때 이런 현상이 발생할 가능성이 높습니다.

· 단순 비반복 샘플링. 샘플링 절차는 동일하며 응답자 번호가 있는 카드만 덱으로 반환되지 않습니다.

1. 체계적인 확률 샘플링. 이는 단순 확률 샘플링의 단순화된 버전입니다. 일반 인구 목록을 기준으로 일정 간격(K)을 두고 응답자를 선정합니다. K 값은 무작위로 결정됩니다. 가장 신뢰할 수 있는 결과는 균일한 모집단에서 달성됩니다. 그렇지 않으면 샘플의 단계 크기와 일부 내부 순환 패턴이 일치할 수 있습니다(샘플링 혼합). 단점: 단순 확률 표본과 동일합니다.

2. 직렬(클러스터) 샘플링. 선발 단위는 통계 계열(가족, 학교, 팀 등)입니다. 선택한 요소는 완전한 검사를 받습니다. 통계 단위의 선택은 무작위 또는 체계적 샘플링으로 구성될 수 있습니다. 단점: 일반 인구에 비해 동질성이 더 클 가능성이 있습니다.

3. 지역 샘플링. 이질적인 모집단의 경우 선택 기술과 함께 확률 샘플링을 사용하기 전에 모집단을 동질적인 부분으로 나누는 것이 좋습니다. 이러한 샘플을 구역 샘플링이라고 합니다. 구역 설정 그룹에는 자연 지형(예: 도시 지역)과 연구의 기초를 형성하는 모든 기능이 모두 포함될 수 있습니다. 분할이 수행되는 특성을 계층화 및 구역화의 특성이라고합니다.

4. "편의성" 샘플. "편리한" 샘플링 절차는 "편리한" 샘플링 단위(학생 그룹, 스포츠 팀, 친구, 이웃과 함께. 새로운 개념에 대한 사람들의 반응에 대한 정보를 얻으려면 이러한 유형의 샘플링이 매우 합리적입니다. 편의 샘플링은 종종 설문지를 사전 테스트하는 데 사용됩니다.

비확률 표본

이러한 표본의 선택은 무작위성의 원칙에 따르지 않고 주관적인 기준(가용성, 전형성, 평등한 표현 등)에 따라 수행됩니다.

1. 할당량 샘플링 - 표본은 연구 대상 특성의 할당량(비율) 형태로 일반 모집단의 구조를 재현하는 모델로 구성됩니다. 연구된 특성의 다양한 조합을 가진 표본 요소의 수는 일반 모집단에서 해당 요소의 비율(비율)에 해당하도록 결정됩니다. 예를 들어, 일반 인구가 5,000명으로 구성되어 있고 그 중 2,000명이 여성이고 3,000명이 남성이라면 할당량 샘플에는 여성 20명, 남성 30명, 즉 여성 200명과 남성 300명이 있습니다. 할당량 샘플은 성별, 연령, 지역, 소득, 교육 등 인구통계학적 기준을 기반으로 하는 경우가 가장 많습니다. 단점: 일반적으로 이러한 샘플은 대표성이 없습니다. 한 번에 여러 사회적 매개변수를 고려하는 것은 불가능합니다. 장점: 쉽게 구할 수 있는 재료.

2. 눈덩이 방식. 샘플은 다음과 같이 구성됩니다. 첫 번째 응답자부터 각 응답자에게 선택 조건에 적합하고 연구에 참여할 수 있는 친구, 동료, 지인의 연락처 정보를 요청합니다. 따라서 첫 번째 단계를 제외하고는 연구 대상자 스스로가 참여하여 표본이 형성된다. 이 방법은 접근이 어려운 응답자 그룹(예: 고소득 응답자, 동일한 직업군에 속한 응답자, 비슷한 취미/관심사를 가진 응답자 등)을 찾아 인터뷰해야 할 때 자주 사용됩니다.

3. 자발적인 샘플링 - 소위 "처음 만나는 사람"의 샘플링입니다. 텔레비전이나 라디오 여론조사에서 자주 사용됩니다. 자발적 표본의 크기와 구성은 사전에 알려지지 않았으며 응답자의 활동이라는 하나의 매개변수에 의해서만 결정됩니다. 단점: 응답자가 어떤 인구를 대표하는지 파악하는 것이 불가능하며 결과적으로 대표성을 판단하는 것이 불가능합니다.

4. 경로 조사 – 학습 단위가 가족일 때 자주 사용됩니다. 지도에서 합의, 설문조사가 수행되는 경우 모든 거리에 번호가 매겨져 있습니다. 난수 테이블(생성기)을 사용하여, 큰 숫자. 각 큰 숫자거리 번호(첫 번째 숫자 2~3개), 집 번호, 아파트 번호의 3가지 구성 요소로 구성된 것으로 간주됩니다. 예를 들어, 숫자 14832: 14는 지도의 거리 번호, 8은 집 번호, 32는 아파트 호수입니다.

5. 전형적인 개체를 선택하여 지역 샘플링. 구역화 후 각 그룹에서 일반적인 개체를 선택한 경우, 즉 연구에서 연구된 대부분의 특성 측면에서 평균에 가까운 개체, 이러한 샘플을 전형적인 개체를 선택하여 지역화라고 합니다.

그룹 구축 전략

심리 실험에 참여할 그룹의 선택은 내부 및 외부 타당성이 최대한 유지되도록 다양한 전략을 사용하여 수행됩니다.

· 무작위화(무작위 선택)

· 쌍별 선택

· 계층적 샘플링

· 대략적인 모델링

· 실제 그룹 유치

무작위화, 또는 무작위 선택, 단순 무작위 샘플을 생성하는 데 사용됩니다. 이러한 표본의 사용은 모집단의 각 구성원이 표본에 포함될 가능성이 동일하다는 가정에 기초합니다. 예를 들어, 100명의 대학생을 무작위로 추출하려면 모든 대학생의 이름이 적힌 종이를 모자에 넣은 다음 그 중에서 100개의 종이를 꺼내면 무작위 선택이 됩니다(Goodwin J ., 147 페이지).

쌍별 선택- 피험자 그룹이 실험에 중요한 2차 매개변수 측면에서 동등한 피험자로 구성되는 샘플링 그룹을 구성하기 위한 전략입니다. 이 전략은 실험적이고 실험적인 방법을 사용하는 실험에 효과적입니다. 통제 그룹와 함께 최선의 선택- 쌍둥이 쌍(단일쌍 및 이란성)을 유인하여 다음을 만들 수 있습니다.

계층적 샘플링 - 계층(또는 클러스터) 할당을 통한 무작위화. 이 표본추출 방법을 통해 일반 인구를 특정 특성(성별, 연령, 정치적 선호, 교육 수준, 소득 수준 등)을 가진 그룹(계층)으로 나누고 해당 특성을 가진 대상을 선택합니다.

대략적인 모델링 - 제한된 표본을 추출하고 이 표본에 대한 결론을 더 넓은 모집단에 일반화합니다. 예를 들어, 본 연구에 대학생 2학년이 참여하여 본 연구의 데이터는 '17~21세'를 대상으로 한다. 그러한 일반화의 허용 가능성은 극히 제한적입니다.

근사 모델링은 명확하게 정의된 시스템(프로세스) 클래스에 대해 해당 동작(또는 원하는 현상)을 허용 가능한 정확도로 설명하는 모델을 형성하는 것입니다.

따라서 연구 중인 확률 변수가 적용되는 패턴은 관찰(또는 실험)을 위한 실제 조건 세트에 의해 물리적으로 완전히 결정되며 해당 확률 공간 또는 동일하게 해당 확률 공간에 의해 수학적으로 지정됩니다. 확률 분포의 법칙. 그러나 통계 연구를 수행할 때 일반 인구 개념과 관련된 또 다른 용어가 다소 더 편리한 것으로 나타났습니다.

일반 모집단은 주어진 실제 조건에서 이루어질 수 있는 모든 상상할 수 있는 관찰(또는 관찰이 "취해지는", 우리가 관심 있는 유형의 정신적으로 가능한 모든 대상)의 총체입니다. 정의에서부터 우리 얘기 중이야정신적으로 가능한 모든 관찰(또는 대상)에 대해 일반 인구의 개념은 조건부로 수학적, 추상적인 개념이므로 통계 연구 대상인 실제 인구와 혼동해서는 안 됩니다. 따라서 하위 산업의 모든 기업을 특성화하는 기술 및 경제 지표의 가치를 기록하는 관점에서 조사한 결과, 조사 대상 인구는 가정적으로 가능한 더 넓은 기업 인구를 대표하는 것으로 간주할 수 있습니다. 동일한 실제 조건 세트 내에서 작동할 수 있는

안에 실무선택을 관찰 대상의 특성보다 관찰 대상과 연관시키는 것이 더 편리합니다. 우리는 연구를 위해 기계, 지질 샘플, 사람을 선택하지만 기계, 샘플, 사람의 특성 값은 선택하지 않습니다. 반면, 수학적 이론에서는 대상과 그 특성 집합이 다르지 않으며 도입된 정의의 이중성이 사라집니다.

보시다시피, "일반 인구"라는 수학적 개념은 "확률 공간", "무작위 변수" 및 "확률 분포 법칙"의 개념과 마찬가지로 해당 실제 조건 집합에 의해 물리적으로 완전히 결정됩니다. 네 수학적 개념어떤 의미에서는 동의어로 간주될 수 있습니다. 생각할 수 있는 모든 관측값의 집합이 유한한지 무한한지에 따라 모집단을 유한 또는 무한이라고 합니다.

정의에 따르면 연속적인 인구(연속적인 성격의 징후에 대한 관찰로 구성됨)는 항상 무한합니다. 이산 일반 모집단은 무한할 수도 있고 유한할 수도 있습니다. 예를 들어, N개 제품 배치를 등급별로 분석하는 경우(4.1.3절의 예 참조) 각 제품이 4개 등급 중 하나에 할당될 수 있을 때 연구 중인 무작위 변수는 다음에서 무작위로 추출된 제품의 등급 번호입니다. 배치와 가능한 값 세트인 확률 변수는 각각 4개의 점(1, 2, 3, 4)으로 구성되며, 그러면 분명히 모집단은 유한할 것입니다(N개의 가능한 관측치만 가능).

무한 모집단의 개념은 확률 변수의 측정이 무한히 반복될 수 있다는 생각과 마찬가지로 수학적 추상입니다. 대략 무한한 일반 인구는 주어진 실제 조건 집합에 의해 생성되는 객체의 수가 무한정 증가하는 유한 인구의 제한적인 경우로 해석될 수 있습니다. 따라서 방금 주어진 예에서 제품 배치 대신 동일한 제품의 지속적인 대량 생산을 고려하면 무한한 일반 인구의 개념에 도달하게 됩니다. 실제로 이러한 수정은 요구 사항과 동일합니다.

주어진 모집단의 표본은 무작위 변수에 대한 제한된 일련의 관찰 결과입니다. 표본은 일반 인구에 대한 일종의 경험적 유사체로 간주될 수 있습니다. 전체 일반 인구를 조사하는 것은 너무 노동 집약적이거나(N이 큰 경우) 근본적으로 불가능하기 때문에 우리가 실제로 가장 자주 다루는 것입니다. (무한한 일반 모집단의 경우).

표본을 구성하는 관측치의 수를 표본 크기라고 합니다.

표본 크기가 크고 1차원 연속 값(또는 가능한 값의 수가 10개 이상으로 상당히 큰 1차원 이산 값)을 다루는 경우 다음과 같은 경우가 많습니다. 관찰 결과의 추가 통계 처리를 단순화한다는 관점에서 소위 "그룹화된" 샘플 데이터로 이동하는 것이 더 편리합니다. 이 전환은 일반적으로 다음과 같이 수행됩니다.

a) 가장 작고 가장 높은 가치샘플에서;

b) 전체 조사 범위는 특정 수의 5개의 동일한 그룹화 간격으로 나뉩니다. 이 경우 간격 s의 수는 8-10보다 작고 20-25보다 커야 합니다. 간격 수의 선택은 선택 5의 대략적인 방향에 대한 샘플 크기에 따라 크게 달라집니다. 대략적인 공식

이는 오히려 s에 대해 더 낮은 추정치로 받아들여야 합니다(특히 대규모의 경우).

c) 주목된다 극한점오름차순의 각 간격 및 중간점

d) 각 간격에 속하는 샘플 데이터의 수가 계산됩니다. (당연히) 간격의 경계에 속하는 샘플 데이터는 두 개의 인접한 간격에 균등하게 분포되거나 그 중 하나(예: 왼쪽 간격)에만 할당되도록 합의됩니다.

작업의 특정 내용에 따라 이 그룹화 체계가 일부 수정될 수 있습니다(예를 들어 어떤 경우에는 요구 사항을 포기하는 것이 좋습니다). 같은 길이그룹화 간격).

샘플 데이터를 사용하는 모든 추가 인수에서는 방금 설명한 표기법을 따릅니다.

본질을 기억하라 통계적 방법모집단의 특정 부분(즉, 표본)을 사용하여 전체 속성에 대한 판단을 내리는 것으로 구성됩니다.

데이터의 통계 처리 결과 얻은 결론의 신뢰성을 결정하는 성공적인 솔루션인 가장 중요한 문제 중 하나는 표본의 대표성 문제입니다. 우리가 관심을 갖고 있는 분석된 일반 인구의 속성 표현의 완전성과 타당성에 대한 문제입니다. 실제 작업에서는 연구를 위해 가져온 동일한 개체 그룹이 다양한 일반 모집단의 표본으로 간주될 수 있습니다. 따라서 상세한 사회학적 조사를 위해 도시 지역의 주택 관리 사무소(ZhEK) 중 하나의 협동 주택에서 무작위로 선택된 가족 그룹은 일반 가족 인구의 표본으로 간주될 수 있습니다. 주택 형태) 이 ZhEK의 샘플, 특정 지역의 일반 인구 가족의 샘플, 도시의 모든 가족의 일반 인구 샘플, 마지막으로 모든 일반 인구의 샘플 협동 주택에 거주하는 도시의 가족. 테스트 결과의 의미 있는 해석은 선택한 가족 그룹을 대표자로 간주하는 일반 인구가 누구인지, 이 표본이 대표로 간주될 수 있는 일반 인구에 따라 크게 달라집니다. 이 질문에 대한 답은 여러 요인에 따라 달라집니다. 특히 위의 예에서 이는 가족이 특정 주거 사무실이나 지역 전체에 속하는지 결정하는 특별한(아마도 숨겨진) 요소의 존재 여부에 따라 달라집니다(이러한 요소는 예를 들어 다음과 같을 수 있습니다). 가족의 1인당 평균 소득, 지리적 위치도시의 구역, 구역의 "연령" 등).

인구 - 사회학자가 연구에서 정보를 얻으려고 하는 사람들의 집합입니다. 연구 주제의 범위에 따라 모집단도 동일하게 넓어집니다.

표본 모집단 – 인구 감소 모델; 사회학자가 설문지를 배포하는 사람들, 응답자라고 불리는 사람들, 최종적으로 사회학 연구의 대상이 되는 사람들.

누가 일반 모집단에 정확히 포함되는지는 연구 목적에 따라 결정되고, 누가 표본 모집단에 포함되는지가 결정됩니다. 수학적 방법. 사회학자가 참가자의 눈을 통해 아프가니스탄 전쟁을 보려는 경우 일반 인구에는 모든 아프가니스탄 군인이 포함되지만 그는 작은 부분, 즉 표본 인구를 인터뷰해야 합니다. 표본이 일반 인구를 정확하게 반영하기 위해 사회학자는 규칙을 준수합니다. 모든 아프가니스탄 군인은 거주지, 근무지, 건강 상태 및 기타 상황에 관계없이 표본에 포함될 확률이 동일해야 합니다. 인구.

일단 사회학자가 인터뷰할 사람을 결정한 후에는 다음을 결정합니다. 샘플링 프레임. 그런 다음 샘플링 유형에 대한 질문이 결정됩니다.

샘플은 세 가지 큰 클래스로 나뉩니다.

ㅏ) 단단한(인구 조사, 국민 투표). 인구의 모든 단위가 조사됩니다.

비) 무작위의;

V) 무작위가 아닌.

무작위 및 비무작위 샘플링 유형은 차례로 여러 유형으로 나뉩니다.

무작위에는 다음이 포함됩니다.

1) 확률적;

2) 체계적인;

3) 구역화(층화);

4) 중첩

무작위가 아닌 것에는 다음이 포함됩니다.

1) "자발적인";

2) 몫;

3) "메인 배열" 방법.

표본 모집단 양식의 완전하고 정확한 단위 목록 샘플링 프레임 . 선택하려는 요소를 호출합니다. 선택 단위 . 샘플링 단위는 관측 단위와 동일할 수 있습니다. 관찰 단위 정보가 직접 수집되는 일반 인구의 요소로 간주됩니다. 일반적으로 관찰 단위는 개인입니다. 목록에서 선택하는 방법은 단위에 번호를 매기고 난수 테이블을 사용하는 것이 가장 좋습니다. 단, 모든 n번째 요소를 간단한 목록에서 가져올 때 준난수 방법이 자주 사용됩니다.

샘플링 프레임에 샘플링 단위 목록이 포함된 경우 샘플링 구조는 직업, 자격, 성별 또는 연령별 개인 분포와 같은 몇 가지 중요한 특성에 따라 그룹화하는 것을 의미합니다. 예를 들어 일반 인구에 청소년이 30%, 중년이 50%, 노인이 20%가 있다면 표본 모집단에서 세 연령층의 동일한 비율이 관찰되어야 합니다. 연령에는 클래스, 성별, 국적 등을 추가할 수 있습니다. 각각에 대해 일반 모집단과 표본 모집단에서 백분율 비율이 설정됩니다. 따라서, 샘플링 프레임 – 표본 모집단이 집계되는 기준으로 개체 특성의 백분율 비율.

표본 유형은 표본에 사람들이 어떻게 포함되는지 알려주는 반면, 표본 크기는 얼마나 많은 사람들이 포함되는지를 알려줍니다.

표본의 크기 – 표본 모집단의 단위 수. 표본 모집단은 특별한 방법을 사용하여 선택된 일반 모집단의 일부이므로 그 양은 항상 일반 모집단의 양보다 적습니다. 그러므로 부분이 전체의 개념을 왜곡하지 않는 것, 즉 그것을 대표하는 것이 매우 중요하다.

데이터의 신뢰성은 표본 모집단의 양적 특성(볼륨)이 아니라 일반 모집단의 질적 특성, 즉 동질성 정도의 영향을 받습니다. 일반 모집단과 표본 모집단 간의 차이를 '표본 모집단'이라고 합니다. 대표성 오류 , 허용 편차 – 5%.

오류를 방지하는 몇 가지 방법은 다음과 같습니다.

모집단의 각 단위는 표본에 포함될 확률이 동일해야 합니다.

동질적인 모집단 중에서 선택하는 것이 좋습니다.

인구의 특성을 알아야 합니다.

표본 모집단을 수집할 때 무작위 및 체계적 오류를 고려해야 합니다.

표본 모집단(표본)이 올바르게 작성되면 사회학자는 전체 인구를 특성화하는 신뢰할 수 있는 결과를 얻습니다.

주요 내용은 무엇입니까? 샘플링 방법?

기계적 샘플링 방법, 일반 인구의 일반 목록에서 일정한 간격으로(예: 10일마다) 필요한 응답자 수를 선택하는 경우.

직렬 샘플링 방법. 이 경우 일반 인구를 동질적인 부분으로 나누고 분석 단위를 각각에서 비례적으로 선택합니다(예: 기업 내 남성과 여성의 20%).

클러스터 샘플링 방법. 선택 단위는 개별 응답자가 아니라 후속 지속적인 연구가 진행되는 그룹입니다. 그룹의 구성이 유사한 경우(예: 대학 학과의 각 계열에서 한 그룹의 학생으로 구성된 경우) 이 표본이 대표적인 표본이 됩니다.

기본 배열 방법– 일반 인구의 60~70%를 대상으로 한 설문조사.

할당량 샘플링 방법. 응답자를 선택할 때 최소한 4가지 특성을 결정해야 하는 가장 복잡한 방법입니다. 일반적으로 인구가 많을 때 사용됩니다.

인구(영어로 - 인구) - 과학자가 특정 문제를 연구할 때 결론을 도출하려는 모든 개체(단위)의 집합입니다.

견본또는 표본 모집단- 특정 절차를 사용하여 연구에 참여하기 위해 일반 모집단에서 선택한 일련의 사례(주제, 객체, 이벤트, 샘플)입니다.

샘플 특성:

 샘플의 질적 특성 - 우리가 정확히 누구를 선택하고 이를 위해 어떤 샘플링 방법을 사용하는지.

 표본의 정량적 특성 - 선택한 사례 수, 즉 표본 크기입니다.

샘플링의 필요성

 연구 대상이 매우 광범위합니다. 예를 들어, 글로벌 기업 제품의 소비자는 지리적으로 분산된 수많은 시장으로 대표됩니다.

 주요 정보를 수집할 필요가 있습니다.

표본의 크기

표본의 크기- 표본 모집단에 포함된 사례 수. 통계적인 이유로 사례 수는 최소 30~35개 이상인 것이 좋습니다.

17. 기본 샘플링 방법

견본 추출이는 주로 표본 단위가 선택된 모집단의 모든 단위 목록을 나타내는 표본 프레임에 대한 지식을 기반으로 합니다. 예를 들어, 모스크바 시의 모든 자동차 수리점을 인구로 간주한다면 샘플이 형성되는 등고선으로 간주되는 그러한 작업장 목록이 필요합니다.

표본 윤곽선에는 필연적으로 표본 윤곽선 오류라는 오류가 포함됩니다. 이는 모집단의 실제 크기에서 벗어나는 정도를 나타냅니다. 분명히 모스크바의 모든 자동차 수리점에 대한 완전한 공식 목록은 없습니다. 연구자는 샘플링 윤곽선 오류의 크기에 대해 작업을 고객에게 알려야 합니다.

표본을 구성할 때 확률적(무작위) 방법과 비확률적(비무작위) 방법이 사용됩니다.

모든 표본 단위가 표본에 포함될 확률(확률)이 알려진 경우 해당 표본을 확률이라고 합니다. 이 확률을 알 수 없는 경우 표본을 비확률이라고 합니다. 불행하게도 대부분의 마케팅 연구에서는 모집단의 규모를 정확하게 결정하는 것이 불가능하기 때문에 정확한 확률을 계산하는 것이 불가능합니다. 따라서 "알려진 확률"이라는 용어는 모집단의 정확한 크기에 대한 지식보다는 특정 샘플링 기술의 사용을 기반으로 합니다.

확률적 방법에는 다음이 포함됩니다.

단순 무작위 선택;

체계적인 선택;

클러스터 선택;

계층화된 선택.

비확률적 방법:

편의성 원칙에 따른 선택

판단에 따른 선택

조사 과정 중 샘플링

할당량을 기준으로 샘플링합니다.

편의원칙에 입각한 선정방법의 의미는 연구자의 관점에서 가장 편리한 방법으로 샘플링을 한다는 것이다. 예를 들어 최소한의 시간과 노력의 관점에서, 응답자의 가용성. 연구 위치와 표본 구성의 선택은 주관적으로 이루어집니다. 예를 들어 고객 설문 조사는 연구자의 거주지에서 가장 가까운 매장에서 수행됩니다. 많은 인구 구성원이 설문 조사에 참여하지 않는 것은 분명합니다.

판단에 따른 샘플링은 자격을 갖춘 전문가와 샘플 구성에 관한 전문가의 의견을 사용하는 것을 기반으로 합니다. 이러한 접근 방식을 바탕으로 포커스 그룹의 구성이 형성되는 경우가 많습니다.

설문조사 과정 중 샘플링은 이미 설문조사에 참여한 응답자의 제안을 바탕으로 응답자 수를 확대하는 방식으로 이루어집니다. 처음에 연구자는 연구에 필요한 것보다 훨씬 작은 표본을 구성한 다음 연구가 진행됨에 따라 표본을 확대합니다.

할당량(할당량 선택)을 기반으로 한 표본 형성에는 연구 목적을 기반으로 특정 요구 사항(기준)을 충족하는 응답자 그룹 수를 예비적으로 결정하는 작업이 포함됩니다. 예를 들어, 연구 목적을 위해 백화점에서 남성 50명, 여성 50명을 인터뷰하기로 결정했습니다. 면접관은 정해진 할당량을 선택할 때까지 설문조사를 진행합니다.