Meni
Besplatno
Dom  /  O bolesti/ U kojim slučajevima je opća populacija u studiji. Opća i uzorkovana populacija. Koncept reprezentativnosti

U kojim slučajevima je opća populacija u studiji. Opća i uzorkovana populacija. Koncept reprezentativnosti

Statistička populacija- skup jedinica koje imaju masovni karakter, tipičnost, kvalitativnu homogenost i prisustvo varijacija.

Statističku populaciju čine materijalno postojeći objekti (zaposleni, preduzeća, zemlje, regioni), je objekat.

Jedinica stanovništva— svaku specifičnu jedinicu statističke populacije.

Ista statistička populacija može biti homogena po jednoj karakteristici i heterogena po drugoj.

Kvalitativna uniformnost- sličnost svih jedinica stanovništva po nekom osnovu i različitost po svim ostalim.

U statističkoj populaciji, razlike između jedne i druge jedinice stanovništva često su kvantitativne prirode. Kvantitativne promjene u vrijednostima karakteristike različitih jedinica populacije nazivaju se varijacijom.

Varijacija osobine- kvantitativna promjena karakteristike (za kvantitativnu karakteristiku) tokom tranzicije iz jedne jedinice stanovništva u drugu.

Potpiši- ovo je vlasništvo karakteristika ili druge karakteristike jedinica, objekata i pojava koje se mogu posmatrati ili meriti. Znakovi se dijele na kvantitativne i kvalitativne. Raznovrsnost i varijabilnost vrijednosti neke karakteristike u pojedinačnim jedinicama populacije naziva se varijacija.

Atributivne (kvalitativne) karakteristike se ne mogu numerički izraziti (sastav stanovništva prema polu). Kvantitativne karakteristike imaju numerički izraz(sastav stanovništva prema starosti).

Indeks- ovo je generalizirajuća kvantitativna i kvalitativna karakteristika bilo kojeg svojstva jedinica ili agregata u cjelini pod određenim uslovima vremena i mjesta.

Scorecard je skup indikatora koji sveobuhvatno odražavaju fenomen koji se proučava.

Na primjer, plaća se proučava:
  • Znak - plate
  • Statistička populacija - svi zaposleni
  • Jedinica stanovništva je svaki zaposleni
  • Kvalitativna homogenost - obračunate plate
  • Varijacija znaka - niz brojeva

Populacija i uzorak iz nje

Osnova je skup podataka dobijenih kao rezultat mjerenja jedne ili više karakteristika. Zaista posmatrani skup objekata, statistički predstavljen brojnim opažanjima slučajne varijable, je uzorkovanje, a hipotetički postojeće (nagađajuće) - opšta populacija. Populacija može biti konačna (broj opažanja N = konst) ili beskonačno ( N = ∞), i uzorak iz stanovništva je uvijek rezultat ograničenog niza zapažanja. Broj opservacija koje formiraju uzorak se naziva veličina uzorka. Ako je veličina uzorka dovoljno velika ( n → ∞) uzorak se razmatra veliki, inače se naziva uzorkovanje ograničen volumen. Uzorak se razmatra mala, ako prilikom mjerenja jednodimenzionalne slučajne varijable veličina uzorka ne prelazi 30 ( n<= 30 ), a pri mjerenju nekoliko istovremeno ( k) karakteristike u multidimenzionalnom prostoru relacija n To k ne prelazi 10 (n/k< 10) . Uzorci obrazaca varijantne serije, ako su njegovi članovi redovna statistika, tj. uzorke vrijednosti slučajne varijable X su poredane uzlaznim redom (rangirani), vrijednosti karakteristike se pozivaju opcije.

Primjer. Gotovo isti nasumično odabrani skup objekata - komercijalne banke jednog administrativnog okruga Moskve, može se smatrati uzorkom iz opšte populacije svih komercijalnih banaka u ovom okrugu, i kao uzorkom iz opšte populacije svih komercijalnih banaka u Moskvi. , kao i uzorak iz komercijalnih banaka zemlje i dr.

Osnovne metode organizacije uzorkovanja

Od toga zavisi pouzdanost statističkih zaključaka i smislena interpretacija rezultata reprezentativnost uzorci, tj. potpunost i adekvatnost reprezentacije svojstava opšte populacije, u odnosu na koju se ovaj uzorak može smatrati reprezentativnim. Proučavanje statističkih svojstava populacije može se organizirati na dva načina: korištenjem kontinuirano I nije kontinuirano. Kontinuirano posmatranje predviđa ispitivanje svih jedinice studirao totalitet, A parcijalno (selektivno) posmatranje- samo delovi toga.

Postoji pet glavnih načina da se organizuje posmatranje uzorka:

1. jednostavan slučajni odabir, u kojem se objekti nasumično biraju iz populacije objekata (na primjer, pomoću tablice ili generatora slučajnih brojeva), pri čemu svaki od mogućih uzoraka ima jednaku vjerovatnoću. Takvi uzorci se nazivaju zapravo nasumično;

2. jednostavan odabir uz pomoć redovnog postupka se izvodi pomoću mehaničke komponente (npr. datum, dan u nedelji, broj stana, slova abecede itd.) i tako dobijeni uzorci se nazivaju mehanički;

3. slojevito selekcija se sastoji u tome da se opća populacija volumena podijeli na subpopulacije ili slojeve (stratue) volumena tako da . Stratumi su homogeni objekti u smislu statističkih karakteristika (na primjer, stanovništvo je podijeljeno na slojeve prema starosnim grupama ili društvenoj klasi; preduzeća prema djelatnostima). U ovom slučaju, uzorci se pozivaju slojevito(inače, stratificirano, tipično, regionalizirano);

4. metode serijski selekcije se koriste za formiranje serijski ili uzorci gnijezda. Pogodni su ako je potrebno pregledati "blok" ili niz objekata odjednom (na primjer, seriju robe, proizvode određene serije ili stanovništvo teritorijalno-administrativne podjele zemlje). Odabir serija može se vršiti čisto nasumično ili mehanički. U tom slučaju se vrši potpuni pregled određene serije robe, odnosno cijele teritorijalne jedinice (stambene zgrade ili bloka);

5. kombinovano(stepena) selekcija može kombinovati nekoliko metoda selekcije odjednom (na primjer, stratificirana i nasumična ili nasumična i mehanička); takav uzorak se zove kombinovano.

Vrste selekcije

By um razlikuju se individualna, grupna i kombinovana selekcija. At individualni odabir pojedinačne jedinice opšte populacije biraju se u populaciju uzorka, sa grupni izbor- kvalitativno homogene grupe (serije) jedinica, i kombinovani izbor uključuje kombinaciju prvog i drugog tipa.

By metoda selekcija se razlikuje ponavljaju se i ne ponavljaju uzorak.

Neponovljiv naziva se selekcija u kojoj se jedinica uključena u uzorak ne vraća u prvobitnu populaciju i ne učestvuje u daljoj selekciji; dok je broj jedinica u opštoj populaciji N se smanjuje tokom procesa selekcije. At ponovljeno izbor uhvaćen u uzorku se jedinica nakon registracije vraća u opštu populaciju i tako zadržava jednaku mogućnost, zajedno sa ostalim jedinicama, da se koristi u daljem postupku selekcije; dok je broj jedinica u opštoj populaciji N ostaje nepromijenjena (metoda se rijetko koristi u socio-ekonomskim istraživanjima). Međutim, sa velikim N (N → ∞) formule za ponovljivo selekcija se približava onima za ponovljeno selekcija i ovi drugi se praktički češće koriste ( N = konst).

Osnovne karakteristike parametara opće populacije i populacije uzorka

Statistički zaključci studije zasnovani su na distribuciji slučajne varijable i posmatranim vrijednostima (x 1, x 2, ..., x n) se nazivaju realizacije slučajne varijable X(n je veličina uzorka). Distribucija slučajne varijable u opštoj populaciji je teorijske, idealne prirode, a njen uzorni analog je empirijski distribucija. Neke teorijske distribucije su specificirane analitički, tj. njihov opcije odrediti vrijednost funkcije distribucije u svakoj tački u prostoru mogućih vrijednosti slučajne varijable. Zbog toga je za uzorak teško i ponekad nemoguće odrediti funkciju distribucije opcije se procjenjuju iz empirijskih podataka, a zatim se zamjenjuju u analitički izraz koji opisuje teorijsku distribuciju. U ovom slučaju, pretpostavka (ili hipoteza) o vrsti distribucije može biti statistički tačna ili pogrešna. Ali u svakom slučaju, empirijska raspodjela rekonstruirana iz uzorka samo grubo karakterizira pravu. Najvažniji parametri distribucije su očekivanu vrijednost i varijansu.

Po svojoj prirodi, distribucije su kontinuirano I diskretno. Najpoznatija kontinuirana distribucija je normalno. Uzorak analoga parametara i za njih su: srednja vrijednost i empirijska varijansa. Među diskretnim u socio-ekonomskim istraživanjima, najčešće se koriste alternativa (dihotomno) distribucija. Parametar matematičkog očekivanja ove distribucije izražava relativnu vrijednost (ili dijeliti) jedinice stanovništva koje imaju karakteristiku koja se proučava (označava se slovom); udio stanovništva koji nema ovu karakteristiku označava se slovom q (q = 1 - p). Varijanca alternativne distribucije također ima empirijski analog.

U zavisnosti od vrste distribucije i načina odabira jedinica stanovništva, karakteristike parametara distribucije se različito izračunavaju. Glavne za teorijske i empirijske distribucije date su u tabeli. 9.1.

Frakcija uzorka k n Omjer broja jedinica u populaciji uzorka prema broju jedinica u općoj populaciji naziva se:

kn = n/N.

Frakcija uzorka w je omjer jedinica koje posjeduju karakteristiku koja se proučava x na veličinu uzorka n:

w = n n /n.

Primjer. U seriji robe koja sadrži 1000 jedinica, sa 5% uzorka udio uzorka k n u apsolutnoj vrijednosti je 50 jedinica. (n = N*0,05); ako se u ovom uzorku pronađu 2 neispravna proizvoda stopa defekta uzorka w biće 0,04 (w = 2/50 = 0,04 ili 4%).

Pošto se populacija uzorka razlikuje od opšte populacije, postoje greške uzorkovanja.

Tabela 9.1 Glavni parametri opšte populacije i populacije uzorka

Greške uzorkovanja

U svakom slučaju (kontinuirano i selektivno), mogu se pojaviti greške dvije vrste: registracija i reprezentativnost. Greške registracija može imati nasumično I sistematično karakter. Slučajno greške se sastoje od mnogo različitih nekontrolisanih uzroka, nenamjerne su i obično se međusobno uravnotežuju (na primjer, promjene u performansama uređaja zbog temperaturnih fluktuacija u prostoriji).

Sistematično greške su pristrasne jer krše pravila za odabir objekata za uzorak (na primjer, odstupanja u mjerenjima pri promjeni postavki mjernog uređaja).

Primjer. Za procjenu socijalne situacije stanovništva u gradu planirano je anketiranje 25% porodica. Ako se odabir svakog četvrtog stana zasniva na njegovom broju, onda postoji opasnost da se izaberu svi stanovi samo jedne vrste (npr. jednosobni stanovi), što će dati sistematsku grešku i iskriviti rezultate; poželjniji je odabir broja stana po ždrijebu, jer će greška biti nasumična.

Greške u reprezentativnosti su svojstvene samo promatranju uzorka, ne mogu se izbjeći i nastaju kao rezultat činjenice da populacija uzorka ne reproducira u potpunosti opću populaciju. Vrijednosti indikatora dobijenih iz uzorka razlikuju se od indikatora istih vrijednosti u opštoj populaciji (ili dobijenih kontinuiranim posmatranjem).

Pristrasnost uzorkovanja je razlika između vrijednosti parametra u populaciji i vrijednosti njenog uzorka. Za prosječnu vrijednost kvantitativne karakteristike ona je jednaka: , a za udio (alternativna karakteristika) - .

Greške uzorkovanja su svojstvene samo opažanjima uzorka. Što su ove greške veće, to se empirijska raspodjela više razlikuje od teorijske. Parametri empirijske distribucije su slučajne varijable, stoga su greške uzorkovanja također slučajne varijable, mogu uzeti različite vrijednosti za različite uzorke i stoga je uobičajeno izračunati prosečna greška.

Prosječna greška uzorkovanja je veličina koja izražava standardnu ​​devijaciju srednje vrijednosti uzorka od matematičkog očekivanja. Ova vrijednost, podložna principu slučajnog odabira, prvenstveno ovisi o veličini uzorka i o stepenu varijacije karakteristike: što je veća i manja varijacija karakteristike (a samim tim i vrijednosti), to je manja prosječna greška uzorkovanja. . Odnos između varijansi opšte populacije i populacije uzorka izražava se formulom:

one. kada je dovoljno velika, možemo pretpostaviti da . Prosječna greška uzorkovanja pokazuje moguća odstupanja parametra populacije uzorka od parametra opće populacije. U tabeli U tabeli 9.2 prikazani su izrazi za izračunavanje prosječne greške uzorkovanja za različite metode organizacije posmatranja.

Tabela 9.2 Prosječna greška (m) srednje vrijednosti uzorka i proporcija za različite tipove uzoraka

Gdje je prosjek varijansi uzorka unutar grupe za kontinuirani atribut;

Prosjek unutargrupnih varijansi proporcije;

— broj odabranih serija, — ukupan broj serija;

,

gdje je prosjek th serije;

— ukupni prosjek za cijelu populaciju uzorka za kontinuiranu karakteristiku;

,

gdje je udio karakteristike u th seriji;

— ukupan udio karakteristike u cijeloj populaciji uzorka.

Međutim, veličina prosječne greške može se ocijeniti samo sa određenom vjerovatnoćom P (P ≤ 1). Lyapunov A.M. dokazao da raspodjela srednjih vrijednosti uzorka, a samim tim i njihova odstupanja od opće srednje vrijednosti, za dovoljno veliki broj približno odgovara normalnom zakonu raspodjele, pod uvjetom da opća populacija ima konačnu srednju vrijednost i ograničenu varijansu.

Matematički, ova izjava za prosjek se izražava kao:

a za udio, izraz (1) će poprimiti oblik:

Gdje - Tu je marginalna greška uzorkovanja, što je višekratnik prosječne greške uzorkovanja , a koeficijent višestrukosti je Studentov test („koeficijent pouzdanosti“), koji je predložio W.S. Gosset (pseudonim "Student"); vrijednosti za različite veličine uzoraka pohranjuju se u posebnu tablicu.

Vrijednosti funkcije F(t) za neke vrijednosti t jednake su:

Stoga se izraz (3) može čitati na sljedeći način: sa vjerovatnoćom P = 0,683 (68,3%) može se tvrditi da razlika između uzorka i opšteg prosjeka neće preći jednu vrijednost prosječne greške m(t=1), sa vjerovatnoćom P = 0,954 (95,4%)- da neće prelaziti vrijednost dvije prosječne greške m (t = 2) , sa vjerovatnoćom P = 0,997 (99,7%)- neće prelaziti tri vrijednosti m (t = 3) . Dakle, vjerovatnoća da će ova razlika premašiti trostruku prosječnu grešku određena je pomoću nivo greške i ne iznosi više 0,3% .

U tabeli 9.3 prikazuje formule za izračunavanje maksimalne greške uzorkovanja.

Tabela 9.3 Granična greška (D) uzorka za srednju vrijednost i proporciju (p) za različite vrste promatranja uzorka

Generalizacija rezultata uzorka na populaciju

Krajnji cilj posmatranja uzorka je karakterizacija opće populacije. Uz male veličine uzorka, empirijske procjene parametara ( i ) mogu značajno odstupati od njihovih pravih vrijednosti ( i ). Stoga postoji potreba da se uspostave granice unutar kojih leže prave vrijednosti ( i ) za uzorke vrijednosti parametara ( i ).

Interval povjerenja bilo kojeg parametra θ opće populacije je slučajni raspon vrijednosti ovog parametra, koji je s vjerovatnoćom bliskom 1 ( pouzdanost) sadrži pravu vrijednost ovog parametra.

Marginalna greška uzorci Δ omogućava vam da odredite granične vrijednosti karakteristika opće populacije i njihovih intervali poverenja, koji su jednaki:

Zaključak interval povjerenja dobijeno oduzimanjem maksimalna greška iz uzorka srednje vrijednosti (udio), a gornje dodavanjem.

Interval povjerenja za prosjek koristi maksimalnu grešku uzorkovanja i za dati nivo pouzdanosti određuje se formulom:

To znači da sa datom vjerovatnoćom R, koji se naziva nivoom pouzdanosti i jedinstveno je određen vrijednošću t, može se tvrditi da prava vrijednost prosjeka leži u rasponu od , a prava vrijednost udjela je u rasponu od

Prilikom izračunavanja intervala povjerenja za tri standardna nivoa povjerenja P = 95%, P = 99% i P = 99,9% vrijednost je odabrana pomoću . Primjene ovisno o broju stupnjeva slobode. Ako je veličina uzorka dovoljno velika, tada su vrijednosti koje odgovaraju ovim vjerojatnostima t su jednaki: 1,96, 2,58 I 3,29 . Dakle, marginalna greška uzorkovanja omogućava nam da odredimo granične vrijednosti karakteristika populacije i njihovih intervala povjerenja:

Distribucija rezultata opservacije uzorka na opštu populaciju u socio-ekonomskim istraživanjima ima svoje karakteristike, jer zahtijeva potpunu zastupljenost svih njenih tipova i grupa. Osnova za mogućnost takve distribucije je kalkulacija relativna greška:

Gdje Δ % - relativna maksimalna greška uzorkovanja; , .

Postoje dvije glavne metode za proširenje promatranja uzorka na populaciju: metod direktnog preračunavanja i koeficijenata.

Essence direktna konverzija sastoji se od množenja srednje vrijednosti uzorka!!\overline(x) sa veličinom populacije.

Primjer. Neka prosječan broj mališana u gradu bude procijenjen metodom uzorkovanja i iznosi jednu osobu. Ako u gradu ima 1000 mladih porodica, onda se broj potrebnih mjesta u opštinskim jaslicama dobije množenjem ovog prosjeka sa veličinom opšte populacije N = 1000, tj. imaće 1200 mesta.

Metoda kvota Preporučljivo je koristiti u slučaju kada se vrši selektivno posmatranje kako bi se razjasnili podaci kontinuiranog posmatranja.

Koristi se sljedeća formula:

gdje su sve varijable veličina populacije:

Potrebna veličina uzorka

Tabela 9.4 Potrebna veličina uzorka (n) za različite tipove organizacije za posmatranje uzorka

Prilikom planiranja promatranja uzorka s unaprijed određenom vrijednošću dozvoljene greške uzorkovanja, potrebno je pravilno procijeniti traženu veličina uzorka. Ovaj obim se može odrediti na osnovu dozvoljene greške tokom posmatranja uzorka na osnovu date verovatnoće koja garantuje dozvoljenu vrednost nivoa greške (uzimajući u obzir način organizovanja posmatranja). Formule za određivanje potrebne veličine uzorka n mogu se lako dobiti direktno iz formula za maksimalnu grešku uzorkovanja. Dakle, iz izraza za marginalnu grešku:

veličina uzorka je direktno određena n:

Ova formula pokazuje da se maksimalna greška uzorkovanja smanjuje Δ potrebna veličina uzorka se značajno povećava, što je proporcionalno varijansi i kvadratu Studentovog t testa.

Za konkretan metod organizacije posmatranja, potrebna veličina uzorka se izračunava prema formulama datim u tabeli. 9.4.

Praktični primjeri proračuna

Primjer 1. Proračun srednje vrijednosti i intervala povjerenja za kontinuiranu kvantitativnu karakteristiku.

Za procjenu brzine namirenja sa kreditorima u banci je urađen slučajni uzorak od 10 platnih dokumenata. Ispostavilo se da su njihove vrijednosti jednake (u danima): 10; 3; 15; 15; 22; 7; 8; 1; 19; 20.

Neophodno sa vjerovatnoćom P = 0,954 odrediti graničnu grešku Δ srednja vrijednost uzorka i granice povjerenja srednjeg vremena izračunavanja.

Rješenje. Prosječna vrijednost se izračunava pomoću formule iz tabele. 9.1 za populaciju uzorka

Varijanca se izračunava pomoću formule iz tabele. 9.1.

Srednja kvadratna greška dana.

Prosječna greška se izračunava pomoću formule:

one. prosek je x ± m = 12,0 ± 2,3 dana.

Pouzdanost srednje vrijednosti je bila

Maksimalnu grešku izračunavamo pomoću formule iz tabele. 9.3 za ponovljeno uzorkovanje, pošto je veličina populacije nepoznata, i za P = 0,954 nivo samopouzdanja.

Dakle, prosječna vrijednost je `x ± D = `x ± 2m = 12,0 ± 4,6, tj. njegova prava vrijednost je u rasponu od 7,4 do 16,6 dana.

Korištenje Studentove t-tabele. Aplikacija nam omogućava da zaključimo da je za n = 10 - 1 = 9 stepeni slobode dobijena vrijednost pouzdana sa nivoom značajnosti od £ 0,001, tj. rezultirajuća srednja vrijednost se značajno razlikuje od 0.

Primjer 2. Procjena vjerovatnoće (opšti udio) str.

Tokom mehaničke metode uzorkovanja istraživanja socijalnog statusa 1000 porodica, otkriveno je da je udio porodica sa niskim primanjima w = 0,3 (30%)(uzorak je bio 2% , tj. n/N = 0,02). Obavezno uz nivo samopouzdanja p = 0,997 odrediti indikator R porodice sa niskim primanjima širom regiona.

Rješenje. Na osnovu prikazanih vrijednosti funkcije F(t) pronaći za dati nivo pouzdanosti P = 0,997 značenje t = 3(vidi formulu 3). Granična greška razlomka w odrediti po formuli iz tabele. 9.3 za uzorkovanje koje se ne ponavlja (mehaničko uzorkovanje se uvijek ne ponavlja):

Maksimalna relativna greška uzorkovanja u % bice:

Verovatnoća (opšti udeo) porodica sa niskim primanjima u regionu će biti r=w±Δw, a granice povjerenja p se izračunavaju na osnovu dvostruke nejednakosti:

w — Δ w ≤ p ≤ w — Δ w, tj. prava vrijednost p leži unutar:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

Tako se sa vjerovatnoćom od 0,997 može konstatovati da se udio porodica sa niskim primanjima među svim porodicama u regionu kreće od 28,6% do 31,4%.

Primjer 3. Izračunavanje srednje vrijednosti i intervala pouzdanosti za diskretnu karakteristiku specificiranu nizom intervala.

U tabeli 9.5. precizira se distribucija aplikacija za izradu narudžbi prema vremenu njihovog sprovođenja od strane preduzeća.

Tabela 9.5 Distribucija zapažanja prema vremenu pojavljivanja

Rješenje. Prosječno vrijeme za dovršenje porudžbina izračunava se pomoću formule:

Prosječan period će biti:

= (3*20 + 9*80 + 24*60 + 48*20 + 72*20)/200 = 23,1 mjeseci.

Isti odgovor dobijamo ako koristimo podatke o p i iz pretposljednje kolone tabele. 9.5, koristeći formulu:

Imajte na umu da se sredina intervala za posljednju gradaciju nalazi umjetnim dopunom širine intervala prethodne gradacije jednakom 60 - 36 = 24 mjeseca.

Varijanca se izračunava pomoću formule

Gdje x i- sredina intervalne serije.

Dakle!!\sigma = \frac (20^2 + 14^2 + 1 + 25^2 + 49^2)(4), a srednja kvadratna greška je .

Prosječna greška se izračunava korištenjem mjesečne formule, tj. prosječna vrijednost je!!\overline(x) ± m = 23,1 ± 13,4.

Maksimalnu grešku izračunavamo pomoću formule iz tabele. 9.3 za ponovljeni odabir, pošto je veličina populacije nepoznata, za nivo pouzdanosti 0,954:

Dakle, prosjek je:

one. njegova prava vrijednost je u rasponu od 0 do 50 mjeseci.

Primjer 4. Da bi se utvrdila brzina namirenja sa kreditorima N = 500 korporativnih preduzeća u poslovnoj banci, potrebno je sprovesti studiju uzorka metodom slučajnog i nerepetitivnog odabira. Odrediti potrebnu veličinu uzorka n tako da sa vjerovatnoćom P = 0,954 greška srednje vrijednosti uzorka ne prelazi 3 dana ako su probne procjene pokazale da je standardna devijacija s 10 dana.

Rješenje. Da bismo odredili broj potrebnih studija n, koristićemo formulu za nerepetitivni odabir iz tabele. 9.4:

U njemu se vrijednost t određuje iz nivoa pouzdanosti od P = 0,954. Jednako je 2. Srednja kvadratna vrijednost je s = 10, veličina populacije je N = 500, a maksimalna greška srednje vrijednosti je Δ x = 3. Zamjenom ovih vrijednosti u formulu dobijamo:

one. Dovoljno je sastaviti uzorak od 41 preduzeća da bi se procenio traženi parametar - brzina namirenja sa poveriocima.

Istraživanje obično počinje nekom pretpostavkom koja zahtijeva testiranje činjenicama. Ova pretpostavka - hipoteza - se formuliše u odnosu na povezanost pojava ili svojstava u određenom skupu objekata. Da bi se takve pretpostavke testirale u odnosu na činjenice, potrebno je izmjeriti odgovarajuća svojstva njihovih nosilaca. Ali nemoguće je izmjeriti, na primjer, anksioznost kod svih adolescenata. Stoga se pri provođenju istraživanja ograničava samo na relativno malu grupu predstavnika relevantnih populacija ljudi.

Populacija- to je čitav skup objekata u odnosu na koje se formuliše istraživačka hipoteza. Teoretski se vjeruje da je veličina populacije neograničena. U praksi je obim opšte populacije uvek ograničen i može varirati u zavisnosti od predmeta posmatranja i zadatka koji psiholog treba da reši. Tipično, opšta populacija obuhvata veoma veliki broj objekata - studente, školarce, zaposlene u preduzećima, penzionere itd. Kompletno proučavanje općih populacija je izuzetno teško, stoga se po pravilu proučava mali dio opće populacije, koji se naziva uzorkovana populacija ili uzorak.

Uzorkovanje - ovo je ograničen broj objekata (u psihologiji - subjekti, ispitanici), posebno odabranih iz opće populacije za proučavanje njegovih svojstava. U skladu s tim, proučavanje svojstava populacije pomoću uzorka naziva se istraživanje uzorka. Gotovo sve psihološke studije su selektivne, a njihovi zaključci se protežu na opću populaciju.

Na uzorak se primjenjuje niz obaveznih zahtjeva, koji su prije svega određeni ciljevima i zadacima studije. Ona treba da bude takva da je opravdana generalizacija nalaza uzorka studije – generalizacija, proširenje istih na opštu populaciju.

Uzorak mora zadovoljiti sljedeće uslove:



1. Ovo je grupa objekata dostupnih za proučavanje. Veličina uzorka određena je zadacima i mogućnostima posmatranja i eksperimenta.

2. To je dio unaprijed određene populacije.

3. Ovo je nasumično odabrana grupa tako da bilo koja stavka u populaciji ima jednake šanse da bude uključena u uzorak.

Glavni kriterijumi za validnost nalaza istraživanja su reprezentativnost uzorka i statistička pouzdanost (empirijskih) rezultata.

reprezentativnost - drugim riječima, njegova reprezentativnost je sposobnost da se odgovarajuća populacija okarakteriše sa određenom tačnošću i dovoljnom pouzdanošću. Ako je uzorak ispitanika po svojim karakteristikama reprezentativan za opštu populaciju, onda postoji razlog da se rezultati dobijeni njegovim proučavanjem prošire na čitavu opštu populaciju.

U idealnom slučaju, reprezentativni uzorak treba da bude takav da svaka od glavnih karakteristika, osobina, osobina ličnosti itd. koje proučava psiholog bude u njemu predstavljena proporcionalno tim istim karakteristikama u opštoj populaciji.

Greške u reprezentativnosti nastaju u dva slučaja:

1. Mali uzorak koji karakteriše opštu populaciju.

2. Nesklad između svojstava (parametara) uzorka i parametara opće populacije.

Statistički značaj, ili statistička značajnost, rezultata studije određuje se korištenjem statističkih metoda zaključivanja. Ove metode će biti detaljnije obrađene u temi “Testiranje hipoteza”. Imajte na umu da oni nameću određene zahtjeve za veličinu ili veličinu uzorka.

Za razvoj dijagnostičke tehnike potrebna je najveća veličina uzorka - od 200 do 1000-2500 ljudi.

Ako je potrebno uporediti 2 uzorka, njihov ukupan broj mora biti najmanje 50 osoba; broj uzoraka koji se porede treba da bude približno isti.

Ako se proučava odnos između bilo kojeg svojstva, veličina uzorka bi trebala biti najmanje 30-35 ljudi.

Što je veća varijabilnost svojstva koje se proučava, to bi trebalo da bude veća veličina uzorka. Stoga se varijabilnost može smanjiti povećanjem homogenosti uzorka, na primjer prema spolu, starosti itd. Ovo prirodno smanjuje mogućnost generaliziranja zaključaka.

Zavisni i nezavisni uzorci. Uobičajena istraživačka situacija je kada se osobina od interesa za istraživača proučava na dva ili više uzoraka u svrhu daljeg poređenja. Ovi uzorci mogu biti u različitim omjerima, ovisno o postupku njihove organizacije. Nezavisne uzorke karakteriše činjenica da vjerovatnoća odabira bilo kojeg subjekta u jednom uzorku ne ovisi o odabiru bilo kojeg od ispitanika u drugom uzorku. Naprotiv, zavisne uzorke karakteriše činjenica da se svakom subjektu iz jednog uzorka po određenom kriterijumu uparuje subjekt iz drugog uzorka.

Najtipičniji primjer nezavisnog uzorka je, na primjer, poređenje muškaraca i žena u smislu inteligencije.

Koncept reprezentativnosti. Idejni objekt i populacija. Dizajnirani objekat. Dizajnirana i realna populacija.

Znamo da se sociološka nauka ne bavi fluidnom neposrednošću života, već podacima organizovanim prema određenim pravilima u prostoru karakteristika. Pod podacima podrazumijevamo vrijednosti varijabli dodijeljenih jedinicama proučavanja - objektima. Ovi objekti – zajednice, institucije, ljudi, tekstovi, stvari – formiraju različite i često bizarne konfiguracije u prostoru atributa, dajući istraživaču mogućnost da donosi generalizirane sudove o stvarnosti.

Čim govorimo o realnosti, ispada da se dobijeni podaci odnose, striktno govoreći, samo na registracione dokumente (upitnici, obrasci za intervjue, protokoli posmatranja itd.). Nema garancija da stvarnost izvan laboratorijskih prozora (recimo, s druge strane vage) neće biti drugačija. Još nismo došli do procedure uzorkovanja, ali se već postavlja pitanje reprezentativnosti podataka: da li je moguće proširiti informacije dobijene tokom istraživanja na objekte koji se nalaze izvan našeg specifičnog iskustva? Odgovor je jasan: možete. Inače, naša zapažanja ne bi išla dalje od totaliteta ovdje-sada. Oni se ne bi odnosili na Moskovljane, već na one koji su upravo bili telefonski intervjuisani u Moskvi; ne čitaocima lista Nedelja, već onima koji su popunjeni kupon za otkidanje poslali uredniku poštom. Nakon popunjavanja ankete, dužni smo pretpostaviti da su i „Moskovljani“ i „čitaoci“ ostali isti. Vjerujemo u stabilnost svijeta jer naučna zapažanja otkrivaju zadivljujuću postojanost.

Svako pojedinačno posmatranje proteže se na šire polje posmatranja, a problem reprezentacije je da se utvrdi stepen korespondencije između parametara anketirane populacije i „stvarnih“ karakteristika objekta. Procedura uzorkovanja namijenjena je upravo rekonstrukciji stvarnog objekta proučavanja i opće populacije iz pojedinačnih trenutnih zapažanja.

Koncept reprezentativnosti uzorka blizak je konceptu eksterne validnosti; samo u prvom slučaju dolazi do ekstrapolacije iste karakteristike na širi skup jedinica, au drugom - prijelaz iz jednog semantičkog konteksta u drugi. Proceduru uzorkovanja svaka osoba provodi hiljadu puta dnevno, a o reprezentativnosti zapažanja baš niko ne razmišlja. Iskustvo zamjenjuje kalkulaciju. Da biste saznali je li kaša dobro posoljena, uopće nije potrebno pojesti cijelu tavu - ovdje su učinkovitije metode ispitivanja bez razaranja, uključujući provjere na licu mjesta: morate probati jednu žlicu. Istovremeno, morate biti sigurni da je kaša dobro izmiješana. Ako je kaša loše izmiješana, ima smisla uzeti ne jedno mjerenje, već niz, odnosno pokušati na različitim mjestima u tavi - ovo je već uzorak. Teže je osigurati da studentov odgovor na ispitu predstavlja njegovo znanje i da nije slučajan uspjeh ili neuspjeh. Da biste to učinili, postavlja se nekoliko pitanja. Pretpostavlja se da kada bi učenik odgovorio na sva moguća pitanja o nekoj temi, rezultat bi bio „tačan“, odnosno odražavao bi pravo znanje. Ali tada niko ne bi mogao da položi ispit.



Osnova postupka uzorkovanja je uvijek “ako” - pretpostavka da ekstrapolacija zapažanja neće značajno promijeniti dobijeni rezultat. Stoga se populacija može definirati kao “objektivna mogućnost” populacije uzorka.

Problem postaje nešto složeniji ako shvatimo šta se podrazumijeva pod predmetom proučavanja. Proučavajući prilično veliku populaciju ljudi, sociolog dolazi do zaključka da je varijabla "radikalizam-konzervativizam" u pozitivnoj korelaciji s godinama: posebno su starije generacije više konzervativne nego revolucionarne. Ali ispitani objekat – populacija uzorka – ne postoji u stvarnosti kao takav. Konstruiše se postupkom odabira ispitanika i vođenja intervjua, a zatim odmah nestaje, rastvara se u nizu. Zaista, populacija uzorka iz koje se podaci direktno „uklanjaju“ generira se postupkom, ali se istovremeno rastvara u većoj populaciji koju predstavlja ili predstavlja s različitim stupnjevima točnosti i pouzdanosti. Sociološki zaključci se ne odnose na ispitanike anketirane prošle sedmice, već na idealizirane objekte: “starije generacije”, “mladost”, one koji pokazuju “radikalizam” ili “konzervativizam”. Riječ je o kategorijalnim generalizacijama koje nisu ograničene prostorno-vremenskim okolnostima. U tom smislu, selektivni postupak pomaže da se oslobodimo zapažanja i pređemo u svijet ideja.

Dakle, imamo priliku da razlikujemo predmet istraživanja i opću populaciju: objekat nije samo skup jedinica, već koncept u skladu s kojim se vrši identifikacija i odabir istraživačkih jedinica. S tim u vezi, ispravna je Hegelova naredba da se istinitim smatra samo ono biće koje odgovara njegovom konceptu. Teoretski, obim koncepta koji označava predmet proučavanja trebao bi odgovarati obimu opće populacije. Međutim, takva korespondencija se ostvaruje izuzetno rijetko.

Trebaće nam koncept konceptualni objekat - idealan konstrukt koji označava okvir teme. „Rusi”, „publika centralnih novina”, „biračko telo”, „demokratska javnost” – tipični su objekti istraživačkog interesovanja sociologa. Nesumnjivo, potpuno realna opšta populacija mora odgovarati konceptualnom objektu. Da biste to učinili, potrebno je obezbijediti još jedan predmet proučavanja - projektovanog objekta. Projektovani objekat je skup jedinica dostupnih istraživaču. Izazov je identificirati grupe koje su nedostupne ili teško dostupne za prikupljanje podataka.

Očigledno je da je gotovo nemoguće ispitati objekat označen kao „Rusi“. Među Rusima, mnogo ljudi je u zatvorima, kazneno-popravnim ustanovama, istražnim zatvorima i drugim mjestima do kojih je intervjueru teško doći. Ova grupa će se morati „oduzeti“ od projektovanog objekta. Mnogi pacijenti u psihijatrijskim bolnicama, djeca i neki stariji ljudi također će morati biti „oduzeti“. Malo je vjerovatno da će civilni sociolog moći pružiti normalne šanse vojnom osoblju da bude uključeno u uzorak. Slični problemi prate ankete čitalaca, birača, stanovnika malih gradova i posetilaca pozorišta.

Navedene poteškoće samo su mali dio onih često nepremostivih prepreka sa kojima se sociolog suočava u terenskoj fazi istraživanja. Stručnjak mora predvidjeti ove poteškoće i ne stvarati iluzije o potpunoj implementaciji projektovanog objekta. U suprotnom će biti razočaran.

Dakle, predmet proučavanja se ne poklapa sa opštom populacijom na isti način kao što se karta područja ne poklapa sa samim područjem.

Dugo smo razmišljali i čudili se, Generali su sve napisali na velikom listu papira. Na papiru je bilo glatko, ali su zaboravili na jaruge, I hodajući po njima -

Ove riječi iz jedne stare vojničke pjesme su prilično primjenjive na dizajn uzorka, s obzirom da ćete morati hodati od stana do stana.

Naravno, populacija je populacija iz koje su jedinice uzorkovane. Međutim, tako se samo čini. Uzorak je izvučen iz populacije iz koje je napravljen stvarni odabir ispitanika. Pozovimo je pravi. Razlike između projektovane i stvarne populacije mogu se uočiti iz prve ruke upoređivanjem spiskova „predviđenih“ ispitanika i onih s kojima je stvarno intervjuisan.

Pravi objekt je totalitet koji je formiran u fazi terenskog istraživanja, uzimajući u obzir ograničenja u dostupnosti primarnih socioloških informacija. Pored zatvorenika, vojnog osoblja i bolesnika, manje je vjerovatno da će u uzorak biti uključeni stanovnici sela udaljenih od saobraćajnih komunikacija, posebno ako se anketa sprovodi u jesen; oni koji po pravilu nisu kod kuće, nisu skloni da razgovaraju sa strancima i sl. Dešava se da anketari, koristeći nedostatak kontrole, zanemare da tačno izvršavaju svoje dužnosti i intervjuišu ne one koji bi trebalo da budu intervjuisan po uputstvu, ali one koje je lakše “dobiti”. Na primjer, anketarima je naređeno da posjete stanove ispitanika uveče, kada ih je lakše naći kod kuće. Ako se studija provodi, recimo, u novembru, onda je u pet sati uveče u centralnoj Rusiji ulica potpuno mračna. U mnogim gradovima se ne nalaze često natpisi s nazivima ulica i kućnim brojevima. Ako poslove anketara obavljaju studenti lokalnog pedagoškog zavoda, može se zamisliti stepen odstupanja stvarnog objekta od projektovanog. Ponekad istraživači to rade još jednostavnije: sami popunjavaju upitnike. Ove poteškoće su jedan od izvora takozvane pristranosti uzorkovanja.

Postoje prilično efikasni načini za kontrolu popunjavanja upitnika i metode za popravku uzorka, posebno „vaganje“ glavnih tipoloških grupa ispitanika: grupe onih koji nedostaju se povećavaju, a grupe viška smanjuju. Na ovaj način se pravi niz prilagođava projektovanom i to je sasvim opravdano.

http://www.hi-edu.ru/e-books/xbook096/01/index.html?part-011.htm– veoma korisna stranica!

Metoda uzorkovanja je glavna statistička metoda. Ovo je prirodno, budući da je obim objekata koji se proučavaju obično beskonačan (a čak i ako je konačan, vrlo je teško sortirati sve objekte; treba se zadovoljiti samo jednim od njih, selekcijom).

Opća i uzorkovana populacija

Opća populacija je ukupnost svih elemenata proučavanih u datom eksperimentu.

Populacija uzorka (ili uzorak) je konačna kolekcija objekata nasumično odabranih iz populacije.

Obim populacije (uzorak ili generalni) je broj objekata u ovoj populaciji.

Primjer opće populacije i populacije uzorka

Recimo da proučavamo psihološku predispoziciju osobe za podelu datog segmenta u odnosu na zlatni rez. Budući da nastanak samog koncepta zlatnog presjeka diktira antropometrija ljudskog tijela, jasno je da je u ovom slučaju opšta populacija svako antropogeno stvorenje koje je dostiglo fizičku zrelost i dobilo konačne razmjere, tj. odraslog dijela čovječanstva. Obim ove kolekcije je praktično beskonačan.

Ako se ova predispozicija proučava isključivo u umjetničkom okruženju, onda su opća populacija ljudi koji su direktno povezani s dizajnom: umjetnici, arhitekti, dizajneri. Takvih je također mnogo, a možemo pretpostaviti da je i obim opšte populacije u ovom slučaju beskonačan.

U oba slučaja, za istraživanje smo prinuđeni da se ograničimo na razumne veličine uzorka, birajući kao predstavnike jedne ili druge populacije studente tehničkih specijalnosti (kao osobe daleko od umjetničkog svijeta) ili studente dizajna (kao osobe direktno povezane s svjetske umjetničke slike).

Reprezentativnost

Osnovni problem metode uzorkovanja je pitanje koliko tačno odabrani objekti iz opšte populacije za istraživanje predstavljaju proučavane karakteristike opšte populacije, odnosno pitanje reprezentativnosti uzorka.

Dakle, uzorak se naziva reprezentativnim ako dovoljno precizno predstavlja kvantitativne odnose opšte populacije.

Naravno, teško je reći šta se tačno krije iza nejasne formulacije prilično precizno. Pitanja reprezentativnosti su općenito najkontroverznija u bilo kojoj eksperimentalnoj studiji. Mnogo je primjera, koji su već postali klasični, kada je nedovoljna reprezentativnost uzorka dovodila eksperimentatore do apsurdnih rezultata.

Pitanja reprezentativnosti se po pravilu rješavaju stručnom ocjenom, kada naučna zajednica prihvata stajalište grupe autoritativnih stručnjaka o ispravnosti studije.

Primjer reprezentativnosti

Vratimo se na primjer dijeljenja segmenta. Pitanja reprezentativnosti uzoraka leže u samoj osnovi ove studije: ni u kom slučaju ne bismo trebali miješati grupe subjekata na osnovu njihove pripadnosti umjetničkom okruženju.

Statistička distribucija posmatrane karakteristike

Učestalost posmatrane vrednosti

Neka, kao rezultat testiranja u zapremini uzorka, posmatrani atribut poprimi vrednosti,, ..., a vrednost je posmatrana jednom, vrednost je posmatrana jednom, itd., vrednost je posmatrana jednom. Tada se frekvencija posmatrane vrijednosti naziva broj, vrijednosti su brojevi itd.

Relativna učestalost posmatrane vrijednosti

Relativna frekvencija posmatrane vrijednosti je omjer frekvencije i veličine uzorka:

Jasno je da bi zbir frekvencija posmatrane karakteristike trebao dati veličinu uzorka

a zbir relativnih frekvencija treba da daje jedinicu:

Ova razmatranja se mogu koristiti za kontrolu prilikom sastavljanja statističkih tabela. Ako jednakosti nisu ispunjene, tada je napravljena greška prilikom snimanja rezultata eksperimenta.

Statistička distribucija posmatrane vrijednosti

Statistička distribucija posmatrane karakteristike je korespondencija između posmatranih vrednosti karakteristike i odgovarajućih frekvencija (ili relativnih frekvencija).

U pravilu se statistička distribucija ispisuje u obliku dvoredne tablice, u kojoj su u prvom redu naznačene uočene vrijednosti karakteristike, a u drugom odgovarajuće frekvencije (ili relativne frekvencije). linija:

Dakle, obrasci kojima je slučajna varijabla koja se proučava fizički su potpuno određeni stvarnim skupom uslova za njeno posmatranje (ili eksperiment), a matematički su specificirani odgovarajućim prostorom vjerovatnoće ili, što je isto, odgovarajućim zakon raspodjele vjerovatnoće. Međutim, pri provođenju statističkih istraživanja, jedna druga terminologija povezana s konceptom opće populacije pokazuje se nešto prikladnijom.

Opšta populacija je ukupnost svih zamislivih zapažanja (ili svih mentalno mogućih objekata tipa koji nas zanimaju, iz kojih su „preuzeta“ zapažanja) koja bi se mogla izvršiti pod datim stvarnim skupom uslova. Budući da se definicija bavi svim mentalno mogućim zapažanjima (ili objektima), koncept opšte populacije je uslovno matematički, apstraktan koncept i ne treba ga mešati sa stvarnim populacijama koje su predmet statističkog istraživanja. Dakle, nakon što smo ispitali čak i sva preduzeća podindustrije sa stanovišta evidentiranja vrednosti tehničko-ekonomskih pokazatelja koji ih karakterišu, ispitanu populaciju možemo posmatrati samo kao predstavnika hipotetički moguće šire populacije preduzeća. koji bi mogli da rade u okviru istog stvarnog skupa uslova

U praktičnom radu zgodnije je izbor povezati sa objektima posmatranja, a ne sa karakteristikama ovih objekata. Biramo mašine, geološke uzorke, ljude za proučavanje, ali ne vrednosti karakteristika mašina, uzoraka, ljudi. S druge strane, u matematičkoj teoriji objekti i skup njihovih karakteristika se ne razlikuju i dualnost uvedene definicije nestaje.

Kao što vidimo, matematički koncept “generalne populacije” je fizički potpuno određen, kao i koncepti “prostora vjerovatnoće”, “slučajne varijable” i “zakona raspodjele vjerovatnoće”, odgovarajućim realnim skupom uslova, a samim tim i svih ova četiri matematička koncepta mogu se smatrati u određenom značenju sinonimima. Populacija se naziva konačna ili beskonačna u zavisnosti od toga da li je zbirka svih zamislivih zapažanja konačna ili beskonačna.

Iz definicije slijedi da su kontinuirane populacije (sastoje se od opažanja znakova kontinuirane prirode) uvijek beskonačne. Diskretne opšte populacije mogu biti beskonačne ili konačne. Na primjer, ako se serija od N proizvoda analizira za ocjenu (vidi primjer u klauzuli 4.1.3), kada se svaki proizvod može dodijeliti jednom od četiri razreda, slučajna varijabla koja se proučava je broj razreda proizvoda koji je nasumično izdvojen iz serija, a skup mogućih vrijednosti slučajna varijabla se sastoji od četiri tačke (1, 2, 3 i 4), tada će, očigledno, populacija biti konačna (samo N zamislivih zapažanja).

Koncept beskonačne populacije je matematička apstrakcija, kao i ideja da se mjerenje slučajne varijable može ponoviti beskonačan broj puta. Približno beskonačna opšta populacija može se tumačiti kao granični slučaj konačne, kada se broj objekata generisanih datim realnim skupom uslova neograničeno povećava. Dakle, ako u upravo datom primjeru, umjesto serija proizvoda, razmotrimo kontinuiranu masovnu proizvodnju istih proizvoda, onda ćemo doći do koncepta beskonačne opće populacije. U praksi, takva modifikacija je ekvivalentna zahtjevu

Uzorak iz date populacije je rezultat ograničene serije promatranja slučajne varijable. Uzorak se može smatrati svojevrsnim empirijskim analogom opće populacije, čime se najčešće bavimo u praksi, budući da ispitivanje cijele opće populacije može biti ili previše radno intenzivno (u slučaju velikog N) ili suštinski nemoguće (u slučaju beskonačnih općih populacija).

Broj opservacija koje formiraju uzorak naziva se veličina uzorka.

Ako je veličina uzorka velika i imamo posla s jednodimenzionalnom kontinuiranom vrijednošću (ili s jednodimenzionalnom diskretnom vrijednošću čiji je broj mogućih vrijednosti prilično velik, recimo više od 10), onda je često zgodnije je, sa stanovišta pojednostavljenja dalje statističke obrade rezultata opservacije, preći na takozvane "grupirane" podatke uzorka. Ovaj prijelaz se obično izvodi na sljedeći način:

a) zabilježene su najmanje i najveće vrijednosti u uzorku;

b) ceo posmatrani raspon je podeljen na određeni broj od 5 jednakih intervala grupisanja; u ovom slučaju, broj intervala s ne smije biti manji od 8-10 i veći od 20-25: izbor broja intervala značajno ovisi o veličini uzorka; za približnu orijentaciju u izboru 5 možete koristiti približnu formulu

što bi prije trebalo uzeti kao nižu procjenu za s (posebno za velike

c) krajnje tačke svakog od intervala su označene rastućim redom, kao i njihove sredine

d) broj uzoraka podataka koji spadaju u svaki od intervala se broji: (očigledno); uzorci podataka koji padaju na granice intervala ili su ravnomjerno raspoređeni na dva susjedna intervala, ili je dogovoreno da se dodijele samo jednom od njih, na primjer, lijevom.

Ovisno o specifičnom sadržaju problema, mogu se napraviti neke modifikacije ove šeme grupisanja (na primjer, u nekim slučajevima je preporučljivo napustiti zahtjev jednakih dužina intervala grupisanja).

U svim daljnjim argumentima koristeći uzorke podataka, polazit ćemo od upravo opisane notacije.

Podsjetimo da je suština statističkih metoda korištenje određenog dijela opće populacije (tj. uzorka) za donošenje sudova o njenim svojstvima u cjelini.

Jedno od najvažnijih pitanja, čije uspješno rješavanje određuje pouzdanost zaključaka dobijenih kao rezultat statističke obrade podataka, jeste pitanje reprezentativnosti uzorka, tj. pitanje kompletnosti i adekvatnosti njegovog predstavljanja svojstava analizirane opšte populacije koja nas zanimaju. U praktičnom radu ista grupa objekata uzetih za proučavanje može se smatrati uzorkom iz različitih općih populacija. Dakle, grupa porodica nasumično odabranih iz zadružnih kuća jednog od ureda za stambeno održavanje (ZhEK) jednog od gradskih okruga za detaljno sociološko istraživanje može se smatrati i uzorkom iz opšte populacije porodica (sa zadrugom oblik stanovanja) ovog ZhEK-a, i kao uzorak iz opšte populacije porodica datog područja, i kao uzorak iz opšte populacije svih porodica u gradu, i, konačno, kao uzorak iz opšte populacije svih porodice u gradu koje žive u zadružnim kućama. Smisleno tumačenje rezultata testiranja značajno zavisi od toga za koju opštu populaciju razmatramo odabranu grupu porodica, za koju opštu populaciju se ovaj uzorak može smatrati reprezentativnim. Odgovor na ovo pitanje zavisi od mnogo faktora. U gornjem primjeru, to posebno ovisi o prisutnosti ili odsustvu posebnog (možda skrivenog) faktora koji određuje pripadnost porodice datoj stambenoj kancelariji ili okrugu u cjelini (takav faktor može biti npr. prosječan prihod porodice po glavi stanovnika, geografska lokacija okruga u gradu, „starost“ područja, itd.).