heim / Über die Krankheit/ In welchen Fällen ist die Allgemeinbevölkerung in der Studie. Allgemeine und Stichprobenpopulationen. Das Konzept der Repräsentativität

In welchen Fällen ist die Allgemeinbevölkerung in der Studie. Allgemeine und Stichprobenpopulationen. Das Konzept der Repräsentativität

Statistische Bevölkerung- eine Reihe von Einheiten, die Massencharakter, Typizität, qualitative Homogenität und das Vorhandensein von Variationen aufweisen.

Die statistische Grundgesamtheit besteht aus materiell existierenden Objekten (Mitarbeiter, Unternehmen, Länder, Regionen), ist ein Objekt.

Einheit der Bevölkerung— jede spezifische Einheit einer statistischen Grundgesamtheit.

Die gleiche statistische Grundgesamtheit kann in einem Merkmal homogen und in einem anderen heterogen sein.

Qualitative Einheitlichkeit- Ähnlichkeit aller Bevölkerungseinheiten auf einer bestimmten Basis und Unähnlichkeit auf allen anderen.

In einer statistischen Grundgesamtheit sind die Unterschiede zwischen einer Bevölkerungseinheit und einer anderen häufig quantitativer Natur. Quantitative Änderungen der Kennwerte verschiedene Einheiten Aggregate werden Variation genannt.

Variation eines Merkmals- eine quantitative Änderung eines Merkmals (für ein quantitatives Merkmal) während des Übergangs von einer Bevölkerungseinheit zu einer anderen.

Zeichen- Das ist eine Immobilie charakteristisch oder andere Merkmale von Einheiten, Objekten und Phänomenen, die beobachtet oder gemessen werden können. Zeichen werden in quantitative und qualitative unterteilt. Als Diversität und Variabilität des Wertes eines Merkmals in einzelnen Einheiten einer Population bezeichnet man Variation.

Attributive (qualitative) Merkmale können nicht numerisch ausgedrückt werden (Bevölkerungszusammensetzung nach Geschlecht). Quantitative Merkmale haben numerischer Ausdruck(Bevölkerungszusammensetzung nach Alter).

Index- Dies ist ein verallgemeinerndes quantitatives und qualitatives Merkmal jeder Eigenschaft von Einheiten oder Aggregaten als Ganzes unter bestimmten zeitlichen und örtlichen Bedingungen.

Scorecard ist eine Reihe von Indikatoren, die das untersuchte Phänomen umfassend widerspiegeln.

Beispielsweise wird das Gehalt untersucht:

Zeichen - Löhne
Statistische Grundgesamtheit – alle Mitarbeiter
Die Einheit der Bevölkerung ist jeder Arbeitnehmer
Qualitative Homogenität - aufgelaufene Löhne
Variation eines Zeichens – eine Reihe von Zahlen

Population und Stichprobe daraus

Grundlage ist ein Datensatz, der durch die Messung eines oder mehrerer Merkmale gewonnen wird. Eine wirklich beobachtete Menge von Objekten, statistisch dargestellt durch eine Anzahl von Beobachtungen einer Zufallsvariablen, ist Probenahme, und das hypothetisch existierende (vermutete) - Durchschnittsbevölkerung. Die Population kann endlich sein (Anzahl der Beobachtungen). N = konst) oder unendlich ( N = ∞) und eine Probe von Bevölkerung ist immer das Ergebnis einer begrenzten Reihe von Beobachtungen. Die Anzahl der Beobachtungen, die eine Stichprobe bilden, wird aufgerufen Stichprobengröße. Wenn die Stichprobengröße groß genug ist ( n → ∞) wird die Stichprobe berücksichtigt groß, ansonsten spricht man von Sampling begrenztes Volumen. Die Stichprobe wird berücksichtigt klein, wenn bei der Messung einer eindimensionalen Zufallsvariablen die Stichprobengröße 30 nicht überschreitet ( N<= 30 ), und bei gleichzeitiger Messung mehrerer ( k) Merkmale im mehrdimensionalen Beziehungsraum N Zu küberschreitet nicht 10 (n/k< 10) . Die Musterformulare Variationsreihe, wenn seine Mitglieder sind Ordinalstatistik, also Stichprobenwerte der Zufallsvariablen X werden in aufsteigender Reihenfolge (Ranking) geordnet, die Werte des Merkmals werden aufgerufen Optionen.

Beispiel. Fast derselbe zufällig ausgewählte Satz von Objekten – Geschäftsbanken eines Moskauer Verwaltungsbezirks – kann als Stichprobe aus der Gesamtbevölkerung aller Geschäftsbanken in diesem Bezirk und als Stichprobe aus der Gesamtbevölkerung aller Geschäftsbanken in Moskau betrachtet werden sowie eine Stichprobe der Geschäftsbanken des Landes usw.

Grundlegende Methoden zur Organisation der Probenahme

Die Zuverlässigkeit statistischer Schlussfolgerungen und die sinnvolle Interpretation der Ergebnisse hängen davon ab Repräsentativität Proben, d.h. Vollständigkeit und Angemessenheit der Darstellung der Eigenschaften der Allgemeinbevölkerung, in Bezug auf die diese Stichprobe als repräsentativ angesehen werden kann. Die Untersuchung der statistischen Eigenschaften einer Population kann auf zwei Arten organisiert werden: mithilfe kontinuierlich Und nicht kontinuierlich. Kontinuierliche Beobachtung sieht die Prüfung aller vor Einheiten studiert Gesamtheit, A teilweise (selektive) Beobachtung- nur Teile davon.

Es gibt fünf Hauptmethoden zur Organisation der Probenbeobachtung:

1. einfache Zufallsauswahl, bei dem Objekte zufällig aus einer Population von Objekten ausgewählt werden (z. B. mithilfe einer Tabelle oder eines Zufallszahlengenerators), wobei jede der möglichen Stichproben die gleiche Wahrscheinlichkeit hat. Solche Proben werden aufgerufen eigentlich zufällig;

2. einfache Auswahl nach einem regulären Verfahren wird mithilfe einer mechanischen Komponente (z. B. Datum, Wochentag, Wohnungsnummer, Buchstaben des Alphabets usw.) durchgeführt und die so gewonnenen Proben aufgerufen mechanisch;

3. geschichtet Die Auswahl besteht darin, dass die Gesamtbevölkerung des Volumens in Teilpopulationen oder Schichten (Schichten) des Volumens unterteilt wird, sodass . Schichten sind hinsichtlich statistischer Merkmale homogene Objekte (z. B. wird die Bevölkerung nach Altersgruppen oder sozialer Schicht in Schichten eingeteilt; Unternehmen nach Branchen). In diesem Fall werden die Samples aufgerufen geschichtet(ansonsten, geschichtet, typisch, regionalisiert);

4. Methoden seriell Auswahl werden zur Bildung verwendet seriell oder Nestproben. Sie sind praktisch, wenn ein „Block“ oder eine Reihe von Objekten gleichzeitig untersucht werden muss (z. B. eine Warenpartie, Produkte einer bestimmten Serie oder die Bevölkerung einer territorial-administrativen Einheit des Landes). Die Auswahl der Serien kann rein zufällig oder maschinell erfolgen. In diesem Fall wird eine vollständige Inspektion einer bestimmten Warenpartie oder einer gesamten Gebietseinheit (Wohngebäude oder Wohnblock) durchgeführt;

5. kombiniert(gestufte) Auswahl kann mehrere Auswahlmethoden gleichzeitig kombinieren (z. B. geschichtet und zufällig oder zufällig und mechanisch); eine solche Probe heißt kombiniert.

Arten der Auswahl

Von Geist Es wird zwischen Einzel-, Gruppen- und kombinierter Auswahl unterschieden. Bei individuelle Auswahl einzelne Einheiten der Gesamtbevölkerung werden in die Stichprobenpopulation aufgenommen, mit Gruppenauswahl- qualitativ homogene Gruppen (Reihen) von Einheiten und kombinierte Auswahl beinhaltet eine Kombination des ersten und zweiten Typs.

Von Methode Auswahl wird unterschieden wiederholt und nicht-wiederholend Probe.

Wiederhollos sogenannte Selektion, bei der eine in der Stichprobe enthaltene Einheit nicht zur ursprünglichen Grundgesamtheit zurückkehrt und nicht an der weiteren Selektion teilnimmt; während die Anzahl der Einheiten in der Gesamtbevölkerung N wird während des Auswahlprozesses reduziert. Bei wiederholt Auswahl erwischt in der Stichprobe geht eine Einheit nach der Registrierung an die Gesamtbevölkerung zurück und behält somit die gleiche Chance wie andere Einheiten, in einem weiteren Auswahlverfahren verwendet zu werden; während die Anzahl der Einheiten in der Gesamtbevölkerung N bleibt unverändert (die Methode wird in der sozioökonomischen Forschung selten verwendet). Allerdings mit großen N (N → ∞) Formeln für wiederholbar Auswahl nähert sich denen für wiederholt Auswahl und letztere werden praktisch häufiger verwendet ( N = konst).

Grundlegende Merkmale der Parameter der Allgemein- und Stichprobenpopulation

Die statistischen Schlussfolgerungen der Studie basieren auf der Verteilung der Zufallsvariablen und den beobachteten Werten (x 1, x 2, ..., x n) werden Realisierungen der Zufallsvariablen genannt X(n ist die Stichprobengröße). Die Verteilung einer Zufallsvariablen in der Gesamtbevölkerung ist theoretischer, idealer Natur, und ihr Stichprobenanalogon ist es auch empirisch Verteilung. Einige theoretische Verteilungen werden analytisch spezifiziert, d. h. ihre Optionen Bestimmen Sie den Wert der Verteilungsfunktion an jedem Punkt im Raum möglicher Werte der Zufallsvariablen. Für eine Stichprobe ist es daher schwierig und manchmal unmöglich, die Verteilungsfunktion zu bestimmen Optionen werden aus empirischen Daten geschätzt und dann in einen analytischen Ausdruck eingesetzt, der die theoretische Verteilung beschreibt. In diesem Fall ist die Annahme (bzw Hypothese) über die Art der Verteilung kann entweder statistisch korrekt oder falsch sein. Aber in jedem Fall charakterisiert die aus der Stichprobe rekonstruierte empirische Verteilung nur grob die wahre. Die wichtigsten Verteilungsparameter sind erwarteter Wert und Varianz.

Ausschüttungen sind ihrer Natur nach kontinuierlich Und diskret. Die bekannteste kontinuierliche Verteilung ist normal. Beispielanaloga der Parameter und dafür sind: Mittelwert und empirische Varianz. Unter den diskreten Methoden in der sozioökonomischen Forschung die am häufigsten verwendete alternativ (dichotom) Verteilung. Der mathematische Erwartungsparameter dieser Verteilung drückt den relativen Wert (bzw Aktie) Einheiten der Bevölkerung, die das untersuchte Merkmal aufweisen (es wird durch den Buchstaben gekennzeichnet); Der Anteil der Bevölkerung, der dieses Merkmal nicht aufweist, wird mit dem Buchstaben bezeichnet q (q = 1 - p). Die Varianz der Alternativverteilung hat auch eine empirische Analogie.

Abhängig von der Art der Verteilung und der Methode zur Auswahl der Bevölkerungseinheiten werden die Eigenschaften der Verteilungsparameter unterschiedlich berechnet. Die wichtigsten für theoretische und empirische Verteilungen sind in der Tabelle aufgeführt. 9.1.

Probenfraktion k n Das Verhältnis der Anzahl der Einheiten in der Stichprobenpopulation zur Anzahl der Einheiten in der Gesamtbevölkerung heißt:

kn = n/N.

Probenfraktion w ist das Verhältnis der Einheiten, die das untersuchte Merkmal besitzen X zur Stichprobengröße N:

w = n n /n.

Beispiel. In einer Warenpartie mit 1000 Stück, mit einer 5 %-Probe Beispiel teilen k n im absoluten Wert beträgt 50 Einheiten. (n = N*0,05); Wenn in dieser Probe 2 fehlerhafte Produkte gefunden werden, dann Musterfehlerrate w beträgt 0,04 (w = 2/50 = 0,04 oder 4 %).

Da sich die Stichprobenpopulation von der Allgemeinbevölkerung unterscheidet, gibt es solche Stichprobenfehler.

Tabelle 9.1 Hauptparameter der Gesamt- und Stichprobenpopulation

Stichprobenfehler

In jedem Fall (kontinuierlich und selektiv) können zwei Arten von Fehlern auftreten: Registrierung und Repräsentativität. Fehler Anmeldung kann haben zufällig Und systematisch Charakter. Zufällig Fehler bestehen aus vielen verschiedenen, unkontrollierbaren Ursachen, sind unbeabsichtigt und gleichen sich in der Regel gegenseitig aus (z. B. Änderungen der Geräteleistung aufgrund von Temperaturschwankungen im Raum).

Systematisch Fehler sind verzerrt, weil sie gegen die Regeln für die Auswahl von Objekten für die Probe verstoßen (z. B. Abweichungen bei den Messungen beim Ändern der Einstellungen des Messgeräts).

Beispiel. Zur Beurteilung der sozialen Situation der Bevölkerung in der Stadt ist eine Befragung von 25 % der Familien geplant. Wenn jede vierte Wohnung anhand ihrer Anzahl ausgewählt wird, besteht die Gefahr, dass alle Wohnungen nur eines Typs (z. B. Einzimmerwohnungen) ausgewählt werden, was zu einem systematischen Fehler führt und die Ergebnisse verfälscht; Die Wahl einer Wohnungsnummer per Los ist vorzuziehen, da der Fehler zufällig ist.

Repräsentativitätsfehler sind nur der Stichprobenbeobachtung inhärent, lassen sich nicht vermeiden und entstehen dadurch, dass die Stichprobenpopulation die Gesamtbevölkerung nicht vollständig reproduziert. Die Werte der aus der Stichprobe gewonnenen Indikatoren unterscheiden sich von den Indikatoren gleicher Werte in der Allgemeinbevölkerung (oder werden durch kontinuierliche Beobachtung ermittelt).

Stichprobenverzerrung ist die Differenz zwischen dem Parameterwert in der Grundgesamtheit und ihrem Stichprobenwert. Für den Durchschnittswert eines quantitativen Merkmals ist er gleich: , und für den Anteil (alternatives Merkmal) - .

Stichprobenfehler treten nur bei Stichprobenbeobachtungen auf. Je größer diese Fehler sind, desto stärker weicht die empirische Verteilung von der theoretischen ab. Die Parameter der empirischen Verteilung sind Zufallsvariablen, daher sind Stichprobenfehler auch Zufallsvariablen, sie können für verschiedene Stichproben unterschiedliche Werte annehmen und sind daher üblich zu berechnen durchschnittlicher Fehler.

Durchschnittlicher Stichprobenfehler ist eine Größe, die die Standardabweichung des Stichprobenmittelwerts von der mathematischen Erwartung ausdrückt. Dieser Wert unterliegt dem Prinzip der Zufallsauswahl und hängt in erster Linie von der Stichprobengröße und dem Grad der Variation des Merkmals ab: Je größer und je kleiner die Variation des Merkmals (und damit des Wertes) ist, desto kleiner ist der durchschnittliche Stichprobenfehler . Die Beziehung zwischen den Varianzen der Grundgesamtheit und der Stichprobenpopulation wird durch die Formel ausgedrückt:

diese. Wenn es groß genug ist, können wir davon ausgehen, dass . Der durchschnittliche Stichprobenfehler zeigt mögliche Abweichungen des Parameters der Stichprobenpopulation vom Parameter der Gesamtpopulation. In der Tabelle Tabelle 9.2 zeigt Ausdrücke zur Berechnung des durchschnittlichen Stichprobenfehlers für verschiedene Methoden zur Organisation der Beobachtung.

Tabelle 9.2 Durchschnittlicher Fehler (m) des Stichprobenmittelwerts und -anteils für verschiedene Stichprobentypen

Wo ist der Durchschnitt der Stichprobenvarianzen innerhalb der Gruppe für ein kontinuierliches Attribut?

Durchschnitt der gruppeninternen Varianzen des Anteils;

— Anzahl der ausgewählten Serien, — Gesamtzahl der Serien;

wo ist der Durchschnitt der th-Reihe;

— der Gesamtdurchschnitt für die gesamte Stichprobenpopulation für ein kontinuierliches Merkmal;

wo ist der Anteil des Merkmals in der th-Reihe;

— der Gesamtanteil des Merkmals an der gesamten Stichprobenpopulation.

Die Größe des durchschnittlichen Fehlers kann jedoch nur mit einer bestimmten Wahrscheinlichkeit P (P ≤ 1) beurteilt werden. Lyapunov A.M. bewiesen, dass die Verteilung der Stichprobenmittelwerte und damit ihre Abweichungen vom allgemeinen Mittelwert für eine ausreichend große Zahl annähernd dem Normalverteilungsgesetz gehorcht, vorausgesetzt, dass die Gesamtbevölkerung einen endlichen Mittelwert und eine begrenzte Varianz aufweist.

Mathematisch lässt sich diese Aussage für den Durchschnitt wie folgt ausdrücken:

und für den Anteil nimmt Ausdruck (1) die Form an:

Wo - Es gibt marginaler Stichprobenfehler, was ein Vielfaches des durchschnittlichen Stichprobenfehlers ist , und der Multiplizitätskoeffizient ist der Student-Test („Konfidenzkoeffizient“), vorgeschlagen von W.S. Gosset (Pseudonym „Student“); Werte für verschiedene Stichprobengrößen werden in einer speziellen Tabelle gespeichert.

Die Werte der Funktion Ф(t) für einige Werte von t sind gleich:

Daher kann Ausdruck (3) wie folgt gelesen werden: mit Wahrscheinlichkeit P = 0,683 (68,3 %) Es kann argumentiert werden, dass die Differenz zwischen der Stichprobe und dem Gesamtdurchschnitt einen Wert des Durchschnittsfehlers nicht überschreiten wird m(t=1), mit Wahrscheinlichkeit P = 0,954 (95,4 %)- dass er den Wert von zwei durchschnittlichen Fehlern nicht überschreitet m (t = 2) , mit Wahrscheinlichkeit P = 0,997 (99,7 %)- wird drei Werte nicht überschreiten m (t = 3) . Somit wird die Wahrscheinlichkeit, dass diese Differenz das Dreifache des durchschnittlichen Fehlers überschreitet, bestimmt durch Fehlerstufe und beläuft sich auf nichts mehr 0,3% .

In der Tabelle In Abb. 9.3 zeigt Formeln zur Berechnung des maximalen Stichprobenfehlers.

Tabelle 9.3 Grenzfehler (D) der Stichprobe für den Mittelwert und Anteil (p) für verschiedene Arten der Stichprobenbeobachtung

Verallgemeinerung der Stichprobenergebnisse auf die Bevölkerung

Das ultimative Ziel der Stichprobenbeobachtung ist die Charakterisierung der Allgemeinbevölkerung. Bei kleinen Stichprobengrößen können empirische Schätzungen der Parameter ( und ) erheblich von ihren wahren Werten ( und ) abweichen. Daher müssen Grenzen festgelegt werden, innerhalb derer die wahren Werte ( und ) für die Beispielwerte der Parameter ( und ) liegen.

Konfidenzintervall eines beliebigen Parameters θ der Allgemeinbevölkerung ist der zufällige Wertebereich dieses Parameters, der mit einer Wahrscheinlichkeit nahe 1 ( Zuverlässigkeit) enthält den wahren Wert dieses Parameters.

Grenzfehler Proben Δ ermöglicht es Ihnen, die Grenzwerte der Merkmale der Allgemeinbevölkerung und deren zu bestimmen Vertrauensintervalle, die gleich sind:

Endeffekt Konfidenzintervall durch Subtraktion erhalten maximaler Fehler aus dem Stichprobenmittelwert (Anteil) und dem oberen durch Addition.

Konfidenzintervall Für den Durchschnitt wird der maximale Stichprobenfehler verwendet und für ein bestimmtes Konfidenzniveau durch die Formel bestimmt:

Das heißt, mit einer gegebenen Wahrscheinlichkeit R, das als Konfidenzniveau bezeichnet wird und durch den Wert eindeutig bestimmt wird T kann argumentiert werden, dass der wahre Wert des Durchschnitts im Bereich von liegt , und der wahre Wert der Aktie liegt im Bereich von

Bei der Berechnung des Konfidenzintervalls für drei Standard-Konfidenzniveaus P = 95 %, P = 99 % und P = 99,9 % Der Wert wird durch ausgewählt. Anwendungen abhängig von der Anzahl der Freiheitsgrade. Wenn die Stichprobengröße groß genug ist, entsprechen die Werte diesen Wahrscheinlichkeiten T sind gleich: 1,96, 2,58 Und 3,29 . Somit ermöglicht uns der marginale Stichprobenfehler, die Grenzwerte der Merkmale der Grundgesamtheit und deren Konfidenzintervalle zu bestimmen:

Die Verteilung der Ergebnisse der Stichprobenbeobachtung auf die Allgemeinbevölkerung in der sozioökonomischen Forschung weist ihre eigenen Besonderheiten auf, da sie eine vollständige Darstellung aller ihrer Typen und Gruppen erfordert. Grundlage für die Möglichkeit einer solchen Verteilung ist die Berechnung relativer Fehler:

Wo Δ % – relativer maximaler Stichprobenfehler; , .

Es gibt zwei Hauptmethoden, um eine Stichprobenbeobachtung auf eine Grundgesamtheit auszudehnen: direkte Neuberechnung und Koeffizientenmethode.

Wesen direkte Konvertierung besteht aus der Multiplikation des Stichprobenmittelwerts!!\overline(x) mit der Größe der Grundgesamtheit.

Beispiel. Die durchschnittliche Zahl der Kleinkinder in der Stadt soll durch die Stichprobenmethode geschätzt werden und eine Person betragen. Gibt es in der Stadt 1000 junge Familien, so ergibt sich die Anzahl der benötigten Plätze in städtischen Kindertagesstätten durch Multiplikation dieses Durchschnitts mit der Größe der Gesamtbevölkerung N = 1000, d. h. wird 1200 Sitzplätze haben.

Quotenmethode Die Verwendung empfiehlt sich bei selektiver Beobachtung, um die Daten einer kontinuierlichen Beobachtung zu klären.

Dabei wird folgende Formel verwendet:

wobei alle Variablen die Bevölkerungsgröße sind:

Erforderliche Stichprobengröße

Tabelle 9.4 Erforderliche Stichprobengröße (n) für verschiedene Arten von Stichprobenbeobachtungsorganisationen

Bei der Planung einer Stichprobenbeobachtung mit einem vorgegebenen Wert des zulässigen Stichprobenfehlers ist es notwendig, den erforderlichen richtig einzuschätzen Stichprobengröße. Dieses Volumen kann anhand des zulässigen Fehlers bei der Probenbeobachtung anhand einer vorgegebenen Wahrscheinlichkeit ermittelt werden, die den zulässigen Wert des Fehlerniveaus (unter Berücksichtigung der Art der Beobachtungsorganisation) garantiert. Formeln zur Bestimmung des erforderlichen Stichprobenumfangs n lassen sich leicht direkt aus den Formeln für den maximalen Stichprobenfehler ermitteln. Also, aus dem Ausdruck für den Grenzfehler:

Die Stichprobengröße wird direkt bestimmt N:

Diese Formel zeigt, dass der maximale Stichprobenfehler abnimmt Δ Die erforderliche Stichprobengröße erhöht sich erheblich, was proportional zur Varianz und zum Quadrat des Student-t-Tests ist.

Für eine bestimmte Methode zur Organisation der Beobachtung wird die erforderliche Stichprobengröße gemäß den in der Tabelle angegebenen Formeln berechnet. 9.4.

Praktische Berechnungsbeispiele

Beispiel 1. Berechnung des Mittelwerts und des Konfidenzintervalls für ein kontinuierliches quantitatives Merkmal.

Um die Geschwindigkeit der Abwicklung mit den Gläubigern zu beurteilen, wurde eine Stichprobe von 10 Zahlungsbelegen bei der Bank durchgeführt. Es stellte sich heraus, dass ihre Werte gleich waren (in Tagen): 10; 3; 15; 15; 22; 7; 8; 1; 19; 20.

Mit Wahrscheinlichkeit notwendig P = 0,954 Bestimmen Sie den Grenzfehler Δ Stichprobenmittelwert und Vertrauensgrenzen der mittleren Berechnungszeit.

Lösung. Der Durchschnittswert wird nach der Formel aus der Tabelle berechnet. 9,1 für die Stichprobenpopulation

Die Varianz wird anhand der Formel aus der Tabelle berechnet. 9.1.

Mittlerer quadratischer Fehler des Tages.

Der durchschnittliche Fehler wird nach folgender Formel berechnet:

diese. der Durchschnitt ist x ± m = 12,0 ± 2,3 Tage.

Die Zuverlässigkeit des Mittelwerts betrug

Wir berechnen den maximalen Fehler anhand der Formel aus der Tabelle. 9,3 für wiederholte Probenahmen, da die Populationsgröße unbekannt ist, und für P = 0,954 Maß an Selbstvertrauen.

Somit beträgt der Durchschnittswert `x ± D = `x ± 2m = 12,0 ± 4,6, d.h. sein wahrer Wert liegt im Bereich von 7,4 bis 16,6 Tagen.

Verwendung der T-Tabelle eines Schülers. Die Anwendung lässt den Schluss zu, dass für n = 10 – 1 = 9 Freiheitsgrade der erhaltene Wert mit einem Signifikanzniveau von £ 0,001 zuverlässig ist, d. h. der resultierende Mittelwert weicht deutlich von 0 ab.

Beispiel 2. Schätzung der Wahrscheinlichkeit (allgemeiner Anteil) p.

Bei einer maschinellen Stichprobenmethode zur Erhebung des sozialen Status von 1000 Familien wurde festgestellt, dass der Anteil der Familien mit niedrigem Einkommen betrug w = 0,3 (30 %)(Probe war 2% , d.h. n/N = 0,02). Erforderlich mit Konfidenzniveau p = 0,997 Bestimmen Sie den Indikator R Familien mit niedrigem Einkommen in der gesamten Region.

Lösung. Basierend auf den dargestellten Funktionswerten Ф(t) für ein gegebenes Konfidenzniveau finden P = 0,997 Bedeutung t = 3(siehe Formel 3). Grenzfehler des Bruchs w Bestimmen Sie anhand der Formel aus der Tabelle. 9.3 für nicht wiederkehrende Probenahme (mechanische Probenahme ist immer nicht wiederholbar):

Maximaler relativer Stichprobenfehler in % wird sein:

Die Wahrscheinlichkeit (allgemeiner Anteil) von Familien mit niedrigem Einkommen in der Region wird sein ð=w±Δw, und Konfidenzgrenzen p werden basierend auf der doppelten Ungleichung berechnet:

w — Δ w ≤ p ≤ w — Δ w, d.h. Der wahre Wert von p liegt in:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

Somit kann mit einer Wahrscheinlichkeit von 0,997 angegeben werden, dass der Anteil der Familien mit niedrigem Einkommen an allen Familien in der Region zwischen 28,6 % und 31,4 % liegt.

Beispiel 3. Berechnung des Mittelwerts und des Konfidenzintervalls für ein diskretes Merkmal, das durch eine Intervallreihe angegeben wird.

In der Tabelle 9.5. die Verteilung der Anträge auf Auftragserteilung wird nach dem Zeitpunkt ihrer Umsetzung durch das Unternehmen festgelegt.

Tabelle 9.5 Verteilung der Beobachtungen nach Zeitpunkt des Auftretens

Lösung. Die durchschnittliche Zeit für die Auftragsabwicklung wird nach folgender Formel berechnet:

Der durchschnittliche Zeitraum beträgt:

= (3*20 + 9*80 + 24*60 + 48*20 + 72*20)/200 = 23,1 Monate.

Die gleiche Antwort erhalten wir, wenn wir die Daten zu p i aus der vorletzten Spalte der Tabelle verwenden. 9.5, mit der Formel:

Beachten Sie, dass die Mitte des Intervalls für die letzte Abstufung durch künstliche Ergänzung mit der Breite des Intervalls der vorherigen Abstufung von 60 - 36 = 24 Monaten ermittelt wird.

Die Varianz wird anhand der Formel berechnet

Wo x i- die Mitte der Intervallreihe.

Daher!!\sigma = \frac (20^2 + 14^2 + 1 + 25^2 + 49^2)(4), und der mittlere quadratische Fehler beträgt .

Der durchschnittliche Fehler wird nach der Monatsformel berechnet, d. h. der Durchschnittswert beträgt!!\overline(x) ± m = 23,1 ± 13,4.

Wir berechnen den maximalen Fehler anhand der Formel aus der Tabelle. 9,3 für wiederholte Auswahl, da die Populationsgröße unbekannt ist, für ein Konfidenzniveau von 0,954:

Der Durchschnitt beträgt also:

diese. sein wahrer Wert liegt im Bereich von 0 bis 50 Monaten.

Beispiel 4. Um die Geschwindigkeit der Abwicklung mit Gläubigern von N = 500 Kapitalgesellschaften in einer Geschäftsbank zu bestimmen, ist es notwendig, eine Stichprobenstudie unter Verwendung einer zufälligen, sich nicht wiederholenden Auswahlmethode durchzuführen. Bestimmen Sie die erforderliche Stichprobengröße n so, dass mit einer Wahrscheinlichkeit P = 0,954 der Fehler des Stichprobenmittelwerts 3 Tage nicht überschreitet, wenn Versuchsschätzungen ergaben, dass die Standardabweichung s 10 Tage betrug.

Lösung. Um die Anzahl der erforderlichen Studien n zu bestimmen, verwenden wir die Formel für die nicht wiederkehrende Auswahl aus der Tabelle. 9.4:

Darin wird der t-Wert aus einem Konfidenzniveau von P = 0,954 ermittelt. Er ist gleich 2. Der mittlere Quadratwert beträgt s = 10, die Populationsgröße beträgt N = 500 und der maximale Fehler des Mittelwerts beträgt Δ x = 3. Wenn wir diese Werte in die Formel einsetzen, erhalten wir:

diese. Es reicht aus, eine Stichprobe von 41 Unternehmen zusammenzustellen, um den erforderlichen Parameter – die Geschwindigkeit der Abrechnung mit Gläubigern – abzuschätzen.

Forschung beginnt normalerweise mit einer Annahme, die anhand von Fakten überprüft werden muss. Diese Annahme – eine Hypothese – wird in Bezug auf den Zusammenhang von Phänomenen oder Eigenschaften in einer bestimmten Menge von Objekten formuliert. Um solche Annahmen anhand von Fakten zu überprüfen, ist es notwendig, die entsprechenden Eigenschaften ihrer Träger zu messen. Aber es ist beispielsweise unmöglich, die Angst bei allen Jugendlichen zu messen. Daher beschränkt sich die Forschung bei der Durchführung auf nur einen relativ kleinen Kreis von Vertretern der relevanten Bevölkerungsgruppen.

Bevölkerung- Dies ist die gesamte Menge von Objekten, in Bezug auf die eine Forschungshypothese formuliert wird. Theoretisch geht man davon aus, dass die Bevölkerungszahl unbegrenzt ist. In der Praxis ist der Umfang der Gesamtbevölkerung immer begrenzt und kann je nach Beobachtungsgegenstand und Aufgabe, die der Psychologe lösen muss, variieren. Typischerweise umfasst die Gesamtbevölkerung eine sehr große Anzahl von Objekten – Universitätsstudenten, Schüler, Unternehmensangestellte, Rentner usw. Eine vollständige Untersuchung der Gesamtbevölkerung ist äußerst schwierig, daher wird in der Regel ein kleiner Teil der Gesamtbevölkerung untersucht, der als Stichprobenpopulation oder Stichprobe bezeichnet wird.

Probenahme - Dies ist eine begrenzte Anzahl von Objekten (in der Psychologie - Probanden, Befragte), die speziell aus der allgemeinen Bevölkerung ausgewählt werden, um ihre Eigenschaften zu untersuchen. Dementsprechend wird die Untersuchung der Eigenschaften einer Population anhand einer Stichprobe als Stichprobenforschung bezeichnet. Fast alle psychologischen Studien sind selektiv und ihre Schlussfolgerungen erstrecken sich auf die allgemeine Bevölkerung.

An die Stichprobe werden eine Reihe zwingender Anforderungen gestellt, die in erster Linie durch die Ziele und Zielsetzungen der Studie bestimmt werden. Es sollte so sein, dass die Verallgemeinerung der Ergebnisse einer Stichprobenstudie gerechtfertigt ist – Verallgemeinerung, ihre Ausweitung auf die Allgemeinbevölkerung.

Die Probe muss folgende Bedingungen erfüllen:

1. Dies ist eine Gruppe von Objekten, die zum Studium verfügbar sind. Die Stichprobengröße wird durch die Aufgaben und Möglichkeiten der Beobachtung und des Experiments bestimmt.

2. Es ist Teil einer vorher festgelegten Population.

3. Es handelt sich um eine zufällig ausgewählte Gruppe, sodass jedes Element in der Grundgesamtheit die gleiche Chance hat, in die Stichprobe aufgenommen zu werden.

Die Hauptkriterien für die Validität von Forschungsergebnissen sind die Repräsentativität der Stichprobe und die statistische Zuverlässigkeit der (empirischen) Ergebnisse.

Repräsentativität - mit anderen Worten, seine Repräsentativität ist die Fähigkeit, die entsprechende Population mit einer gewissen Genauigkeit und ausreichender Zuverlässigkeit zu charakterisieren. Wenn die Probandenstichprobe in ihren Merkmalen repräsentativ für die Allgemeinbevölkerung ist, gibt es Anlass, die Ergebnisse ihrer Studie auf die gesamte Allgemeinbevölkerung auszudehnen.

Im Idealfall sollte eine repräsentative Stichprobe so beschaffen sein, dass alle von einem Psychologen untersuchten Hauptmerkmale, Merkmale, Persönlichkeitsmerkmale usw. im Verhältnis zu denselben Merkmalen in der Allgemeinbevölkerung darin vertreten sind.

Repräsentativitätsfehler treten in zwei Fällen auf:

1. Eine kleine Stichprobe zur Charakterisierung der Allgemeinbevölkerung.

2. Diskrepanz zwischen den Eigenschaften (Parametern) der Stichprobe und den Parametern der Allgemeinbevölkerung.

Statistische Signifikanz Die oder statistische Signifikanz der Ergebnisse einer Studie wird mithilfe statistischer Inferenzmethoden bestimmt. Diese Methoden werden im Thema „Testen von Hypothesen“ ausführlicher besprochen. Beachten Sie, dass sie bestimmte Anforderungen an die Größe bzw. den Umfang der Stichprobe stellen.

Bei der Entwicklung einer Diagnosetechnik ist die größte Stichprobengröße erforderlich – von 200 bis 1000–2500 Personen.

Ist ein Vergleich von 2 Stichproben erforderlich, muss deren Gesamtzahl mindestens 50 Personen betragen; Die Anzahl der zu vergleichenden Proben sollte ungefähr gleich sein.

Wenn die Beziehung zwischen irgendwelchen Eigenschaften untersucht wird, sollte die Stichprobengröße mindestens 30-35 Personen betragen.

Je größer die Variabilität der untersuchten Eigenschaft ist, desto größer sollte die Stichprobengröße sein. Daher kann die Variabilität durch eine Erhöhung der Homogenität der Stichprobe, beispielsweise nach Geschlecht, Alter usw., verringert werden. Dies verringert natürlich die Möglichkeit, Schlussfolgerungen zu verallgemeinern.

Abhängige und unabhängige Stichproben. Eine häufige Forschungssituation liegt vor, wenn eine für einen Forscher interessante Eigenschaft zum Zweck eines weiteren Vergleichs an zwei oder mehr Proben untersucht wird. Diese Proben können je nach Verfahren ihrer Organisation unterschiedliche Anteile haben. Unabhängige Stichproben zeichnen sich dadurch aus, dass die Wahrscheinlichkeit der Auswahl eines Probanden in einer Stichprobe nicht von der Auswahl eines der Probanden in der anderen Stichprobe abhängt. Im Gegensatz dazu zeichnen sich abhängige Stichproben dadurch aus, dass jedem Probanden einer Stichprobe nach einem bestimmten Kriterium ein Proband einer anderen Stichprobe zugeordnet wird.

Das typischste Beispiel für eine unabhängige Stichprobe ist beispielsweise ein Vergleich von Männern und Frauen hinsichtlich der Intelligenz.

Das Konzept der Repräsentativität. Konzeptuelles Objekt und Bevölkerung. Gestaltetes Objekt. Entworfene und reale Bevölkerung.

Wir wissen, dass es in der soziologischen Wissenschaft nicht um die fließende Unmittelbarkeit des Lebens geht, sondern um Daten, die nach bestimmten Regeln im Raum von Merkmalen organisiert sind. Mit Daten meinen wir die Werte von Variablen, die Studieneinheiten – Objekten – zugeordnet sind. Diese Objekte – Gemeinschaften, Institutionen, Menschen, Texte, Dinge – bilden im Raum der Attribute vielfältige und oft bizarre Konfigurationen und geben dem Forscher die Möglichkeit, verallgemeinernde Urteile über die Realität zu fällen.

Sobald wir über die Realität sprechen, stellt sich heraus, dass es sich bei den gewonnenen Daten streng genommen nur um Registrierungsdokumente (Fragebögen, Interviewbögen, Beobachtungsprotokolle etc.) handelt. Es gibt keine Garantie dafür, dass die Realität außerhalb der Laborfenster (z. B. auf der anderen Seite der Waage) nicht anders sein wird. Wir sind noch nicht beim Stichprobenverfahren angelangt, aber es stellt sich bereits die Frage nach der Repräsentativität der Daten: Ist es möglich, die bei der Erhebung gewonnenen Informationen auf Objekte auszudehnen, die außerhalb unserer spezifischen Erfahrung liegen? Die Antwort ist klar: Sie können. Sonst würden unsere Beobachtungen nicht über die Hier-Jetzt-Gesamtheit hinausgehen. Sie galten nicht für Moskauer, sondern für diejenigen, die gerade in Moskau telefonisch interviewt worden waren; nicht an die Leser der Zeitung Nedelya, sondern an diejenigen, die einen ausgefüllten Abreißcoupon per Post an die Redaktion geschickt haben. Nach Abschluss der Umfrage müssen wir davon ausgehen, dass sowohl „Moskowiter“ als auch „Leser“ gleich geblieben sind. Wir glauben an die Stabilität der Welt, weil wissenschaftliche Beobachtungen eine erstaunliche Konstanz offenbaren.

Jede einzelne Beobachtung erstreckt sich auf ein breiteres Beobachtungsfeld, und das Problem der Darstellung besteht darin, den Grad der Übereinstimmung zwischen den Parametern der befragten Bevölkerung und den „realen“ Eigenschaften des Objekts festzustellen. Das Stichprobenverfahren zielt gerade darauf ab, aus einzelnen Momentbeobachtungen den realen Untersuchungsgegenstand und die Gesamtbevölkerung zu rekonstruieren.

Das Konzept der Stichprobenrepräsentativität steht dem Konzept der externen Validität nahe; Nur im ersten Fall erfolgt eine Extrapolation desselben Merkmals auf eine größere Menge von Einheiten und im zweiten Fall ein Übergang von einem semantischen Kontext in einen anderen. Das Probenahmeverfahren wird von jeder Person tausendmal am Tag durchgeführt, und niemand denkt wirklich über die Repräsentativität der Beobachtungen nach. Erfahrung ersetzt Berechnung. Um herauszufinden, ob der Brei gut gesalzen ist, ist es überhaupt nicht notwendig, die gesamte Pfanne zu essen – hier sind zerstörungsfreie Prüfmethoden effektiver, einschließlich Stichproben: Sie müssen einen Löffel probieren. Gleichzeitig müssen Sie darauf achten, dass der Brei gut vermischt ist. Wenn der Brei schlecht durchmischt ist, ist es sinnvoll, nicht eine Messung, sondern eine Reihe vorzunehmen, also an verschiedenen Stellen in der Pfanne zu probieren – das ist schon eine Probe. Es ist schwieriger sicherzustellen, dass die Antwort des Studenten in der Prüfung sein Wissen widerspiegelt und kein zufälliger Erfolg oder Misserfolg ist. Hierzu werden mehrere Fragen gestellt. Es wird davon ausgegangen, dass das Ergebnis „wahr“ ist, d. h. tatsächliches Wissen widerspiegelt, wenn ein Student alle möglichen Fragen zu einem Thema beantwortet. Aber dann würde niemand die Prüfung bestehen können.

Die Grundlage des Stichprobenverfahrens ist immer „Wenn“ – die Annahme, dass die Extrapolation von Beobachtungen das erhaltene Ergebnis nicht wesentlich verändern wird. Daher kann die Grundgesamtheit als die „objektive Möglichkeit“ der Stichprobenpopulation definiert werden.

Das Problem wird etwas komplizierter, wenn wir verstehen, was mit dem Untersuchungsgegenstand gemeint ist. Nach der Untersuchung einer relativ großen Bevölkerungsgruppe kommt der Soziologe zu dem Schluss, dass die Variable „Radikalismus-Konservatismus“ positiv mit dem Alter korreliert: Insbesondere ältere Generationen sind eher konservativ als revolutionär. Aber das untersuchte Objekt – die Stichprobenpopulation – existiert in der Realität als solches nicht. Es wird durch das Verfahren zur Auswahl von Befragten und zur Durchführung von Interviews konstruiert und verschwindet dann sofort und löst sich im Array auf. Tatsächlich wird die Stichprobenpopulation, aus der Daten direkt „entfernt“ werden, durch das Verfahren generiert, aber gleichzeitig in eine größere Population aufgelöst, die sie mit unterschiedlichem Grad an Genauigkeit und Zuverlässigkeit darstellt bzw. repräsentiert. Soziologische Schlussfolgerungen gelten nicht für die Befragten der letzten Woche, sondern für idealisierte Objekte: „ältere Generationen“, „Jugendliche“, diejenigen, die „Radikalismus“ oder „Konservatismus“ an den Tag legen. Wir sprechen von kategorischen Verallgemeinerungen, die nicht durch raumzeitliche Umstände eingeschränkt sind. In dieser Hinsicht hilft das selektive Vorgehen, sich von Beobachtungen zu lösen und in die Welt der Ideen vorzudringen.

Somit haben wir die Möglichkeit, zwischen dem Forschungsgegenstand und der Allgemeinbevölkerung zu unterscheiden: Ein Objekt ist nicht nur eine Ansammlung von Einheiten, sondern ein Konzept, nach dem die Identifizierung und Auswahl von Forschungseinheiten erfolgt. In dieser Hinsicht ist Hegels Gebot, nur das Seiende für wahr zu halten, das seinem Begriff entspricht, richtig. Theoretisch sollte der Umfang des den Untersuchungsgegenstand bezeichnenden Begriffs dem Umfang der Gesamtbevölkerung entsprechen. Eine solche Korrespondenz wird jedoch äußerst selten erreicht.

Wir brauchen ein Konzept konzeptuelles Objekt - ideales Konstrukt, das den Rahmen des Themas bezeichnet. „Russen“, „Publikum zentraler Zeitungen“, „Wählerschaft“, „demokratische Öffentlichkeit“ – das sind die typischen Forschungsobjekte von Soziologen. Zweifellos muss eine völlig reale Gesamtbevölkerung einem konzeptuellen Objekt entsprechen. Dazu ist die Bereitstellung eines weiteren Studiengegenstandes erforderlich – gestaltetes Objekt. Das entworfene Objekt ist eine Reihe von Einheiten, die dem Forscher zur Verfügung stehen. Die Herausforderung besteht darin, Gruppen zu identifizieren, die für die Datenerfassung nicht oder nur schwer zugänglich sind.

Es liegt auf der Hand, dass es nahezu unmöglich ist, ein als „Russen“ bezeichnetes Objekt zu untersuchen. Unter den Russen befinden sich viele Menschen in Gefängnissen, Justizvollzugsanstalten, Untersuchungshaftanstalten und anderen Orten, die für den Interviewer schwer zu erreichen sind. Diese Gruppe muss vom entworfenen Objekt „subtrahiert“ werden. Viele Patienten in psychiatrischen Krankenhäusern, Kinder und einige ältere Menschen müssen ebenfalls „abgezogen“ werden. Es ist unwahrscheinlich, dass ein ziviler Soziologe normale Chancen für die Aufnahme von Militärangehörigen in die Stichprobe bieten kann. Ähnliche Probleme begleiten Befragungen von Lesern, Wählern, Kleinstadtbewohnern und Theaterbesuchern.

Die aufgeführten Schwierigkeiten sind nur ein kleiner Teil der oft unüberwindbaren Hindernisse, mit denen ein Soziologe in der Feldforschungsphase konfrontiert ist. Der Fachmann muss diese Schwierigkeiten vorhersehen und darf sich keine Illusionen über die vollständige Umsetzung des entworfenen Objekts machen. Sonst wird er enttäuscht sein.

Das Untersuchungsobjekt stimmt also nicht mit der Gesamtbevölkerung überein, so wie eine Karte eines Gebiets nicht mit dem Gebiet selbst übereinstimmt.

Wir dachten und wunderten uns lange: Die Generäle schrieben alles auf ein großes Blatt Papier. Auf dem Papier war es glatt, aber sie vergaßen die Schluchten und gingen an ihnen entlang -

Diese Worte aus einem alten Soldatenlied sind durchaus auf die Mustergestaltung anwendbar, da man von Wohnung zu Wohnung laufen muss.

Natürlich ist die Grundgesamtheit die Grundgesamtheit, aus der die Einheiten ausgewählt werden. Es scheint jedoch nur so. Die Stichprobe wird aus der Grundgesamtheit gezogen, aus der die eigentliche Auswahl der Befragten erfolgt. Rufen wir sie an real. Die Unterschiede zwischen der prognostizierten und der realen Bevölkerung lassen sich aus erster Hand erkennen, wenn man die Listen der „projizierten“ Befragten mit denen der tatsächlich befragten vergleicht.

Das eigentliche Objekt ist die Gesamtheit, die im Stadium der Feldforschung unter Berücksichtigung der Einschränkungen in der Verfügbarkeit primärer soziologischer Informationen gebildet wurde. Neben Häftlingen, Militärangehörigen und Kranken werden auch Bewohner von Dörfern abseits der Verkehrsanbindung seltener in die Stichprobe einbezogen, insbesondere wenn die Befragung im Herbst durchgeführt wird; diejenigen, die in der Regel nicht zu Hause sind, nicht geneigt sind, mit Fremden zu sprechen usw. Es kommt vor, dass Interviewer, die mangelnde Kontrolle ausnutzen, es versäumen, ihre Pflichten genau zu erfüllen und nicht diejenigen interviewen, die es sein sollen nach Anweisungen interviewt, aber diejenigen, die leichter zu „kriegen“ sind. Beispielsweise wurde den Interviewern befohlen, die Wohnungen der Befragten abends aufzusuchen, da sie dann leichter zu Hause anzutreffen sind. Wenn die Studie beispielsweise im November durchgeführt wird, ist die Straße in Zentralrussland um fünf Uhr abends völlig dunkel. In vielen Städten findet man Schilder mit Straßennamen und Hausnummern nicht oft. Wenn die Aufgaben der Interviewer von Studenten eines örtlichen pädagogischen Instituts wahrgenommen werden, kann man sich den Grad der Abweichung des realen Objekts vom entworfenen vorstellen. Manchmal machen es Forscher sogar noch einfacher: Sie füllen die Fragebögen selbst aus. Diese Schwierigkeiten sind eine Quelle des sogenannten Sampling Bias.

Es gibt recht wirksame Methoden zur Kontrolle des Ausfüllens von Fragebögen und Methoden zur Reparatur der Stichprobe, insbesondere das „Abwägen“ der wichtigsten typologischen Gruppen der Befragten: Die Gruppen der Vermissten nehmen zu und die überschüssigen Gruppen nehmen ab. Auf diese Weise wird die reale Anordnung an die entworfene angepasst, und das ist durchaus gerechtfertigt.

http://www.hi-edu.ru/e-books/xbook096/01/index.html?part-011.htm– sehr nützliche Seite!

Die Stichprobenmethode der Forschung ist die wichtigste statistische Methode. Dies ist natürlich, da das Volumen der untersuchten Objekte normalerweise unendlich ist (und selbst wenn es endlich ist, ist es sehr schwierig, alle Objekte zu sortieren; man muss sich nur mit einem Teil davon, einer Auswahl, zufrieden geben).

Allgemeine und Stichprobenpopulationen

Die Gesamtpopulation ist die Gesamtheit aller in einem bestimmten Experiment untersuchten Elemente.

Eine Stichprobenpopulation (oder Stichprobe) ist eine endliche Sammlung von Objekten, die zufällig aus einer Population ausgewählt werden.

Das Volumen einer Grundgesamtheit (Stichprobe oder allgemein) ist die Anzahl der Objekte in dieser Grundgesamtheit.

Beispiel für allgemeine und Stichprobenpopulationen

Nehmen wir an, wir untersuchen die psychologische Veranlagung einer Person, ein bestimmtes Segment in Bezug auf den Goldenen Schnitt zu unterteilen. Da der Ursprung des Konzepts des Goldenen Schnitts durch die Anthropometrie des menschlichen Körpers bestimmt wird, ist es klar, dass in diesem Fall die Gesamtbevölkerung jedes anthropogene Lebewesen ist, das die körperliche Reife erreicht und endgültige Proportionen erreicht hat, also das Ganze erwachsener Teil der Menschheit. Der Umfang dieser Sammlung ist praktisch unendlich.

Wenn diese Veranlagung ausschließlich im künstlerischen Umfeld untersucht wird, dann handelt es sich bei der Gesamtbevölkerung um Menschen, die einen direkten Bezug zum Design haben: Künstler, Architekten, Designer. Es gibt auch viele solcher Menschen, und wir können davon ausgehen, dass das Volumen der Gesamtbevölkerung in diesem Fall ebenfalls unendlich ist.

In beiden Fällen sind wir für die Forschung gezwungen, uns auf angemessene Stichprobengrößen zu beschränken und als Vertreter der einen oder anderen Bevölkerungsgruppe Studierende technischer Fachrichtungen (als Personen, die weit von der künstlerischen Welt entfernt sind) oder Designstudenten (als Personen, die in direktem Zusammenhang mit der Welt der Kunst stehen) auszuwählen Weltkünstlerische Bilder).

Repräsentativität

Das Hauptproblem der Stichprobenmethode ist die Frage, wie genau die für die Forschung aus der Allgemeinbevölkerung ausgewählten Objekte die untersuchten Merkmale der Allgemeinbevölkerung repräsentieren, also die Frage nach der Repräsentativität der Stichprobe.

Eine Stichprobe wird also als repräsentativ bezeichnet, wenn sie die quantitativen Verhältnisse der Gesamtbevölkerung hinreichend genau abbildet.

Natürlich ist es schwierig zu sagen, was genau sich hinter der vagen Formulierung verbirgt ziemlich akkurat. Fragen der Repräsentativität sind in jeder experimentellen Studie im Allgemeinen die umstrittensten. Es gibt viele Beispiele, die bereits zu Klassikern geworden sind, bei denen eine unzureichende Repräsentativität der Stichprobe zu absurden Ergebnissen führte.

In der Regel werden Fragen der Repräsentativität durch Expertenbewertung gelöst, wenn die wissenschaftliche Gemeinschaft den Standpunkt einer Gruppe maßgeblicher Experten hinsichtlich der Richtigkeit der Studie akzeptiert.

Beispiel für Repräsentativität

Kehren wir zum Beispiel der Teilung eines Segments zurück. Die Fragen der Repräsentativität der Stichproben stehen hier im Mittelpunkt der Studie: Unter keinen Umständen sollten wir Gruppen von Probanden aufgrund ihrer Zugehörigkeit zum künstlerischen Umfeld vermischen.

Statistische Verteilung des beobachteten Merkmals

Häufigkeit des beobachteten Werts

Angenommen, das beobachtete Attribut nimmt als Ergebnis des Tests in einem Probenvolumen die Werte an, ..., und der Wert wurde einmal beobachtet, der Wert wurde einmal beobachtet usw., der Wert wurde einmal beobachtet. Dann nennt man die Häufigkeit des beobachteten Wertes eine Zahl, Werte sind Zahlen usw.

Relative Häufigkeit des beobachteten Werts

Die relative Häufigkeit eines beobachteten Werts ist das Verhältnis der Häufigkeit zur Stichprobengröße:

Es ist klar, dass die Summe der Häufigkeiten des beobachteten Merkmals die Stichprobengröße ergeben sollte

und die Summe der relativen Häufigkeiten sollte Eins ergeben:

Diese Überlegungen können zur Steuerung bei der Erstellung statistischer Tabellen herangezogen werden. Wenn die Gleichheiten nicht erfüllt sind, ist bei der Aufzeichnung der Versuchsergebnisse ein Fehler aufgetreten.

Statistische Verteilung des beobachteten Werts

Die statistische Verteilung eines beobachteten Merkmals ist die Entsprechung zwischen den beobachteten Werten des Merkmals und den entsprechenden Häufigkeiten (oder relativen Häufigkeiten).

In der Regel wird die statistische Verteilung in Form einer zweizeiligen Tabelle geschrieben, in der in der ersten Zeile die beobachteten Werte des Merkmals und in der zweiten die entsprechenden Häufigkeiten (oder relativen Häufigkeiten) angegeben sind Linie:

Die Muster, denen die untersuchte Zufallsvariable unterliegt, werden also physikalisch vollständig durch die realen Bedingungen ihrer Beobachtung (oder ihres Experiments) bestimmt und werden mathematisch durch den entsprechenden Wahrscheinlichkeitsraum oder, was dasselbe ist, durch den entsprechenden spezifiziert Gesetz der Wahrscheinlichkeitsverteilung. Bei der Durchführung statistischer Untersuchungen erweist sich jedoch eine andere Terminologie, die mit dem Konzept einer Gesamtbevölkerung verbunden ist, als etwas praktischer.

Die Allgemeinbevölkerung ist die Gesamtheit aller denkbaren Beobachtungen (oder aller geistig möglichen Objekte der uns interessierenden Art, von denen Beobachtungen „genommen“ werden), die unter bestimmten realen Bedingungen gemacht werden könnten. Da es sich bei der Definition um alle gedanklich möglichen Beobachtungen (oder Objekte) handelt, handelt es sich bei dem Konzept einer Allgemeinbevölkerung um ein bedingt mathematisches, abstraktes Konzept und sollte nicht mit realen Populationen verwechselt werden, die der statistischen Forschung unterliegen. Nachdem wir also sogar alle Unternehmen einer Teilbranche unter dem Gesichtspunkt der Erfassung der Werte der sie charakterisierenden technischen und wirtschaftlichen Indikatoren untersucht haben, können wir die befragte Grundgesamtheit nur als Vertreter einer hypothetisch möglichen größeren Grundgesamtheit von Unternehmen betrachten das unter den gleichen realen Bedingungen funktionieren könnte

In der praktischen Arbeit ist es bequemer, die Wahl mit den Beobachtungsobjekten in Verbindung zu bringen, als mit den Eigenschaften dieser Objekte. Wir wählen Maschinen, geologische Proben und Menschen für die Untersuchung aus, aber nicht die Werte der Eigenschaften von Maschinen, Proben und Menschen. Andererseits unterscheiden sich in der mathematischen Theorie Objekte und die Menge ihrer Eigenschaften nicht und die Dualität der eingeführten Definition verschwindet.

Wie wir sehen, ist das mathematische Konzept der „allgemeinen Bevölkerung“ physikalisch vollständig bestimmt, ebenso wie die Konzepte „Wahrscheinlichkeitsraum“, „Zufallsvariable“ und „Wahrscheinlichkeitsverteilungsgesetz“ durch die entsprechenden realen Bedingungen und damit durch alle Diese vier mathematischen Konzepte können in gewisser Bedeutung als Synonyme betrachtet werden. Eine Population heißt endlich oder unendlich, je nachdem, ob die Menge aller denkbaren Beobachtungen endlich oder unendlich ist.

Aus der Definition folgt, dass kontinuierliche Populationen (bestehend aus Beobachtungen von Zeichen kontinuierlicher Natur) immer unendlich sind. Diskrete allgemeine Populationen können entweder unendlich oder endlich sein. Wenn beispielsweise eine Charge von N Produkten auf ihre Güteklasse analysiert wird (siehe Beispiel in Abschnitt 4.1.3) und jedes Produkt einer von vier Güteklassen zugeordnet werden kann, ist die untersuchte Zufallsvariable die Güteklassennummer eines zufällig extrahierten Produkts Besteht die Charge und die Menge der möglichen Werte der Zufallsvariablen aus jeweils vier Punkten (1, 2, 3 und 4), dann ist die Population offensichtlich endlich (nur N denkbare Beobachtungen).

Das Konzept einer unendlichen Population ist eine mathematische Abstraktion, ebenso wie die Idee, dass die Messung einer Zufallsvariablen unendlich oft wiederholt werden kann. Eine annähernd unendliche allgemeine Population kann als Grenzfall einer endlichen Population interpretiert werden, wenn die Anzahl der Objekte, die durch einen gegebenen realen Satz von Bedingungen erzeugt werden, auf unbestimmte Zeit zunimmt. Wenn wir also in dem gerade gegebenen Beispiel anstelle von Produktchargen die kontinuierliche Massenproduktion derselben Produkte betrachten, kommen wir zum Konzept einer unendlichen Gesamtbevölkerung. In der Praxis entspricht eine solche Änderung der Anforderung

Eine Stichprobe aus einer bestimmten Grundgesamtheit ist das Ergebnis einer begrenzten Reihe von Beobachtungen einer Zufallsvariablen. Eine Stichprobe kann als eine Art empirisches Analogon einer Allgemeinbevölkerung betrachtet werden, womit wir uns in der Praxis am häufigsten befassen, da die Befragung der gesamten Allgemeinbevölkerung entweder zu arbeitsintensiv (im Fall großer N) oder grundsätzlich unmöglich sein kann (im Fall unendlicher Allgemeinbevölkerungen).

Die Anzahl der Beobachtungen, die eine Stichprobe bilden, wird als Stichprobengröße bezeichnet.

Wenn die Stichprobengröße groß ist und wir es mit einem eindimensionalen kontinuierlichen Wert zu tun haben (oder mit einem eindimensionalen diskreten Wert, dessen Anzahl möglicher Werte ziemlich groß ist, sagen wir mehr als 10), dann ist dies häufig der Fall Aus Sicht der Vereinfachung der weiteren statistischen Verarbeitung von Beobachtungsergebnissen ist es bequemer, zu den sogenannten „gruppierten“ Stichprobendaten überzugehen. Dieser Übergang wird üblicherweise wie folgt durchgeführt:

a) die kleinsten und größten Werte in der Stichprobe werden notiert;

b) der gesamte untersuchte Bereich wird in eine bestimmte Anzahl von 5 gleichen Gruppierungsintervallen unterteilt; In diesem Fall sollte die Anzahl der Intervalle nicht weniger als 8–10 und nicht mehr als 20–25 betragen: Die Wahl der Anzahl der Intervalle hängt maßgeblich von der Stichprobengröße ab. Zur ungefähren Orientierung können Sie 5 verwenden die Näherungsformel

was eher als untere Schätzung für s (insbesondere für große) angesehen werden sollte

c) Die Extrempunkte jedes Intervalls sowie deren Mittelpunkte werden in aufsteigender Reihenfolge markiert

d) die Anzahl der Probendaten, die in jedes der Intervalle fallen, wird gezählt: (offensichtlich); Beispieldaten, die auf die Grenzen der Intervalle fallen, werden entweder gleichmäßig auf zwei benachbarte Intervalle verteilt oder es wird vereinbart, dass sie nur einem von ihnen zugeordnet werden, beispielsweise dem linken.

Abhängig vom spezifischen Inhalt des Problems können einige Änderungen an diesem Gruppierungsschema vorgenommen werden (in einigen Fällen ist es beispielsweise ratsam, auf die Anforderung gleicher Längen der Gruppierungsintervalle zu verzichten).

Bei allen weiteren Argumenten anhand von Beispieldaten gehen wir von der eben beschriebenen Notation aus.

Erinnern wir uns daran, dass das Wesen statistischer Methoden darin besteht, anhand eines bestimmten Teils der Gesamtbevölkerung (d. h. einer Stichprobe) Urteile über deren Eigenschaften als Ganzes zu fällen.

Eine der wichtigsten Fragen, deren erfolgreiche Lösung die Verlässlichkeit der aus der statistischen Datenverarbeitung gewonnenen Schlussfolgerungen bestimmt, ist die Frage der Repräsentativität der Stichprobe, d.h. die Frage nach der Vollständigkeit und Angemessenheit seiner Darstellung der uns interessierenden Eigenschaften der analysierten Allgemeinbevölkerung. In der praktischen Arbeit kann dieselbe Gruppe von Untersuchungsobjekten als Stichprobe aus verschiedenen Allgemeinbevölkerungen betrachtet werden. Somit kann eine zufällig aus den Genossenschaftshäusern eines der Wohnungsverwaltungsämter (ZhEK) eines der Stadtbezirke für eine detaillierte soziologische Erhebung ausgewählte Gruppe von Familien sowohl als Stichprobe aus der Gesamtbevölkerung der Familien (mit einer Genossenschaft) betrachtet werden Wohnform) dieser ZhEK und als Stichprobe aus der Gesamtbevölkerung der Familien eines bestimmten Gebiets und als Stichprobe aus der Gesamtbevölkerung aller Familien in der Stadt und schließlich als Stichprobe aus der Gesamtbevölkerung aller Familien in der Stadt, die in Genossenschaftshäusern leben. Die aussagekräftige Interpretation der Testergebnisse hängt maßgeblich davon ab, für welche Allgemeinbevölkerung wir die ausgewählte Familiengruppe repräsentieren und für welche Allgemeinbevölkerung diese Stichprobe als repräsentativ angesehen werden kann. Die Antwort auf diese Frage hängt von vielen Faktoren ab. Insbesondere im obigen Beispiel kommt es auf das Vorhandensein oder Fehlen eines besonderen (vielleicht versteckten) Faktors an, der die Zugehörigkeit der Familie zu einem bestimmten Wohnungsamt oder dem gesamten Bezirk bestimmt (ein solcher Faktor könnte beispielsweise sein). durchschnittliches Pro-Kopf-Einkommen der Familie, die geografische Lage des Bezirks in der Stadt, „Alter“ des Gebiets usw.).