Menü
Bedava
Kayıt
ev  /  uçuk/ Aptallar için nüfus ve örnek. Genel ve örnek popülasyonlar. Temsiliyet kavramı

Aptallar için genel nüfus ve örnek. Genel ve örnek popülasyonlar. Temsiliyet kavramı

Ders 6. Unsurlar matematiksel istatistik

Bilgiyi kontrol etmek ve dersi özetlemek için sorular

1. Rastgele bir değişken tanımlayın.

2. Kesikli ve sürekli rastgele değişkenlerin matematiksel beklentisi ve dağılımı için formüller yazın.

3. Laplace'ın yerel integral limit teoreminin bir tanımını verin

4. Binom dağılımı, hipergeometrik dağılım, Poisson dağılımı, düzgün dağılım ve normal dağılım için formüller yazın.

Amaç: Matematiksel istatistiklerin temel kavramlarını incelemek

1. Nüfus ve örnek

2. Numunenin istatistiksel dağılımı. Çokgen. grafik çubuğu .

3. Örneklem bazında genel popülasyon parametrelerinin tahminleri

4. Genel ve örnek ortalamalar. Hesaplama yöntemleri.

5. Genel ve örnek varyanslar.

6. Bilgiyi kontrol etmek ve dersi özetlemek için sorular

İstatistiksel verilerin toplanması ve işlenmesi için bilimsel temelli yöntemlerin geliştirildiği matematiksel istatistiklerin unsurlarını incelemeye başlıyoruz.

1. Genel popülasyon ve örneklem. Bir dizi homojen nesneyi incelemek istensin (bu kümeye istatistiksel toplam) Bu nesneleri karakterize eden bazı niteliksel veya niceliksel özelliklerle ilgili. Örneğin, bir grup parça varsa, standart parça nitel bir işaret olarak hizmet edebilir ve parçanın kontrollü boyutu nicel bir işaret olarak hizmet edebilir.

Sürekli bir anket yapmak en iyisidir, yani. her öğeyi keşfedin. Ancak, çoğu durumda, çeşitli nedenlerle bu mümkün değildir. Tam bir muayeneye müdahale edebilir Büyük sayı nesneler, onların kullanılamaması. Örneğin, deneysel bir gruptan bir merminin patlaması sırasında huninin ortalama derinliğini bilmemiz gerekiyorsa, tam bir araştırma yaparak tüm partiyi yok edeceğiz.

Tam bir anket mümkün değilse, tüm popülasyondan çalışma için nesnelerin bir kısmı seçilir.

Bazı nesnelerin seçildiği istatistiksel kümeye denir. genel nüfus. Genel popülasyondan rastgele seçilen nesneler kümesine denir. örneklem.

Sırasıyla genel popülasyondaki ve örneklemdeki nesne sayısı denir. Ses genel nüfus ve Sesörnekler.

Örnek 10.1. Bir ağacın meyveleri (200 adet) bu çeşide özgü bir tat olup olmadığı incelenir. Bunu yapmak için 10 adet seçin. Burada 200 popülasyon büyüklüğü ve 10 örneklem büyüklüğüdür.

Örnek, incelenen ve genel popülasyona iade edilen bir nesneden alınırsa, örnek denir. tekrarlandı. Numunenin nesneleri artık genel popülasyona geri döndürülmüyorsa, numune denir. tekrarlanmamış.



Uygulamada, tekrarlanmayan örnekleme daha sık kullanılır. Örnek boyutu, popülasyon boyutunun küçük bir kısmıysa, yeniden örnekleme ile tekrarlanmayan örnekleme arasındaki fark önemsizdir.

Örnekteki nesnelerin özellikleri, popülasyondaki nesnelerin özelliklerini doğru bir şekilde yansıtmalı veya dedikleri gibi örnek, temsilci(temsilci). Genel popülasyonun tüm nesnelerinin örneğe dahil edilme olasılığı aynıysa, örneğin seçim rastgele yapılırsa, örneğin temsili olduğuna inanılır. Örneğin, gelecekteki hasadı tahmin etmek için henüz olgunlaşmamış meyvelerin genel popülasyonundan bir örnek alabilir ve özelliklerini (ağırlık, kalite vb.) inceleyebilirsiniz. Numunenin tamamı bir ağaçtan alınırsa, temsili olmayacaktır. Temsili bir örnek, rastgele seçilmiş ağaçlardan rastgele seçilmiş meyvelerden oluşmalıdır.

2. Numunenin istatistiksel dağılımı. Çokgen. Grafik çubuğu. Genel popülasyondan bir örnek alınsın ve X 1 gözlemlendi n 1 kez, X 2 - p 2 bir Zamanlar, ..., x k - n k kez ve n 1 +n 2 +…+ pk= P -örnek boyut. gözlemlenen değerler x 1 , x 2 , …, x k aranan seçenekler, ve artan sırada yazılan varyant dizisi, varyasyon serisi. gözlem sayısı n 1 , n 2 , …, nk aranan frekanslar ve bunların örneklem büyüklüğü ile ilişkisi , , …, - göreceli frekanslar. Göreceli frekansların toplamının bire eşit olduğuna dikkat edin: .

Numunenin istatistiksel dağılımı seçenekler listesini ve bunlara karşılık gelen frekansları veya göreli frekansları arayın. İstatistiksel dağılım, bir dizi aralık ve bunlara karşılık gelen frekanslar (sürekli dağılım) olarak da belirtilebilir. Aralığa karşılık gelen frekans olarak, bu aralığa düşen varyantın frekanslarının toplamını alın. İstatistiksel dağılımın grafiksel gösterimi için şunu kullanın: çokgenler ve histogramlar.

Eksen üzerinde bir çokgen oluşturmak için ey seçenek değerlerini bir kenara koyun X ben, eksen üzerinde kuruluş birimi - frekans değerleri P i (göreceli frekanslar).

Örnek 10.2.Şek. 10.1, aşağıdaki dağılımın çokgenini gösterir

Çokgen genellikle az sayıda seçenek olması durumunda kullanılır. Çok sayıda değişken olması durumunda ve özelliğin sürekli dağılımı durumunda, histogramlar daha sık oluşturulur. Bunu yapmak için, özelliğin tüm gözlenen değerlerini içeren aralık, birkaç kısmi uzunluk aralığına bölünür. h ve her bir kısmi aralık için bulun ben, - içine düşen varyantın frekanslarının toplamı i-Aralık. Daha sonra, bu aralıklarda, tabanlarda olduğu gibi, yükseklikleri olan dikdörtgenler oluştururlar (veya P -örnek boyut).

Meydan i kısmi dikdörtgen , (veya ).

Bu nedenle, histogramın alanı, tüm frekansların (veya göreceli frekansların) toplamına eşittir, yani. örnek boyutu (veya birim).

Örnek 10.3.Şek. 10.2, sürekli hacim dağılımının bir histogramını gösterir n= 100 aşağıdaki tabloda verilmiştir.

Matematiksel istatistikte iki temel kavram ayırt edilir: genel popülasyon ve örneklem.
Koleksiyon, araştırmacının ilgisini çeken bazı nesnelerin veya öğelerin pratik olarak sayılabilir bir kümesidir;
Bir agreganın özelliği, tüm öğelerinin bazılarında bulunan gerçek veya hayali bir niteliktir. Özellik rastgele veya rastgele olmayan olabilir.
Popülasyon parametresi, sabit veya değişken olarak ölçülebilen bir özelliktir.
Basit bir koleksiyon aşağıdakilerle karakterize edilir:
ayrı bir mülk (örneğin: Rusya'nın tüm öğrencileri);
sabit veya değişken şeklinde ayrı bir parametre (Tüm kız öğrenciler);
örtüşmeyen (uyumsuz) özellikler sistemi, örneğin: Vladivostok'taki okulların tüm öğretmenleri ve öğrencileri.
Karmaşık bir küme aşağıdakilerle karakterize edilir:
en azından kısmen kesişen özelliklerden oluşan bir sistem (Okuldan altın madalya ile mezun olan Uzak Doğu Devlet Üniversitesi'nin psikolojik ve matematik fakültesi öğrencileri);
toplamda bağımsız ve bağımlı parametreler sistemi; kapsamlı bir kişilik çalışmasında.
Tüm özellikleri öğelerinin her birinde bulunan bir kümeye homojen veya homojen denir;
Heterojen veya heterojen bir küme, özellikleri ayrı eleman alt kümelerinde yoğunlaşan bir kümedir.
Önemli bir parametre, popülasyonun hacmidir - onu oluşturan elementlerin sayısı. Hacmin boyutu, popülasyonun kendisinin nasıl tanımlandığına ve özellikle hangi sorularla ilgilendiğimize bağlıdır. Bir oturumda belirli bir sınavı geçme döneminde 1. sınıf öğrencisinin duygusal durumuyla ilgilendiğimizi varsayalım. Sonra nüfus yarım saat içinde tükenir. Tüm 1. sınıf öğrencilerinin duygusal durumuyla ilgilenirsek, belirli bir üniversitenin tüm 1. sınıf öğrencilerinin duygusal durumunu alırsak, toplam çok daha büyük ve hatta daha da fazla olacaktır. Büyük hacimli agregaların yalnızca seçici olarak araştırılabileceği açıktır.
Bir örnek, genel popülasyonun belirli bir parçasıdır, doğrudan incelenen bir şeydir.
Numuneler temsiliyet, büyüklük, numune alma yöntemi ve test tasarımına göre sınıflandırılır.
Temsilci - genel nüfusu niteliksel ve niceliksel olarak yeterince yansıtan bir örnek. Örneklem genel popülasyonu yeterince yansıtmalıdır, aksi takdirde sonuçlar çalışmanın amaçlarıyla örtüşmeyecektir.
Temsil edilebilirlik hacme bağlıdır, hacim ne kadar büyükse numune o kadar temsil edicidir. Seçim yöntemiyle.
Rastgele - elemanlar rastgele seçilirse. Matematiksel istatistiklerin çoğu yöntemi rastgele bir örnek kavramına dayandığından, örneğin rastgele olması doğaldır.
Rastgele olmayan örnek:
mekanik seçim, tüm popülasyon, örneklemde planlanan birim sayısı kadar parçaya bölündüğünde ve ardından her parçadan bir eleman seçildiğinde;
tipik seçim - popülasyon homojen parçalara bölünür ve her birinden rastgele bir örnek yapılır;
seri seçim - popülasyon çok sayıda farklı büyüklükteki seriye bölünür, ardından herhangi bir seriden birinin örneği yapılır;
kombine seçim - dikkate alınan seçim türleri farklı aşamalarda birleştirilir.
Test şemasına göre, örnekler bağımsız ve bağımlı olabilir. Örnek boyutu küçük ve büyük olarak ayrılmıştır. Küçük numuneler, element sayısının 200 olduğu numuneleri ve ortalama numunenin 30 koşulunu karşıladığı numuneleri içerir. Küçük numuneler, halihazırda çalışılmış popülasyonların bilinen özelliklerinin istatistiksel kontrolünde kullanılır.
Bilinmeyen özellikleri ve popülasyon parametrelerini ayarlamak için büyük örnekler kullanılır.

Konuyla ilgili daha fazla bilgi 1.3. Genel popülasyon ve örneklem:

  1. 7.2 Örnek ve popülasyon özellikleri
  2. 1.6. Normal dağılım gösteren bir genel popülasyonun korelasyon katsayılarının nokta ve aralık tahminleri

Seçici araştırma yapma ihtiyacı çeşitli nedenlerden kaynaklanabilir:

    genellikle incelenen olgunun tam bir çalışması çok pahalı ve uzundur;

    bazen tam bir çalışmada elde edilen bilgileri kullanma fırsatı, hazırlık süreci tamamlanmadan önce tükenebilir;

    bazı durumlarda, ürünün kalitesinin kontrol edilmesi sonucunda incelenen nesne yok edilir.

Örnek:

    nüfusun okuldaki tüm öğrenciler olduğunu varsayalım (20 sınıftan 600 kişi, her sınıfta 30 kişi). Çalışmanın konusu sigaraya karşı tutumdur.

Nüfus hakkında bilgi almanız gereken bir dizi nesnedir.

Genel popülasyon, araştırmacının ilgisini çeken niteliklere, özelliklere sahip tüm nesnelerden oluşur. Bazen genel nüfus, belirli bir bölgenin tüm yetişkin nüfusudur (örneğin, potansiyel seçmenlerin bir adaya karşı tutumu incelenirken), çoğu zaman çalışma nesnelerini belirleyen birkaç kriter belirlenir. Örneğin, belirli bir marka el kremini haftada en az bir kez kullanan ve aile üyesi başına en az 5.000 ruble geliri olan 10-89 yaş arası kadınlar.

Örneklem genel popülasyondan çıkarılan küçük bir nesne kümesidir.

Örnekleme seti, genel popülasyondan belirli bir prosedürle seçilen ve çalışma için gerekli olan minimum sonuçların (olgular, denekler, nesneler, olaylar, örnekler) toplamıdır.

Örnekler:

    Firmanın müşterilerinin yeniliklere tepkisini belirleyen firmanın tüm müşterileri genel nüfusu temsil eder. Çağrılan müşteriler bir örnek oluşturur.

    Çok sayıda işlemi olan firmaları denetlerken, seçilen sayıda işlemi incelemekle yetinmek gerekir. Firmanın tüm işlemleri, seçilen genel popülasyonu oluşturur - örnek.

    genel nüfus, belirli bir yılın tüm askerlerinden oluşur.

    belirli bir işletmede belirli bir zamanda yapılan tüm lambalar genel bir popülasyon oluşturur. Kontrol için seçilen lambalar opsiyoneldir.

Örnek temsili veya temsili olmayan olarak kabul edilebilir. Büyük bir insan grubunu incelerken örnek temsili olacaktır, eğer bu grup içinde farklı alt grupların temsilcileri varsa, ancak bu şekilde doğru sonuçlar çıkarılabilir. .

Temsiliyet - örneğin özelliklerinin popülasyonun veya bir bütün olarak genel popülasyonun özelliklerine uygunluğu. Temsiliyet, belirli bir örneklemin dahil edilmesiyle çalışmanın sonuçlarının toplandığı tüm popülasyona ne kadar genellenebileceğini belirler.

Temsil edilebilirlik, aynı zamanda, çalışmanın amaçları açısından önemli olan genel popülasyonun parametrelerini temsil etmek için bir örneğin özelliği olarak da tanımlanabilir.

Örnek: 60 lise öğrencisinden oluşan bir örneklem, popülasyonu, her sınıftan 3 öğrencinin yer aldığı aynı 60 kişilik bir örneklemden çok daha kötü temsil etmektedir. Bunun temel nedeni sınıflardaki eşit olmayan yaş dağılımıdır. Bu nedenle, ilk durumda örneklemin temsil gücü düşük, ikinci durumda temsil gücü yüksektir (ceteris paribus) .

Görev 1. 253.000 uygun vatandaştan oluşan bir şehirde, gelecekteki seçmenlerin siyasi sempatilerini araştırın.

Çözüm

    Örnek, her 15 alıcıdan büyük bir miktar bırakarak istenerek oluşturulabilir. alışveriş Merkezi. Böyle bir örnek, alışveriş merkezine gelen ziyaretçilerin görüşlerini yansıtacaktır, ancak şehrin tüm sakinlerinin bakış açısını temsil etmesi olası değildir.

    Diğer bir örnekleme yöntemi, her 100. şehir sakini için telefon rehberinden numaralar alarak bir telefon araştırması yapmaktır. Böyle bir sistematik örnekleme, telefonu olan, evde bulunan ve telefon görüşmelerine cevap veren bir grup insanın bakış açısı hakkında bilgi verecektir. Ancak şehrin tüm sakinlerinin görüşlerini yansıtmaz.

    Başka bir örnekleme yöntemi, birkaç kişi tarafından düzenlenen bir mitingde katılımcılarla röportaj yapmak olabilir. siyasi partiler. Böyle bir örnek, aktif olarak katılan sakinler hakkında bilgi sağlayacaktır. siyasi hayatşehirler.

Dolayısıyla, tüm popülasyonu temsil edecek bu tür örnekleme yöntemlerine ihtiyacımız var, yani örneklem temsili (temsili) olmalıdır.

Görev 2. Numunenin temsili olup olmadığını belirleyin:

1) yıl için şehirdeki kazalar hakkında istatistiksel bir rapor hazırlamak gerekirse, Haziran ayındaki araba kazalarının sayısı;

2) ülkedeki kişi başına düşen araba sayısını hesaplarken şehir sakinleri;

3) Bir gençlik televizyon programının reytingini belirlerken 40 ila 50 yaş arasındaki kişiler.

Çözüm

1) Örnek temsili değildir. Yaz aylarında yollarda kar ve buz olmaz ve bu da kazaların ana nedenlerinden biridir.

2) Örnek temsili değildir. Şehirde kırsal alanlardan çok daha fazla araba olduğu açıktır. Bu dikkate alınmalıdır.

3) Örnek temsili değildir. 40 ila 50 yaş arasındaki kişilerin, gençleri hedef alan bir programa ilgi göstermesi pek olası değildir. Böyle bir örnek kullanıldığında, derecelendirme önemli ölçüde düşebilir, ancak bu gerçek durumu yansıtmaz. Örnek bir set oluşturmak için aşağıdakiler kullanılır: çeşitli yollar seçim. İstatistiksel veriler kullanılabilecek şekilde sunulmalıdır.

Popülasyon ve örnek parametreleri

N, N 1 , N 2 vb. katmanlara ayrılan genel nüfustur.

Strata istatistiksel özellikler açısından homojen nesneleri temsil eder (örneğin, nüfus yaş gruplarına veya sosyal sınıfa göre katmanlara ayrılır; işletmeler endüstriye göre). Bu durumda, numunelere tabakalı denir.

N - örnek boyutu.

Çalışmanın istatistiksel sonuçlarının temeli, rastgele değişken X'in dağılımı iken, gözlenen değerler x 1 , x 2 , x 3, rastgele değişken x'in gerçekleşmeleri olarak adlandırılır.

Rastgele değişken X'in genel popülasyondaki dağılımı teoriktir, doğası gereği idealdir ve örnek karşılığı ampirik dağılımdır.

Bir örnek için dağılım fonksiyonunu belirlemek zordur ve bazen imkansızdır, bu nedenle parametreler ampirik verilerden tahmin edilir ve daha sonra teorik dağılımı tanımlayan analitik bir ifadeyle değiştirilirler. Bu durumda, dağılımın türüyle ilgili varsayım hem istatistiksel olarak doğru hem de hatalı olabilir.

Ancak her durumda, örnekten yeniden oluşturulan ampirik dağılım, doğru olanı yalnızca kabaca karakterize eder.

Dağılımların en önemli parametreleri matematiksel beklentidir.a ve varyans σ2veri dağılımının bir ölçüsüdür.

Standart sapmaσ - gözlemsel verilerin veya kümelerin ortalama değerden sapma derecesi.

Görev 3. Mikhail, arkadaşlarıyla birlikte köpeklerinin boyunu (omurgadan) ölçmeye karar verdi. Bul: ortalama değer; büyüme sapması.

Çözüm

    Matematiksel beklenti veya ortalama değer şu formülle bulunabilir:


    Şimdi her köpeğin boyunun ortalama veya matematiksel beklentiden sapmasını hesaplıyoruz, yani varyansı hesaplıyoruz.


Standart sapma sadece Kare kök dispersiyondan.

σ \ = 147,32

Böylece, bilmek standart sapma"normal yüksekliğin" ne anlama geldiğini ve çok uzun ve çok küçük bir köpeğin ne olduğunu biliyoruz.

Cevap: 394, 21.704; 147.32.

Görev 4. Kontrol laboratuvarında, fabrika tarafından üretilen aynı güce sahip büyük bir lamba grubundan rastgele alınan aynı güçteki 50 elektrik lambasının son kullanma tarihinin gözlemlenmesi, belirlenen garantinin ihlali hakkında aşağıdaki verilere yol açtı.yanma süresi:

sapma H

Gerçek sapmayı yansıtan 10 küçük dağıtım inci garantiden ampullerin yanma süresi.

Çözüm.

Ortalama sapma

Böylece, gerekli normal dağılım şu şekilde karakterize edilir: aşağıdaki değerler parametreler: a = 0.4;σ2 = 318; σ = 17.8.

Dolayısıyla olasılık yoğunluğu:

Bu yoğunluğa karşılık gelen dağılım fonksiyonu şöyle görünecektir:

Rastgele bir değişkenin dağılımı, istatistiksel özellikleriyle ilgili tüm bilgileri içerir. Dağılımını oluşturmak için bir rastgele değişkenin kaç değerini bilmeniz gerekir? Bunu yapmak için keşfetmeniz gerekir Genel popülasyon.

Genel popülasyon, belirli bir rastgele değişkenin alabileceği tüm değerlerin kümesidir.

Genel popülasyondaki birim sayısına hacmi denir N. Bu değer sonlu veya sonsuz olabilir. Örneğin, belirli bir şehrin sakinlerinin büyümesini incelersek, genel nüfusun hacmi şehrin sakinlerinin sayısına eşit olacaktır. Varsa fiziksel deney, o zaman genel popülasyonun hacmi sonsuz olacaktır, çünkü herhangi bir fiziksel parametrenin tüm olası değerlerinin sayısı sonsuza eşittir.

Genel popülasyonun incelenmesi her zaman mümkün ve uygun değildir. Genel nüfusun büyüklüğü sonsuz ise imkansızdır. Ancak, sınırlı hacimlerde bile, çok fazla zaman ve emek gerektirdiğinden ve sonuçların mutlak doğruluğu genellikle gerekli olmadığından tam bir çalışma her zaman haklı değildir. Daha az doğru sonuçlar, ancak çok daha az çaba ve parayla, genel nüfusun sadece bir kısmı çalışılarak elde edilebilir. Bu tür çalışmalara seçici denir.

Genel popülasyonun yalnızca bir kısmı üzerinde yapılan istatistiksel çalışmalara örnekleme, genel popülasyonun incelenen kısmına ise örneklem denir.

Şekil 7.2, popülasyonu ve örneği bir küme ve alt kümesi olarak sembolik olarak gösterir.

Şekil 7.2 Nüfus ve örneklem

Belirli bir genel popülasyonun, genellikle onun önemsiz bir bölümünü oluşturan bazı alt kümeleriyle çalışarak, pratik amaçlar için doğruluk açısından oldukça tatmin edici sonuçlar elde ederiz. Genel popülasyonun büyük bir bölümünün incelenmesi, örneğin istatistiksel açıdan doğru bir şekilde alınması durumunda, yalnızca doğruluğu arttırır, ancak sonuçların özünü değiştirmez.

Örneklemin genel popülasyonun özelliklerini yansıtması ve sonuçların güvenilir olması için, temsilci(temsilci).

Bazı genel popülasyonlarda, bunların herhangi bir kısmı, doğası gereği temsilidir. Ancak çoğu durumda numunelerin temsili olmasını sağlamak için özel dikkat gösterilmelidir.

Bir Modern matematiksel istatistiklerin ana başarılarından biri, veri seçiminin temsil edilebilirliğini sağlayan rastgele örnekleme yönteminin teorisi ve pratiğinin geliştirilmesi olarak kabul edilir.

Örnek çalışmalar, tüm popülasyonun çalışmasına kıyasla her zaman doğrulukta kaybeder. Ancak, hatanın büyüklüğü biliniyorsa bu uzlaştırılabilir. Açıkçası, örneklem büyüklüğü genel popülasyonun büyüklüğüne ne kadar yaklaşırsa, hata o kadar küçük olacaktır. Buradan, küçük örneklerle çalışırken istatistiksel çıkarım problemlerinin özellikle alakalı hale geldiği açıktır ( N ? 10-50).

Bu, olasılık teorisi yöntemlerine dayanan, bilimsel ve pratik sonuçlar elde etmek için istatistiksel verilerin sistemleştirilmesi ve işlenmesi ile uğraşan bir bilimdir.

İstatistiksel veri belirli özelliklere sahip nesnelerin sayısı hakkında bilgi denir .

Bazı niteliksel veya niceliksel özelliklere göre birleştirilmiş bir grup nesneye denir. agrega . Koleksiyona dahil edilen nesnelere öğeleri denir ve toplam sayıları onun Ses.

Genel popülasyon belirli bir gerçek koşullar kümesi altında veya daha kesin olarak yapılabilecek tüm olası olası gözlemlerin kümesidir: genel popülasyon bir rastgele değişken x ve onunla ilişkili olasılık uzayıdır (W, I, P).

Bir rastgele değişken x'in dağılımına denir. nüfus dağılımı(örneğin, normal olarak dağılmış veya basitçe normal bir genel nüfus hakkında derler).

Örneğin, rastgele bir değişkenin bir dizi bağımsız ölçümü yapılırsa x, o zaman genel nüfus teorik olarak sonsuzdur (yani genel nüfus soyut, geleneksel olarak matematiksel bir kavramdır); N adetlik bir partideki kusurlu kalemlerin sayısı kontrol edilirse, bu parti N hacminin sonlu bir popülasyonu olarak kabul edilir.

Sosyo-ekonomik araştırmalar söz konusu olduğunda, belirli bir şehrin, bölgenin veya ülkenin nüfusu, N hacminin genel nüfusu olabilir ve ölçülen özellikler, bir kişinin geliri, giderleri veya tasarruflarıdır. Bir özellik niteliksel nitelikteyse (örneğin, cinsiyet, uyruk, sosyal statü, meslek vb.), ancak sınırlı bir seçenekler grubuna aitse, o zaman bir sayı olarak da kodlanabilir (sıklıkla anketlerde yapıldığı gibi). ).

N nesnelerinin sayısı yeterince büyükse, sürekli bir anket yapmak zordur ve bazen fiziksel olarak imkansızdır (örneğin, tüm kartuşların kalitesini kontrol etmek). Daha sonra, tüm genel popülasyondan sınırlı sayıda nesne rastgele seçilir ve çalışmalarına tabi tutulur.

örnekleme veya sadece örnekleme n hacminin bir dizisi x 1 , x 2 , …, x n bağımsız özdeş dağıtılmış rasgele değişkenlerin bir dizisidir, her birinin dağılımı rasgele değişken x'in dağılımıyla çakışır.

Örneğin, rastgele bir değişkenin ilk n ölçümünün sonuçları x Sonsuz bir genel popülasyondan n büyüklüğünde bir örnek olarak düşünmek gelenekseldir. Ortaya çıkan veri denir rastgele bir değişkenin gözlemleri x ve ayrıca x rastgele değişkeninin x 1 , x 2 , …, x n değerlerini aldığını söyleyin.


Matematiksel istatistiğin ana görevi, bir veya daha fazla bilinmeyen rastgele değişkenin dağılımı veya birbirleriyle ilişkileri hakkında bilimsel temelli sonuçlar çıkarmaktır. Numunenin özelliklerine ve özelliklerine dayanarak, sayısal özellikler ve rastgele bir değişkenin (genel popülasyon) dağılım yasası hakkında sonuçlar çıkarılmasından oluşan yönteme denir. örnekleme yöntemi.

Örnekleme yöntemiyle elde edilen rastgele bir değişkenin özelliklerinin objektif olabilmesi için örneklemin temsilci, şunlar. incelenen değeri yeterince temsil etti. kanun gereği büyük sayılarörneğin rastgele yapılırsa, örneğin temsili olacağı iddia edilebilir, yani. Evrendeki tüm maddelerin örnekleme dahil edilme olasılığı aynıdır. Bunun için var Farklı çeşitörnekleme.

1. Basit rastgele seçim, nesnelerin tüm genel popülasyondan birer birer çıkarıldığı bir seçimdir.

2. tabakalı (katmanlı)) seçim, N hacminin başlangıç ​​popülasyonunun alt kümelere (katmanlar) N 1 , N 2 ,…,N k , böylece N 1 + N 2 +…+ N k = N olacak şekilde alt kümelere bölünmesi gerçeğinden oluşur. belirlenir, her birinden n 1 , n 2 , …, n k büyüklüğünde basit bir rastgele örnek çıkarılır. Tabakalı seçimin özel bir durumu, nesnelerin genel popülasyonun tamamından değil, her bir tipik bölümünden seçildiği tipik seçimdir.

Kombine seçimÖrnek bir anketin çeşitli aşamalarını oluşturarak birkaç seçim türünü aynı anda birleştirir. Başka örnekleme yöntemleri de vardır.

örnek denir tekrarlanan , seçilen nesne bir sonrakini seçmeden önce genel popülasyona döndürülürse. örnek denir tekrar etmeyen , seçilen nesne genel popülasyona döndürülmezse. Sonlu bir genel popülasyon için, ikamesiz rastgele seçim, her adımda bireysel gözlemlerin bağımlılığına, geri dönüşlü rastgele seçim, gözlemlerin bağımsızlığına yol açar. Pratikte, genellikle tekrarlanmayan örneklerle ilgilenilir. Bununla birlikte, popülasyon büyüklüğü N, örneklem büyüklüğü n'den birçok kez daha büyük olduğunda (örneğin, yüzlerce veya binlerce kez), gözlemlerin bağımlılığı ihmal edilebilir.

Böylece, rastgele bir örnek x 1 , x 2 , …, x n, genel popülasyonu temsil eden bir rastgele değişken ξ'nin ardışık ve bağımsız gözlemlerinin sonucudur ve tüm örnek öğeleri, orijinal rastgele değişken x ile aynı dağılıma sahiptir.

Dağıtım fonksiyonu F x (x) ve rastgele değişken x'in diğer sayısal özellikleri çağrılacak teorik Farklı örnek özellikler , gözlemlerin sonuçlarına göre belirlenir.

Örnek x 1, x 2, ..., x k rastgele değişken x'in bağımsız gözlemlerinin sonucu olsun ve x 1 n 1 kez, x 2 - n 2 kez, ..., x k - n kez gözlemlendi , böylece n i \u003d n - örnek boyutu. n gözlemde x i'nin değerinin kaç kez göründüğünü gösteren n i sayısına denir. Sıklık verilen değer ve oran n ben /n = w i- göreceli sıklık. Açıkça sayılar w ben mantıklıyım ve

Bir özelliğin artan sırasına göre düzenlenmiş bir istatistiksel popülasyona denir. varyasyon serisi . Terimleri x (1) , x (2), ... x (n)'yi ifade eder ve seçenekler . Varyasyon serisi denir ayrıküyeleri belirli izole değerler alırsa. İstatistiksel dağılım kesikli rastgele değişken örnekleri x seçenekler listesi ve bunlara karşılık gelen göreceli frekanslar olarak adlandırılır. w ben . Sonuç tablosu denir istatistiksel taraf.

X (1) x(2) ... xk(k)
ω 1 ω 2 ... ω k

en büyük ve en küçük değer varyasyon serisinin x min ve x max'ı gösterir ve çağrı varyasyon serisinin aşırı üyeleri.

Sürekli bir rastgele değişken çalışılıyorsa, gruplama, gözlemlenen değerlerin aralığını, h eşit uzunluktaki k kısmi aralığa bölmekten ve bu aralıklardaki gözlemlerin oluşum sayısını saymaktan oluşur. Ortaya çıkan sayılar, frekanslar olarak alınır (bazı yeni, zaten ayrı rastgele değişkenler için). Aralıkların orta noktaları genellikle x i varyantı için yeni değerler olarak alınır (veya aralıkların kendileri tabloda belirtilmiştir). Sturgedes formülüne göre önerilen bölümleme aralığı sayısı k » 1 + log 2'dir. n, ve kısmi aralıkların uzunlukları h = (x max - x min)/k'dir. Tüm aralığın forma sahip olduğu varsayılır.

Grafiksel olarak, istatistiksel seriler bir çokgen, histogram veya kümülatif frekans grafiği olarak temsil edilebilir.

Frekans poligonu segmentleri (x 1, n 1), (x 2, n 2), ..., (x k, n k) noktalarını birleştiren kesik bir çizgi çağırın. Çokgen bağıl frekanslar segmentleri noktaları (x 1, w 1), (x2, w 2), …, (x k , w k). Çokgenler genellikle kesikli rastgele değişkenler durumunda bir örneği görüntülemek için kullanılır (Şekil 7.1.1).

Pirinç. 7.1

.1.

Göreceli frekansların histogramı Tabanı h uzunluğundaki kısmi aralıklar olan dikdörtgenlerden ve yüksekliklerden oluşan basamaklı bir şekil olarak adlandırılır.

eşit w ben/h.

Histogram, genellikle sürekli rastgele değişkenler durumunda bir örneği görüntülemek için kullanılır. Histogramın alanı bire eşittir (Şekil 7.1.2). Göreceli frekansların histogramındaki orta noktaları bağlarsak üst taraflar dikdörtgenler, ardından ortaya çıkan kesik çizgi, göreli frekansların bir çokgenini oluşturur. Bu nedenle, bir histogram bir grafik olarak görüntülenebilir. ampirik (örnek) dağıtım yoğunluğu fn(x). Teorik dağılımın sonlu bir yoğunluğu varsa, ampirik yoğunluk teorik olanın yaklaşık bir değeridir.

Kümülatif frekansların grafiği dikdörtgenlerin yüksekliklerini hesaplamak için basit olanlar değil, bir histograma benzer şekilde oluşturulan bir şekil olarak adlandırılır, ancak birikmiş bağıl frekanslar, şunlar. değerler. Bu değerler azalmaz ve biriken frekansların grafiği kademeli bir "merdiven" (0'dan 1'e) şeklindedir.

Kümülatif frekans grafiği pratikte teorik dağılım fonksiyonuna yaklaşmak için kullanılır.

Bir görev. Bölgedeki 100 küçük işletmeden oluşan bir örneklem analiz edilmiştir. Anketin amacı, her bir i-inci işletmede ödünç alınan ve özkaynakların (х i) oranını ölçmektir. Sonuçlar tablo 7.1.1'de sunulmuştur.

Masaİşletmelerin ödünç alınan ve özkaynak oranının katsayıları.

5,56 5,45 5,48 5,45 5,39 5,37 5,46 5,59 5,61 5,31
5,46 5,61 5,11 5,41 5.31 5,57 5,33 5,11 5,54 5,43
5,34 5,53 5,46 5,41 5,48 5,39 5,11 5,42 5,48 5,49
5,36 5,40 5,45 5,49 5,68 5,51 5,50 5,68 5,21 5,38
5,58 5,47 5,46 5,19 5,60 5,63 5,48 5,27 5,22 5,37
5,33 5,49 5,50 5,54 5,40 5.58 5,42 5,29 5,05 5,79
5,79 5,65 5,70 5,71 5,85 5,44 5,47 5,48 5,47 5,55
5,67 5,71 5,73 5,05 5,35 5,72 5,49 5,61 5,57 5,69
5,54 5,39 5,32 5,21 5,73 5,59 5,38 5,25 5,26 5,81
5,27 5,64 5,20 5,23 5,33 5,37 5,24 5,55 5,60 5,51

Birikmiş frekansların bir histogramını ve grafiğini oluşturun.

Çözüm. Gruplandırılmış bir dizi gözlem oluşturalım:

1. Örnekte x min = 5.05 ve x max = 5.85'i belirleyin;

2. Tüm aralığı k eşit aralığa bölün: k » 1 + log 2 100 = 7,62; k = 8, dolayısıyla aralığın uzunluğu

Tablo 7.1.2. Gruplandırılmış gözlemler

Aralık Sayısı Aralıklar Aralık orta noktaları x i w i fn(x)
5,05-5,15 5,1 0,05 0,05 0,5
5,15-5,25 5,2 0,08 0,13 0,8
5,25-5,35 5,3 0,12 0,25 1,2
5,35-5,45 5,4 0,20 0,45 2,0
5,45-5,55 5,5 0,26 0,71 2,6
5,55-5,65 5,6 0,15 0,86 1,5
5,65-5,75 5,7 0,10 0,96 1,0
5,75-5,85 5,8 0,04 1,00 0,4

Şek. 7.1.3 ve 7.1.4, tablo 7.1.2'deki verilere göre oluşturulmuş, birikmiş frekansların histogramı ve grafiği sunulmaktadır. Eğriler, verilere "uydurulmuş" yoğunluk ve normal dağılım işlevlerine karşılık gelir.

Bu nedenle, örnek dağılımı, nüfus dağılımının yaklaşık bir tahminidir.