منو
رایگان
ثبت
خانه  /  تبخال/ جمعیت و نمونه برای آدمک ها. جمعیت عمومی و نمونه مفهوم نمایندگی

جمعیت عمومی و نمونه برای آدمک ها. جمعیت عمومی و نمونه مفهوم نمایندگی

سخنرانی 6. عناصر آمار ریاضی

سوالاتی برای کنترل دانش و خلاصه کردن سخنرانی

1. یک متغیر تصادفی تعریف کنید.

2. فرمول هایی برای انتظارات ریاضی و پراکندگی متغیرهای تصادفی گسسته و پیوسته بنویسید.

3. تعریفی از قضیه حد انتگرال محلی لاپلاس ارائه دهید

4. فرمول های توزیع دوجمله ای، توزیع ابر هندسی، توزیع پواسون، توزیع یکنواخت و توزیع نرمال را بنویسید.

هدف: بررسی مفاهیم اولیه آمار ریاضی

1. جمعیت و نمونه

2. توزیع آماری نمونه. چند ضلعی. نمودار میله ای .

3. برآورد پارامترهای جمعیت عمومی بر اساس نمونه آن

4. میانگین های عمومی و نمونه. روشهای محاسبه آنها

5. واریانس های عمومی و نمونه.

6. سؤالاتی برای کنترل دانش و خلاصه کردن سخنرانی

ما شروع به مطالعه عناصر آمار ریاضی می کنیم که در آن روش های مبتنی بر علمی برای جمع آوری داده های آماری و پردازش آنها توسعه می یابد.

1. جامعه عمومی و نمونه.اجازه دهید نیاز به مطالعه مجموعه ای از اشیاء همگن باشد (این مجموعه نامیده می شود مجموع آماری)با توجه به برخی ویژگی های کمی یا کیفی که این اشیاء را مشخص می کند. به عنوان مثال، اگر دسته ای از قطعات وجود داشته باشد، قطعه استاندارد می تواند به عنوان یک علامت کیفی و اندازه کنترل شده قطعه می تواند به عنوان یک علامت کمی عمل کند.

بهتر است یک نظرسنجی مداوم انجام دهید، یعنی. هر مورد را بررسی کنید با این حال، در اغلب موارد، به دلایل مختلف، این امکان پذیر نیست. می تواند در معاینه کامل اختلال ایجاد کند عدد بزرگاشیاء، در دسترس نبودن آنها اگر مثلاً در هنگام انفجار یک پرتابه از یک دسته آزمایشی نیاز به دانستن میانگین عمق قیف داشته باشیم، با انجام یک بررسی کامل، کل دسته را از بین می‌بریم.

اگر امکان بررسی کامل وجود نداشته باشد، بخشی از اشیا برای مطالعه از کل جمعیت انتخاب می شود.

مجموعه آماری که برخی از اشیا از آن انتخاب می شوند نامیده می شود جمعیت عمومیمجموعه ای از اشیاء که به طور تصادفی از جمعیت عمومی انتخاب می شوند نامیده می شوند نمونه.

تعداد اشیاء در جمعیت عمومی و نمونه به ترتیب نامیده می شود جلدجمعیت عمومی و جلدنمونه ها.

مثال 10.1.میوه های یک درخت (200 قطعه) از نظر وجود طعم خاص این رقم بررسی می شود. برای انجام این کار، 10 عدد را انتخاب کنید. در اینجا 200 حجم جامعه و 10 حجم نمونه است.

اگر نمونه از یک شی گرفته شود که مورد بررسی قرار گیرد و به جامعه عمومی بازگردانده شود، نمونه فراخوانی می شود تکرار کرد.اگر اشیاء نمونه دیگر به جمعیت عمومی بازگردانده نشوند، نمونه فراخوانی می شود تکرار نشدنی



در عمل بیشتر از نمونه گیری غیر تکراری استفاده می شود. اگر حجم نمونه کسری کوچک از حجم جامعه باشد، تفاوت بین نمونه گیری مجدد و نمونه گیری غیر تکراری ناچیز است.

ویژگی های اشیاء در نمونه باید به درستی منعکس کننده ویژگی های اشیاء در جامعه باشد، یا به قول آنها، نمونه باید نماینده(نماینده). اعتقاد بر این است که نمونه نماینده است اگر همه اشیاء از جمعیت عمومی احتمال یکسانی برای قرار گرفتن در نمونه را داشته باشند، یعنی انتخاب به صورت تصادفی انجام شود. به عنوان مثال برای تخمین برداشت آینده می توان از جمعیت عمومی میوه هایی که هنوز نرسیده اند نمونه تهیه کرد و ویژگی های آنها (وزن، کیفیت و ...) را بررسی کرد. اگر کل نمونه از یک درخت گرفته شود، آنگاه نماینده نخواهد بود. یک نمونه معرف باید شامل میوه هایی باشد که به طور تصادفی از درختان انتخاب شده انتخاب شده اند.

2. توزیع آماری نمونه. چند ضلعی. نمودار میله ای.بگذارید نمونه ای از جمعیت عمومی گرفته شود و ایکس 1 مشاهده شد n 1 بار، ایکس 2 - ص 2یک بار، ...، x k - n k بار و n 1 +n 2 +…+ p k= پ -اندازهی نمونه. مقادیر مشاهده شده ایکس 1 , ایکس 2 , …, x kتماس گرفت گزینه ها،و دنباله متغیر، به ترتیب صعودی نوشته شده است سری تغییراتتعداد مشاهدات n 1 , n 2 , …, nkتماس گرفت فرکانس هاو رابطه آنها با حجم نمونه، , …, - فرکانس های نسبیتوجه داشته باشید که مجموع فرکانس های نسبی برابر با یک است: .

توزیع آماری نمونهلیست گزینه ها و فرکانس های مربوطه یا فرکانس های نسبی آنها را فراخوانی کنید. توزیع آماری را می توان به صورت دنباله ای از بازه ها و فرکانس های متناظر آنها (توزیع پیوسته) نیز مشخص کرد. به عنوان فرکانس مربوط به بازه، مجموع فرکانس های متغیری را که در این بازه قرار می گیرد، بگیرید. برای نمایش گرافیکی توزیع آماری، استفاده کنید چند ضلعی هاو هیستوگرام ها

برای ساختن چند ضلعی بر روی محور اوهمقادیر گزینه را کنار بگذارید ایکسمن، روی محور OU -مقادیر فرکانس پ i (فرکانس های نسبی).

مثال 10.2.روی انجیر شکل 10.1 چند ضلعی توزیع زیر را نشان می دهد

معمولاً چند ضلعی در مورد تعداد کمی از گزینه ها استفاده می شود. در مورد تعداد زیادی از انواع و در مورد توزیع مداوم ویژگی، هیستوگرام ها اغلب ساخته می شوند. برای انجام این کار، بازه ای که شامل تمام مقادیر مشاهده شده ویژگی است، به چندین بازه جزئی از طول تقسیم می شود. ساعتو برای هر بازه جزئی پیدا کنید n من، - مجموع فرکانس های متغیری که در آن قرار می گیرد من-فاصله سپس در این فواصل، مانند پایه ها، مستطیل هایی با ارتفاع (یا، کجا) می سازند پ -اندازهی نمونه).

مربع منمستطیل جزئی است , (یا ).

بنابراین، مساحت هیستوگرام برابر است با مجموع همه فرکانس ها (یا فرکانس های نسبی)، یعنی. اندازه نمونه (یا واحد).

مثال 10.3.روی انجیر 10.2 هیستوگرام توزیع حجم پیوسته را نشان می دهد n= 100 در جدول زیر آورده شده است.

در آمار ریاضی دو مفهوم اساسی متمایز می شود: جامعه عمومی و نمونه.
مجموعه عبارت است از مجموعه ای عملاً قابل شمارش از برخی اشیا یا عناصری که مورد توجه محقق است.
خاصیت یک مجموعه یک کیفیت واقعی یا خیالی است که در برخی از عناصر آن ذاتی است. ویژگی می تواند تصادفی یا غیر تصادفی باشد.
پارامتر جمعیت خاصیتی است که می تواند به عنوان یک ثابت یا یک متغیر کمیت شود.
یک مجموعه ساده با موارد زیر مشخص می شود:
یک ملک جداگانه (به عنوان مثال: همه دانش آموزان روسیه)؛
یک پارامتر جداگانه به شکل یک ثابت یا یک متغیر (همه دانش آموزان دختر)؛
سیستمی از خصوصیات غیر همپوشانی (ناسازگار)، به عنوان مثال: همه معلمان و دانش آموزان مدارس در ولادی وستوک.
یک مجموعه پیچیده با موارد زیر مشخص می شود:
سیستمی از ویژگی های حداقل تا حدی متقاطع (دانشجویان دانشکده های روانشناسی و ریاضی دانشگاه دولتی خاور دور که با مدال طلا از مدرسه فارغ التحصیل شدند).
سیستمی از پارامترهای مستقل و وابسته در مجموع؛ در مطالعه جامع شخصیت
مجموعه ای را همگن یا همگن می گویند که تمام خصوصیات آن در هر یک از عناصر آن نهفته است.
مجموعه ناهمگن یا ناهمگن مجموعه ای است که ویژگی های آن در زیر مجموعه های جداگانه ای از عناصر متمرکز شده است.
یک پارامتر مهم حجم جمعیت - تعداد عناصر تشکیل دهنده آن است. اندازه حجم بستگی به این دارد که خود جمعیت چگونه تعریف شده است، و به طور خاص به چه سوالاتی علاقه داریم. فرض کنید ما به وضعیت عاطفی یک دانش آموز سال اول در طول دوره قبولی در یک امتحان خاص در یک جلسه علاقه مند هستیم. سپس جمعیت در عرض نیم ساعت خسته می شود. اگر به وضعیت عاطفی همه دانشجویان سال اول علاقه مند باشیم، آنگاه کلیت بسیار بزرگتر خواهد بود و حتی اگر وضعیت عاطفی همه دانشجویان سال اول یک دانشگاه معین و غیره را در نظر بگیریم. واضح است که انبوه های حجم زیاد را فقط می توان به صورت انتخابی بررسی کرد.
نمونه، بخش معینی از جمعیت عمومی است، چیزی که مستقیما مورد مطالعه قرار می گیرد.
نمونه ها بر اساس معرف بودن، اندازه، روش نمونه گیری و طرح آزمون طبقه بندی می شوند.
نماینده - نمونه ای که به اندازه کافی جمعیت عمومی را از نظر کیفی و کمی منعکس می کند. نمونه باید به اندازه کافی جامعه عمومی را منعکس کند، در غیر این صورت نتایج با اهداف مطالعه منطبق نخواهد شد.
نماینده بودن به حجم بستگی دارد، هر چه حجم بیشتر باشد نمونه نماینده بیشتری دارد. با روش انتخاب.
تصادفی - اگر عناصر به طور تصادفی انتخاب شوند. از آنجایی که اکثر روش های آمار ریاضی مبتنی بر مفهوم نمونه تصادفی است، طبیعی است که نمونه باید تصادفی باشد.
نمونه غیر تصادفی:
انتخاب مکانیکی، زمانی که کل جمعیت به تعداد واحدهای برنامه ریزی شده در نمونه تقسیم می شود و سپس از هر قسمت یک عنصر انتخاب می شود.
انتخاب معمولی - جامعه به بخش های همگن تقسیم می شود و از هر یک نمونه تصادفی تهیه می شود.
انتخاب سریال - جمعیت به تعداد زیادی سری با اندازه های مختلف تقسیم می شود، سپس نمونه ای از یکی از هر سری ساخته می شود.
انتخاب ترکیبی - انواع انتخاب در نظر گرفته شده در مراحل مختلف ترکیب می شوند.
طبق طرح آزمایشی، نمونه ها می توانند مستقل و وابسته باشند. حجم نمونه به کوچک و بزرگ تقسیم می شود. نمونه‌های کوچک نمونه‌هایی هستند که تعداد عناصر آن n 200 است و نمونه متوسط ​​شرایط 30 را برآورده می‌کند. نمونه‌های کوچک برای کنترل آماری ویژگی‌های شناخته شده جمعیت‌های مورد مطالعه استفاده می‌شوند.
نمونه های بزرگ برای تنظیم ویژگی های ناشناخته و پارامترهای جمعیت استفاده می شود.

بیشتر در مورد موضوع 1.3. جامعه عمومی و نمونه:

  1. 7.2 ویژگی های نمونه و جمعیت
  2. 1.6. برآوردهای نقطه ای و فاصله ای ضرایب همبستگی یک جمعیت عمومی با توزیع نرمال

نیاز به انجام تحقیقات انتخابی می تواند به دلایل مختلفی ایجاد شود:

    اغلب مطالعه کامل پدیده مورد مطالعه بسیار پرهزینه و طولانی است.

    گاهی اوقات فرصت استفاده از اطلاعات دریافتی در یک مطالعه کامل ممکن است قبل از تکمیل فرآیند آماده سازی آن تمام شود.

    در برخی موارد، در نتیجه بررسی کیفیت محصول، شی مورد مطالعه از بین می رود.

مثال:

    فرض کنید جمعیت همه دانش آموزان مدرسه باشد (600 نفر از 20 کلاس، 30 نفر در هر کلاس). موضوع مطالعه نگرش به سیگار است.

جمعیتمجموعه ای از اشیاء است که شما باید در مورد آنها اطلاعات کسب کنید.

جامعه عمومی شامل تمام اشیایی است که دارای کیفیت ها و ویژگی هایی است که مورد علاقه محقق است. گاهی اوقات جمعیت عمومی کل جمعیت بزرگسال یک منطقه خاص است (به عنوان مثال، زمانی که نگرش رای دهندگان بالقوه نسبت به یک نامزد مورد مطالعه قرار می گیرد)، اغلب چندین معیار تعیین می شود که اهداف مطالعه را تعیین می کند. به عنوان مثال، زنان 10 تا 89 ساله که حداقل یک بار در هفته از مارک خاصی از کرم دست استفاده می کنند و درآمد حداقل 5000 روبل برای هر عضو خانواده دارند.

نمونهمجموعه کوچکی از اشیاء استخراج شده از جمعیت عمومی است.

مجموعه نمونه گیری حداقل نتایج (موارد، موضوعات، اشیاء، رویدادها، نمونه ها) است که با رویه خاصی از جمعیت عمومی انتخاب شده و برای مطالعه ضروری است.

مثال ها:

    با شناسایی واکنش مشتریان شرکت به نوآوری ها، همه مشتریان شرکت نماینده جمعیت عمومی هستند. آن دسته از مشتریانی که فراخوانی شده اند، نمونه ای را تشکیل می دهند.

    هنگام حسابرسی موسسات با تعداد معاملات زیاد، باید به بررسی تعداد منتخب معاملات بسنده کرد. تمام معاملات شرکت، جمعیت عمومی را تشکیل می دهند که انتخاب شده - نمونه.

    جمعیت عمومی را همه سربازان وظیفه در یک سال مشخص تشکیل می دهند.

    همه لامپ هایی که در یک زمان معین در یک شرکت خاص ساخته می شوند یک جمعیت عمومی را تشکیل می دهند. آن لامپ هایی که برای کنترل انتخاب می شوند اختیاری هستند.

نمونه ممکن است نماینده یا غیرنماینده در نظر گرفته شود. نمونه در هنگام بررسی گروه بزرگی از افراد نماینده خواهد بود، اگر در این گروه نمایندگانی از زیر گروه های مختلف وجود داشته باشد، تنها از این طریق می توان نتیجه گیری درستی انجام داد. .

نمایندگی - مطابقت ویژگی های نمونه با ویژگی های جامعه یا جمعیت عمومی به عنوان یک کل.نماینده بودن تعیین می کند که چقدر امکان تعمیم نتایج مطالعه با مشارکت یک نمونه خاص به کل جمعیتی که از آن جمع آوری شده است، وجود دارد.

نماینده بودن را می توان به عنوان ویژگی یک نمونه برای نشان دادن پارامترهای جمعیت عمومی که از نقطه نظر اهداف مطالعه مهم هستند، تعریف کرد.

مثال:یک نمونه 60 نفری از دانش‌آموزان دبیرستانی جامعه بسیار بدتر از نمونه 60 نفری است که شامل 3 دانش‌آموز از هر کلاس می‌شود. دلیل اصلی این امر توزیع نابرابر سنی در طبقات است. بنابراین در حالت اول بازنمایی نمونه کم و در حالت دوم بازنمایی زیاد است (ceteris paribus) .

وظیفه 1.در شهری با 253000 شهروند واجد شرایط، در مورد همدردی های سیاسی رأی دهندگان آینده تحقیق کنید.

تصمیم گیری

    نمونه را می توان با درخواست از هر 15 خریدار که یک عدد بزرگ را ترک می کنند، ساخت مرکز خرید. چنین نمونه ای نظر بازدیدکنندگان مرکز خرید را منعکس می کند، اما بعید است که دیدگاه همه ساکنان شهر را نشان دهد.

    روش نمونه‌گیری دیگر این است که از هر 100 شهرنشین یک نظرسنجی تلفنی انجام شود و اعداد از فهرست تلفن گرفته شود. چنین نمونه گیری سیستماتیک اطلاعاتی را در مورد دیدگاه گروهی از افرادی که تلفن دارند، در خانه هستند و به تماس های تلفنی پاسخ می دهند، ارائه می دهد. اما منعکس کننده دیدگاه همه ساکنان شهر نیست.

    یکی دیگر از روش های نمونه گیری ممکن است مصاحبه با شرکت کنندگان در تجمعی باشد که توسط چندین نفر سازماندهی شده است احزاب سیاسی. چنین نمونه ای اطلاعاتی را در مورد ساکنینی که فعالانه در آن شرکت می کنند ارائه می دهد زندگی سیاسیشهرها

بنابراین، ما به چنین روش‌هایی برای نمونه‌گیری نیاز داریم که نمایانگر کل جامعه باشد، یعنی نمونه باید نماینده (نماینده) باشد.

وظیفه 2.تعیین اینکه آیا نمونه نماینده است:

1) تعداد تصادفات رانندگی در خرداد ماه در صورت نیاز به تهیه گزارش آماری تصادفات در شهر برای سال.

2) ساکنان شهری هنگام محاسبه تعداد خودروهای سرانه در کشور.

3) افراد 40 تا 50 ساله هنگام تعیین رتبه یک برنامه تلویزیونی جوانان.

تصمیم گیری

1) نمونه نماینده نیست. در تابستان در جاده ها برف و یخبندان نیست و این یکی از عوامل اصلی تصادفات است.

2) نمونه نماینده نیست. واضح است که تعداد خودروها در شهر بسیار بیشتر از مناطق روستایی است. این باید در نظر گرفته شود.

3) نمونه نماینده نیست. بعید است که افراد بین 40 تا 50 سال به برنامه ای که مخاطبان جوان است علاقه نشان دهند. هنگام استفاده از چنین نمونه ای، رتبه بندی می تواند به طور قابل توجهی کاهش یابد، اما این وضعیت واقعی امور را منعکس نمی کند. برای تشکیل یک مجموعه نمونه از موارد زیر استفاده می شود: راه های مختلفانتخاب. داده های آماری باید به گونه ای ارائه شوند که بتوان از آنها استفاده کرد.

جمعیت و پارامترهای نمونه

N جمعیت عمومی است که به طبقات N 1، N 2 و غیره تقسیم می شود.

اقشاراز نظر ویژگی های آماری اشیاء همگن هستند (به عنوان مثال، جمعیت بر اساس گروه های سنی یا طبقه اجتماعی به اقشار تقسیم می شود؛ شرکت ها به بخش ها تقسیم می شوند). در این حالت به نمونه ها طبقه بندی می گویند.

N - حجم نمونه

اساس نتیجه گیری آماری مطالعه توزیع متغیر تصادفی X است، در حالی که مقادیر مشاهده شده x 1، x 2، x 3 تحقق متغیر تصادفی x نامیده می شود.

توزیع متغیر تصادفی X در جامعه عمومی به صورت نظری، ایده آل و نمونه نمونه آن توزیع تجربی است.

برای یک نمونه، تعیین تابع توزیع دشوار و گاهی غیرممکن است، بنابراین پارامترها از داده های تجربی تخمین زده می شوند، و سپس آنها را به یک عبارت تحلیلی که توزیع نظری را توصیف می کند، جایگزین می کنند. در این صورت فرض در مورد نوع توزیع می تواند هم از نظر آماری صحیح و هم اشتباه باشد.

اما در هر صورت، توزیع تجربی بازسازی‌شده از نمونه، تقریباً توزیع واقعی را مشخص می‌کند.

مهمترین پارامترهای توزیع، انتظارات ریاضی استآو واریانس σ2اندازه گیری پراکندگی داده ها است.

انحراف معیارσ - درجه انحراف داده ها یا مجموعه های مشاهده ای از مقدار میانگین.

وظیفه 3.میخائیل به همراه دوستانش تصمیم گرفتند قد سگ هایشان را (با جثه) اندازه گیری کنند. یافتن: مقدار میانگین؛ انحراف رشد

تصمیم گیری

    انتظارات ریاضی یا مقدار میانگین را می توان با فرمول پیدا کرد:


    حال انحراف قد هر سگ را از میانگین یا انتظار ریاضی محاسبه می کنیم، یعنی واریانس را محاسبه می کنیم.


انحراف معیار فقط است ریشه دوماز پراکندگی

σ \ = 147,32

بنابراین، دانستن انحراف معیارما می دانیم که "قد نرمال" به چه معناست، و سگ بسیار بلند و بسیار کوچک چیست.

پاسخ: 394، 21.704; 147.32.

وظیفه 4.مشاهده در آزمایشگاه کنترل تاریخ انقضا 50 لامپ برقی با همان قدرت که به طور تصادفی از دسته بزرگی از لامپ های هم قدرت تولید شده توسط کارخانه گرفته شده است، منجر به اطلاعات زیر در مورد نقض ضمانت نامه شد.زمان سوختن:

انحراف در اچ

10 توزیع کوچک، که منعکس کننده انحراف واقعی است هفتمدوره سوزاندن لامپ از گارانتی.

تصمیم گیری

انحراف متوسط

بنابراین، توزیع نرمال مورد نظر با مشخص می شود مقادیر زیرپارامترها: a = 0.4;σ2 = 318; σ = 17.8.

بنابراین چگالی احتمال:

تابع توزیع مربوط به این چگالی به صورت زیر خواهد بود:

توزیع یک متغیر تصادفی شامل تمام اطلاعات مربوط به ویژگی های آماری آن است. چند مقدار از یک متغیر تصادفی را باید بدانید تا بتوانید توزیع آن را بسازید؟ برای این کار باید کاوش کنید جمعیت عمومی.

جمعیت عمومی مجموعه ای از تمام مقادیری است که یک متغیر تصادفی معین می تواند بگیرد.

تعداد واحدهای جمعیت عمومی را حجم آن می گویند ن. این مقدار می تواند متناهی یا بی نهایت باشد. به عنوان مثال، اگر رشد ساکنان یک شهر خاص را مطالعه کنیم، حجم عمومی جمعیت برابر با تعداد ساکنان شهر خواهد بود. در صورت وجود آزمایش فیزیکی، سپس حجم جمعیت عمومی بی نهایت خواهد بود، زیرا تعداد تمام مقادیر ممکن هر پارامتر فیزیکی برابر با بی نهایت است.

مطالعه جمعیت عمومی همیشه ممکن و مناسب نیست. اگر اندازه جمعیت عمومی بی نهایت باشد غیرممکن است. اما حتی با حجم های محدود، یک مطالعه کامل همیشه قابل توجیه نیست، زیرا به زمان و کار زیادی نیاز دارد و معمولاً به دقت مطلق نتایج نیاز نیست. نتایج کمتر دقیق، اما با تلاش و منابع بسیار کمتر، تنها با مطالعه بخشی از جمعیت عمومی به دست می آید. چنین مطالعاتی انتخابی نامیده می شود.

مطالعات آماری که فقط بر روی بخشی از جامعه انجام می شود نمونه گیری و به بخشی از جامعه مورد مطالعه نمونه می گویند.

شکل 7.2 به صورت نمادین جامعه و نمونه را به عنوان یک مجموعه و زیر مجموعه آن نشان می دهد.

شکل 7.2 جمعیت و نمونه

با کار با زیرمجموعه‌ای از یک جمعیت عمومی معین، که اغلب بخش ناچیزی از آن را تشکیل می‌دهند، نتایجی به دست می‌آوریم که از نظر دقت برای اهداف عملی کاملاً رضایت‌بخش هستند. بررسی بخش بزرگی از جمعیت عمومی فقط دقت را افزایش می دهد، اما در صورتی که از نظر آماری به درستی نمونه برداری شود، ماهیت نتایج تغییر نمی کند.

برای اینکه نمونه منعکس کننده ویژگی های جمعیت عمومی باشد و نتایج قابل اعتماد باشد، باید قابل اعتماد باشد نماینده(نماینده).

در برخی از جمعیت های عمومی، هر بخشی از آنها به دلیل ماهیتشان نماینده هستند. با این حال، در بیشتر موارد باید مراقبت های ویژه ای انجام شود تا اطمینان حاصل شود که نمونه ها نماینده هستند.

یکییکی از دستاوردهای اصلی آمار ریاضی مدرن، توسعه تئوری و عملی روش نمونه‌گیری تصادفی است که نماینده انتخاب داده‌ها را تضمین می‌کند.

مطالعات نمونه در مقایسه با مطالعه کل جمعیت، همیشه دقت خود را از دست می دهند. با این حال، در صورتی که بزرگی خطا مشخص باشد، می توان آن را تطبیق داد. بدیهی است که هرچه حجم نمونه به اندازه جامعه عمومی نزدیک شود، خطا کمتر خواهد بود. از اینجا مشخص می شود که مشکلات استنتاج آماری به ویژه در هنگام کار با نمونه های کوچک اهمیت پیدا می کند. ن ? 10-50).

این علمی است که بر اساس روش های تئوری احتمال، به سیستم سازی و پردازش داده های آماری برای به دست آوردن نتایج علمی و عملی می پردازد.

داده های آماری اطلاعاتی در مورد تعداد اشیایی که ویژگی های خاصی دارند نامیده می شود .

به گروهی از اشیاء که بر اساس برخی صفات کمی یا کیفی متحد شده اند گفته می شود تجمیع . اشیاء موجود در مجموعه عناصر آن نامیده می شوند و تعداد کل آنها آن است جلد.

جمعیت عمومیمجموعه ای از همه مشاهدات محتمل قابل تصور است که می توان تحت یک مجموعه شرایط واقعی معین یا دقیق تر انجام داد: جامعه عمومی یک متغیر تصادفی x و فضای احتمال مرتبط با آن است (W, I, P).

توزیع یک متغیر تصادفی x نامیده می شود توزیع جمعیت(آنها می گویند، برای مثال، در مورد یک جمعیت معمولی توزیع شده یا به سادگی عادی).

به عنوان مثال، اگر یک سری اندازه گیری مستقل از یک متغیر تصادفی انجام شود ایکس،پس جمعیت عمومی از نظر نظری نامتناهی است (یعنی جمعیت عمومی یک مفهوم انتزاعی و به طور معمول ریاضی است). اگر تعداد اقلام معیوب در یک دسته از N مورد بررسی شود، این دسته به عنوان یک جمعیت محدود از حجم N در نظر گرفته می شود.

در مورد مطالعات اجتماعی-اقتصادی، جمعیت یک شهر، منطقه یا کشور معین می تواند جمعیت عمومی حجم N باشد و ویژگی های اندازه گیری شده درآمد، هزینه یا پس انداز یک فرد است. اگر یک ویژگی ماهیت کیفی داشته باشد (به عنوان مثال، جنسیت، ملیت، موقعیت اجتماعی، شغل و غیره)، اما به مجموعه محدودی از گزینه‌ها تعلق داشته باشد، می‌توان آن را به صورت عدد نیز رمزگذاری کرد (همانطور که اغلب در پرسشنامه‌ها انجام می‌شود. ).

اگر تعداد اجسام N به اندازه کافی زیاد باشد، انجام یک بررسی مداوم (مثلاً بررسی کیفیت همه کارتریج ها) دشوار و گاهی اوقات از نظر فیزیکی غیرممکن است. سپس تعداد محدودی از اشیا به طور تصادفی از کل جمعیت عمومی انتخاب شده و مورد مطالعه قرار می گیرند.

نمونه برداری یا فقط نمونه برداریاز حجم n دنباله ای x 1، x 2، ...، x n از متغیرهای تصادفی مستقل توزیع شده یکسان است که توزیع هر یک از آنها با توزیع متغیر تصادفی x منطبق است.

به عنوان مثال، نتایج n اندازه گیری اول یک متغیر تصادفی ایکسمرسوم است که آن را به عنوان نمونه ای با اندازه n از یک جمعیت عمومی بی نهایت در نظر بگیریم. داده های به دست آمده نامیده می شود مشاهدات یک متغیر تصادفی x، و همچنین بگویید که متغیر تصادفی x "مقادیر" x 1 , x 2 , …, x n را می گیرد.


وظیفه اصلی آمار ریاضی نتیجه گیری علمی در مورد توزیع یک یا چند متغیر تصادفی مجهول یا رابطه آنها با یکدیگر است. روشی که بر اساس ویژگی ها و ویژگی های نمونه، در مورد ویژگی های عددی نتیجه گیری می شود و قانون توزیع یک متغیر تصادفی (جمعیت عمومی) نامیده می شود. روش نمونه گیری.

برای اینکه ویژگی های یک متغیر تصادفی به دست آمده با روش نمونه گیری عینی باشد، لازم است که نمونه نماینده، آن ها به اندازه کافی ارزش مورد مطالعه را نشان می دهد. به موجب قانون اعداد بزرگمی توان استدلال کرد که نمونه در صورتی نماینده خواهد بود که به صورت تصادفی انجام شود، یعنی. همه اقلام در جامعه احتمال یکسانی برای گنجاندن در نمونه را دارند. برای این وجود دارد انواع مختلفنمونه برداری

1. سادهانتخاب تصادفی انتخابی است که در آن اشیا یک به یک از کل جمعیت عمومی استخراج می شوند.

2. طبقه بندی شده (طبقه بندی شده)) انتخاب شامل این واقعیت است که جمعیت اولیه حجم N به زیر مجموعه ها (قشر) N 1 , N 2 ,…,N k , به طوری که N 1 + N 2 +… + N k = N تقسیم می شود. تعیین می شود، از هر یک نمونه تصادفی ساده به اندازه n 1، n 2، ...، n k از آنها استخراج می شود. یک مورد خاص از انتخاب طبقه بندی شده، انتخاب معمولی است، که در آن اشیا نه از کل جمعیت عمومی، بلکه از هر بخش معمولی آن انتخاب می شوند.

انتخاب ترکیبیچندین نوع انتخاب را به طور همزمان ترکیب می کند و مراحل مختلف یک بررسی نمونه را تشکیل می دهد. روش های دیگری نیز برای نمونه گیری وجود دارد.

نمونه نامیده می شود تکرار کرد , اگر شی انتخاب شده قبل از انتخاب مورد بعدی به جمعیت عمومی بازگردانده شود. نمونه نامیده می شود غیر تکراری , اگر شی انتخاب شده به جمعیت عمومی بازگردانده نشود. برای یک جمعیت عمومی محدود، انتخاب تصادفی بدون جایگزینی در هر مرحله به وابستگی مشاهدات فردی منجر می‌شود، انتخاب تصادفی به همان اندازه احتمالی با جایگزینی منجر به استقلال مشاهدات می‌شود. در عمل معمولاً با نمونه های تکرار نشدنی سروکار داریم. با این حال، زمانی که اندازه جمعیت N چندین برابر حجم نمونه n باشد (مثلاً صدها یا هزاران بار)، وابستگی مشاهدات را می توان نادیده گرفت.

بنابراین، یک نمونه تصادفی x 1، x 2، ...، x n حاصل مشاهدات متوالی و مستقل از یک متغیر تصادفی ξ است که نشان دهنده جمعیت عمومی است و همه عناصر نمونه دارای توزیع مشابهی با متغیر تصادفی اصلی x هستند.

تابع توزیع F x (x) و سایر مشخصات عددی متغیر تصادفی x فراخوانی می شود نظری بر خلاف ویژگی های نمونه ، که با نتایج مشاهدات مشخص می شود.

بگذارید نمونه x 1، x 2، ...، x k حاصل مشاهدات مستقل یک متغیر تصادفی x باشد، و x 1 n 1 بار، x 2 - n 2 بار، ...، x k - n بار مشاهده شد. ، به طوری که n i \u003d n - اندازه نمونه. عدد n i که نشان می دهد چند برابر مقدار x i در n مشاهدات ظاهر شده است، نامیده می شود. فرکانس مقدار داده شده، و نسبت n i /n = wمن- فراوانی نسبی. واضح است که اعداد wمن منطقی هستم و .

جامعه آماری مرتب شده به ترتیب صعودی یک ویژگی نامیده می شود سری های متغیر . عبارات آن نشان دهنده x (1) , x (2)، ... x (n) هستند و نامیده می شوند گزینه ها . سری تغییرات نامیده می شود گسستهاگر اعضای آن مقادیر جدا شده خاصی را بگیرند. توزیع آماری نمونه هایی از یک متغیر تصادفی گسسته ایکسفهرستی از گزینه ها و فرکانس های نسبی مربوط به آنها نامیده می شود wمن . جدول به دست آمده نامیده می شود سمت آماری

X (1) x(2) ... xk(k)
ω 1 ω 2 ... ω k

بزرگترین و کوچکترین ارزشاز سری های متغیر x min و x max را نشان می دهند و فراخوانی می کنند اعضای افراطی سری تغییرات

اگر یک متغیر تصادفی پیوسته مورد مطالعه قرار گیرد، گروه بندی شامل تقسیم فاصله مقادیر مشاهده شده به k بازه های جزئی با طول مساوی h و شمارش تعداد وقوع مشاهدات در این فواصل است. اعداد به‌دست‌آمده به‌عنوان فرکانس‌های n i (برای برخی از متغیرهای تصادفی جدید، از قبل گسسته) گرفته می‌شوند. نقاط میانی فواصل معمولاً به عنوان مقادیر جدید برای نوع x i در نظر گرفته می شوند (یا خود فواصل در جدول نشان داده شده اند). طبق فرمول استرجدز، تعداد توصیه شده فواصل پارتیشن بندی k » 1 + log 2 است. n، و طول بازه های جزئی h = (x max - x min)/k است. فرض بر این است که کل بازه دارای شکل است.

از نظر گرافیکی، سری های آماری را می توان به صورت چندضلعی، هیستوگرام یا نمودار فرکانس تجمعی نشان داد.

چند ضلعی فرکانسخط شکسته ای را فراخوانی می کنیم که بخش های آن نقاط (x 1، n 1)، (x 2، n 2)، ...، (x k، n k) را به هم متصل می کنند. چند ضلعی فرکانس های نسبی خط شکسته ای نامیده می شود که قسمت های آن نقاط را به هم متصل می کند (x 1, w 1)، (x2، w 2)، …، (x k، wک). معمولاً از چند ضلعی برای نمایش نمونه در مورد متغیرهای تصادفی گسسته استفاده می شود (شکل 7.1.1).

برنج. 7.1

.1.

هیستوگرام فرکانس های نسبیشکل پلکانی نامیده می شود، متشکل از مستطیل هایی که پایه آن فواصل جزئی به طول h و ارتفاعات است.

برابر w i/h

هیستوگرام معمولاً برای نمایش نمونه در مورد متغیرهای تصادفی پیوسته استفاده می شود. مساحت هیستوگرام برابر با یک است (شکل 7.1.2). اگر نقاط میانی را در هیستوگرام فرکانس های نسبی به هم وصل کنیم طرف های بالاییمستطیل، سپس خط شکسته حاصل چند ضلعی از فرکانس های نسبی را تشکیل می دهد. بنابراین، هیستوگرام را می توان به عنوان یک نمودار مشاهده کرد چگالی توزیع تجربی (نمونه). f n (x). اگر توزیع نظری دارای چگالی متناهی باشد، چگالی تجربی تقریبی از چگالی نظری است.

نمودار فرکانس های تجمعیبه شکلی گفته می شود که مشابه هیستوگرام ساخته شده باشد، با این تفاوت که برای محاسبه ارتفاع مستطیل ها، ارتفاع های ساده گرفته نمی شود، بلکه فرکانس های نسبی انباشته شده, آن ها ارزش ها این مقادیر کاهش نمی یابد و نمودار فرکانس های انباشته شده به شکل یک "نردبان" پله ای است (از 0 تا 1).

نمودار فرکانس تجمعی در عمل برای تقریب تابع توزیع نظری استفاده می شود.

وظیفه.نمونه ای از 100 شرکت کوچک در منطقه مورد تجزیه و تحلیل قرار می گیرد. هدف از این نظرسنجی اندازه گیری نسبت وام گرفته شده به وجوه خود (х i) در هر یکمین شرکت است. نتایج در جدول 7.1.1 ارائه شده است.

جدولضرایب نسبت وام گرفته شده به وجوه خود شرکت ها.

5,56 5,45 5,48 5,45 5,39 5,37 5,46 5,59 5,61 5,31
5,46 5,61 5,11 5,41 5.31 5,57 5,33 5,11 5,54 5,43
5,34 5,53 5,46 5,41 5,48 5,39 5,11 5,42 5,48 5,49
5,36 5,40 5,45 5,49 5,68 5,51 5,50 5,68 5,21 5,38
5,58 5,47 5,46 5,19 5,60 5,63 5,48 5,27 5,22 5,37
5,33 5,49 5,50 5,54 5,40 5.58 5,42 5,29 5,05 5,79
5,79 5,65 5,70 5,71 5,85 5,44 5,47 5,48 5,47 5,55
5,67 5,71 5,73 5,05 5,35 5,72 5,49 5,61 5,57 5,69
5,54 5,39 5,32 5,21 5,73 5,59 5,38 5,25 5,26 5,81
5,27 5,64 5,20 5,23 5,33 5,37 5,24 5,55 5,60 5,51

یک هیستوگرام و نمودار فرکانس های انباشته شده بسازید.

تصمیم گیری. بیایید یک سری مشاهدات گروهی بسازیم:

1. در نمونه x min = 5.05 و x max = 5.85 را تعیین کنید.

2. کل محدوده را به k فواصل مساوی تقسیم کنید: k » 1 + log 2 100 = 7.62; k = 8، از این رو طول بازه

جدول 7.1.2.مجموعه ای از مشاهدات گروهی

شماره فاصله فواصل نقاط میانی فاصله x i wمن f n (x)
5,05-5,15 5,1 0,05 0,05 0,5
5,15-5,25 5,2 0,08 0,13 0,8
5,25-5,35 5,3 0,12 0,25 1,2
5,35-5,45 5,4 0,20 0,45 2,0
5,45-5,55 5,5 0,26 0,71 2,6
5,55-5,65 5,6 0,15 0,86 1,5
5,65-5,75 5,7 0,10 0,96 1,0
5,75-5,85 5,8 0,04 1,00 0,4

روی انجیر 7.1.3 و 7.1.4، ساخته شده بر اساس داده های جدول 7.1.2، یک هیستوگرام و نمودار فرکانس های انباشته ارائه شده است. منحنی ها مربوط به چگالی و توابع توزیع نرمال "برازش" داده ها هستند.

بنابراین، توزیع نمونه تقریبی از توزیع جمعیت عمومی است.