Meni
Besplatno
Dom  /  Ringworm kod ljudi/ Kako izračunati aritmetičku sredinu. Proračun prosječne vrijednosti prema stanju. Apsolutni rast, lančani i osnovni rast i stope rasta

Kako izračunati aritmetičku sredinu. Proračun prosječne vrijednosti prema stanju. Apsolutni rast, lančani i osnovni rast i stope rasta

Svaka osoba unutra savremeni svet Kada planirate da podignete kredit ili napravite zalihe povrća za zimu, povremeno nailazite na koncept kao što je "prosječna vrijednost". Hajde da saznamo: šta je to, koje vrste i klase postoje i zašto se koristi u statistici i drugim disciplinama.

Prosječna vrijednost - šta je to?

Sličan naziv (SV) je generalizovana karakteristika skupa homogenih pojava, određena bilo kojom jednom kvantitativno promenljivom karakteristikom.

Međutim, ljudi koji su daleko od takvih nejasnih definicija ovaj koncept shvataju kao prosječnu količinu nečega. Na primjer, prije podizanja kredita, službenik banke će svakako tražiti od potencijalnog klijenta podatke o prosječnim prihodima za godinu dana, odnosno o ukupnom iznosu novca koji osoba zaradi. Izračunava se tako što se zarada za cijelu godinu zbroji i podijeli sa brojem mjeseci. Tako će banka moći da utvrdi da li će njen klijent moći da otplati dug na vreme.

Zašto se koristi?

U pravilu, prosječne vrijednosti se široko koriste za davanje sažetog opisa određenih društvenih pojava masovne prirode. Mogu se koristiti i za proračune manjeg obima, kao u slučaju kredita u gornjem primjeru.

Međutim, najčešće se prosječne vrijednosti i dalje koriste u globalne svrhe. Primjer jednog od njih je obračun količine električne energije koju građani utroše tokom jednog kalendarskog mjeseca. Na osnovu dobijenih podataka dalje se utvrđuje maksimalni standardi za kategorije stanovništva koje uživaju beneficije od države.

Takođe koristeći prosječne vrijednosti razvija se garantni rok na radni vek pojedinih kućnih aparata, automobila, zgrada i dr. Na osnovu ovako prikupljenih podataka svojevremeno su razvijeni savremeni standardi rada i odmora.

Praktično bilo koji fenomen savremeni život, koji je masovne prirode, na ovaj ili onaj način nužno je povezan sa konceptom koji se razmatra.

Područja primjene

Ovaj fenomen se široko koristi u gotovo svim egzaktnim naukama, posebno eksperimentalnim.

Pronalaženje prosjeka je od velike važnosti u medicini, inženjerstvu, kuhanju, ekonomiji, politici itd.

Na osnovu podataka dobijenih ovakvim generalizacijama razvijaju terapijske lijekove, obrazovne programe, utvrđuju minimalne egzistencijalne razine i plate, grade rasporedi treninga, proizvodimo namještaj, odjeću i obuću, sredstva za higijenu i još mnogo toga.

U matematici se ovaj izraz naziva “prosječna vrijednost” i koristi se za rješavanje različitih primjera i problema. Najjednostavniji su sabiranje i oduzimanje običnim razlomcima. Uostalom, kao što znate, za rješavanje takvih primjera potrebno je oba razlomka dovesti na zajednički nazivnik.

Takođe u kraljici egzaktnih nauka često se koristi termin „prosečna vrednost slučajne varijable“, koji je sličan po značenju. Većini je poznatije kao „matematičko očekivanje“, koje se češće razmatra u teoriji vjerovatnoće. Vrijedi napomenuti da se sličan fenomen primjenjuje i kod izvođenja statističkih proračuna.

Prosječna vrijednost u statistici

Međutim, koncept koji se proučava najčešće se koristi u statistici. Kao što je poznato, sama ova nauka specijalizovana je za izračunavanje i analizu kvantitativnih karakteristika masovnih društvenih pojava. Stoga se prosječna vrijednost u statistici koristi kao specijalizirana metoda za postizanje njenih glavnih ciljeva – prikupljanja i analize informacija.

Suština ove statističke metode je zamijeniti pojedinačne jedinstvene vrijednosti karakteristike koja se razmatra određenom uravnoteženom prosječnom vrijednošću.

Primjer je poznati vic o hrani. Dakle, u nekoj fabrici utorkom za ručak njeni gazde obično jedu tepsiju od mesa, a obični radnici jedu dinstan kupus. Na osnovu ovih podataka možemo zaključiti da osoblje fabrike u prosjeku jede sarmice utorkom.

Iako je ovaj primjer malo preuveličan, on ilustruje glavni nedostatak metode traženja prosječne vrijednosti – izjednačavanje individualnih karakteristika objekata ili ličnosti.

U prosječnim vrijednostima koriste se ne samo za analizu prikupljenih informacija, već i za planiranje i predviđanje daljnjih akcija.

Koristi se i za ocjenu postignutih rezultata (npr. realizacija plana uzgoja i žetve pšenice za proljetno-ljetnu sezonu).

Kako pravilno izračunati

Iako u zavisnosti od tipa SV postoje različite formule za njegovo izračunavanje, u opšta teorija statistika se po pravilu koristi samo jednom metodom za izračunavanje prosječne vrijednosti neke karakteristike. Da biste to učinili, prvo morate zbrojiti vrijednosti svih pojava, a zatim podijeliti rezultirajuću sumu s njihovim brojem.

Kada pravite takve proračune, vrijedi zapamtiti da prosječna vrijednost uvijek ima istu dimenziju (ili jedinice) kao pojedinačna jedinica populacije.

Uslovi za ispravan obračun

Formula o kojoj smo gore govorili je vrlo jednostavna i univerzalna, tako da je gotovo nemoguće pogriješiti s njom. Međutim, uvijek je vrijedno razmotriti dva aspekta, inače dobijeni podaci neće odražavati stvarno stanje.


SV klase

Nakon što smo pronašli odgovore na osnovna pitanja: "Koja je prosječna vrijednost?", "Gdje se koristi?" i "Kako to možete izračunati?", vrijedi saznati koje klase i tipovi SV postoje.

Prije svega, ovaj fenomen je podijeljen u 2 klase. Ovo su strukturni i prosjeci snage.

Vrste SV-ova snage

Svaka od gore navedenih klasa, zauzvrat, podijeljena je na tipove. Klasa smirenosti ima četiri.

  • Aritmetički prosjek je najčešći tip SV. To je prosječni pojam, pri određivanju kojeg se ukupan volumen razmatrane karakteristike u skupu podataka jednako raspoređuje na sve jedinice ovog skupa.

    Ovaj tip se dijeli na podtipove: jednostavna i ponderirana aritmetička SV.

  • Harmonička sredina je indikator koji je inverzan od proste aritmetičke sredine, izračunate iz recipročnih vrijednosti karakteristike koja se razmatra.

    Koristi se u slučajevima kada su pojedinačne vrijednosti atributa i proizvoda poznate, ali podaci o učestalosti nisu.

  • Geometrijska sredina se najčešće koristi kada se analiziraju stope rasta ekonomske pojave. Omogućuje očuvanje nepromijenjenog proizvoda pojedinačnih vrijednosti date količine, a ne zbroja.

    Takođe može biti jednostavan i uravnotežen.

  • Prosjek kvadratna količina koristi se u proračunu pojedinačni indikatori indikatori, kao što je koeficijent varijacije, koji karakteriše ritam proizvodnje, itd.

    Također se koristi za izračunavanje prosječnih promjera cijevi, kotača, prosječnih stranica kvadrata i sličnih figura.

    Kao i sve druge vrste prosjeka, srednji kvadrat može biti jednostavan i ponderiran.

Vrste strukturnih veličina

Pored prosječnih SV-a, strukturni tipovi se često koriste u statistici. Oni su prikladniji za izračunavanje relativnih karakteristika vrijednosti različite karakteristike i unutrašnja struktura redovi distribucije.

Postoje dvije takve vrste.


Karakteristike jedinica statističkih agregata su različite po svom značenju, na primjer, plate radnika u istoj profesiji preduzeća nisu iste za isti vremenski period, tržišne cijene za iste proizvode, prinosi usjeva u okrugu farme itd. Stoga, kako bi se odredila vrijednost karakteristike koja je karakteristična za cjelokupnu populaciju jedinica koje se proučavaju, izračunavaju se prosječne vrijednosti.
prosječna vrijednost ovo je generalizirajuća karakteristika skupa pojedinačnih vrijednosti neke kvantitativne karakteristike.

Populacija koja se proučava na kvantitativnoj osnovi sastoji se od individualnih vrijednosti; oni su pod uticajem uobičajeni razlozi, dakle individualni uslovi. U prosječnoj vrijednosti poništavaju se odstupanja karakteristična za pojedinačne vrijednosti. Prosjek, kao funkcija skupa pojedinačnih vrijednosti, predstavlja cijeli agregat sa jednom vrijednošću i odražava ono što je zajedničko svim njegovim jedinicama.

Prosjek izračunat za populacije koje se sastoje od kvalitativno homogenih jedinica naziva se tipičan prosek. Na primjer, možete izračunati prosječnu mjesečnu platu zaposlenika određene profesionalne grupe (rudar, doktor, bibliotekar). Naravno, mjesečni nivoi plate rudari se, zbog razlika u kvalifikacijama, stažu, mjesečnom vremenu rada i mnogim drugim faktorima, razlikuju jedni od drugih i od visine prosječne plate. Međutim, prosječni nivo odražava glavne faktore koji utiču na visinu zarada, a razlike koje nastaju zbog individualnih karakteristika zaposlenog se poništavaju. Prosječna plata odražava tipičan nivo naknade za datu vrstu radnika. Dobijanju tipičnog prosjeka treba prethoditi analiza koliko je kvalitativno homogena data populacija. Ako se cjelina sastoji od pojedinačnih dijelova, treba je podijeliti u tipične grupe ( prosječna temperatura po bolnici).

Zovu se prosječne vrijednosti koje se koriste kao karakteristike za heterogene populacije sistemske proseke. Na primjer, prosječna vrijednost bruto domaćeg proizvoda (BDP) po stanovniku, prosječna vrijednost potrošnje različitih grupa dobara po osobi i druge slične vrijednosti koje predstavljaju opšte karakteristike države kao jedinstvenog ekonomskog sistema.

Prosjek se mora izračunati za populacije koje se sastoje od dovoljno veliki broj jedinice. Poštivanje ovog uslova je neophodno da bi zakon stupio na snagu veliki brojevi, kao rezultat toga slučajna odstupanja pojedinačnih vrijednosti od opšti trend poništavaju jedno drugo.

Vrste prosjeka i metode za njihovo izračunavanje

Izbor vrste prosjeka određen je ekonomskim sadržajem određenog indikatora i izvornim podacima. Međutim, svaka prosječna vrijednost mora biti izračunata tako da se, kada zamijeni svaku varijantu prosječne karakteristike, ne promijeni konačna, generalizirajuća ili, kako se to obično naziva. indikator definicije, što je povezano sa prosječnim indikatorom. Na primjer, prilikom zamjene stvarnih brzina na pojedinim dionicama rute, oni prosječna brzina ukupna udaljenost koju je vozilo prešlo u isto vrijeme ne bi se trebalo mijenjati; prilikom zamjene stvarnih plata individualni radnici srednja preduzeća plate Fond zarada ne bi trebalo da se menja. Shodno tome, u svakom konkretnom slučaju, u zavisnosti od prirode dostupnih podataka, postoji samo jedna prava prosečna vrednost indikatora koja je adekvatna svojstvima i suštini socio-ekonomskog fenomena koji se proučava.
Najčešće korištene su aritmetička sredina, harmonijska sredina, geometrijska sredina, kvadratna sredina i kubična sredina.
Navedeni prosjeci pripadaju klasi smireno prosječno i ujedinite opšta formula:
,
gdje je prosječna vrijednost karakteristike koja se proučava;
m – indeks prosječnog stepena;
– trenutna vrijednost (varijanta) karakteristike koja se prosječuje;
n – broj karakteristika.
U zavisnosti od vrednosti eksponenta m razlikuju se sledeće vrste proseka snage:
kada je m = -1 – harmonijska sredina;
pri m = 0 – geometrijska sredina;
za m = 1 – aritmetička sredina;
za m = 2 – srednji kvadrat;
pri m = 3 – prosječna kubna.
Kada koristite iste početne podatke, veći je eksponent m u gornjoj formuli, the više vrijednosti prosječna veličina:
.
Ovo svojstvo proseka stepena da raste sa povećanjem eksponenta funkcije koja definiše naziva se pravilo većine prosjeka.
Svaki od označenih prosjeka može imati dva oblika: jednostavno I ponderisano.
Jednostavna srednja forma koristi se kada se prosjek izračunava iz primarnih (negrupisanih) podataka. Ponderisana forma– pri izračunavanju prosjeka na osnovu sekundarnih (grupisanih) podataka.

Aritmetička sredina

Aritmetička sredina se koristi kada je obim populacije zbir svih pojedinačnih vrijednosti različite karakteristike. Treba napomenuti da ako tip prosjeka nije specificiran, pretpostavlja se aritmetički prosjek. Njegova logična formula izgleda ovako:

Jednostavna aritmetička sredina izračunati na osnovu negrupisanih podataka prema formuli:
ili ,
gdje su pojedinačne vrijednosti karakteristike;
j – serijski broj jedinica posmatranja, koju karakteriše vrednost ;
N – broj jedinica posmatranja (volumen populacije).
Primjer. Na predavanju „Sažetak i grupisanje statističkih podataka“ ispitani su rezultati posmatranja radnog iskustva tima od 10 ljudi. Izračunajmo prosječno radno iskustvo radnika tima. 5, 3, 5, 4, 3, 4, 5, 4, 2, 4.

Koristeći formulu jednostavne aritmetičke sredine, također možemo izračunati proseci u hronološkim serijama, ako su vremenski intervali za koje su prikazane karakteristične vrijednosti jednaki.
Primjer. Volume prodati proizvodi za prvi kvartal iznosio je 47 den. jedinica, za drugu 54, za treću 65 i za četvrtu 58 den. jedinice Prosečan kvartalni promet je (47+54+65+58)/4 = 56 den. jedinice
Ako se trenutni pokazatelji daju u hronološkom nizu, tada se pri izračunavanju prosjeka zamjenjuju polovičnim zbrojima vrijednosti na početku i na kraju perioda.
Ako postoji više od dva momenta i intervali između njih su jednaki, onda se prosjek izračunava pomoću formule za prosječnu hronologiju

,
gdje je n broj vremenskih tačaka
U slučaju kada su podaci grupirani po karakterističnim vrijednostima (tj. konstruiran je diskretni varijacioni niz raspodjele) sa ponderisan aritmetički prosek izračunato pomoću frekvencija ili učestalosti opažanja specifičnih vrijednosti karakteristike, čiji je broj (k) znatno manji od broja opažanja (N).
,
,
gdje je k broj grupa varijacionih serija,
i – broj grupe varijacione serije.
Budući da , a , dobijamo formule koje se koriste za praktične proračune:
I
Primjer. Izračunajmo prosječan staž radnih timova u grupisanom redu.
a) korištenjem frekvencija:

b) korišćenjem frekvencija:

U slučaju kada su podaci grupirani po intervalima , tj. prikazani su u obliku intervalnih serija raspodjele, pri izračunavanju aritmetičke sredine kao vrijednost atributa uzima se sredina intervala, na osnovu pretpostavke o ravnomjernoj raspodjeli jedinica populacije u datom intervalu. Izračun se vrši pomoću formula:
I
gdje je sredina intervala: ,
gde su i donja i gornja granica intervala (pod uslovom da se gornja granica datog intervala poklapa sa donjom granicom sledećeg intervala).

Primjer. Izračunajmo aritmetičku sredinu intervalnih varijacionih serija konstruisanih na osnovu rezultata studije godišnjih zarada 30 radnika (videti predavanje „Sažetak i grupisanje statističkih podataka“).
Tabela 1 – Raspodjela serije intervalnih varijacija.

Intervali, UAH

Učestalost, ljudi

frekvencija,

Sredina intervala

600-700
700-800
800-900
900-1000
1000-1100
1100-1200

3
6
8
9
3
1

0,10
0,20
0,267
0,30
0,10
0,033

(600+700):2=650
(700+800):2=750
850
950
1050
1150

1950
4500
6800
8550
3150
1150

65
150
226,95
285
105
37,95

UAH ili UAH
Aritmetičke sredine izračunate na osnovu izvornih podataka i nizova varijacija intervala možda se neće podudarati zbog neravnomjerne raspodjele vrijednosti atributa unutar intervala. U ovom slučaju, za preciznije izračunavanje ponderisane aritmetičke sredine, treba koristiti ne sredine intervala, već jednostavne aritmetičke sredine izračunate za svaku grupu ( grupni proseci). Prosjek izračunat iz grupnih sredstava korištenjem ponderirane formule izračuna se poziva opšti prosek.
Aritmetička sredina ima niz svojstava.
1. Zbir odstupanja od prosječne opcije je nula:
.
2. Ako se sve vrijednosti opcije povećaju ili smanje za iznos A, tada se prosječna vrijednost povećava ili smanjuje za isti iznos A:

3. Ako se svaka opcija poveća ili smanji za B puta, tada će se i prosječna vrijednost povećati ili smanjiti za isti broj puta:
ili
4. Zbir proizvoda opcije po frekvencijama jednak je proizvodu prosječne vrijednosti zbirom frekvencija:

5. Ako se sve frekvencije podijele ili pomnože sa bilo kojim brojem, tada se aritmetička sredina neće promijeniti:

6) ako su u svim intervalima frekvencije jednake jedna drugoj, onda je ponderisana aritmetička sredina jednaka jednostavnoj aritmetičkoj sredini:
,
gdje je k broj grupa varijacione serije.

Korištenje svojstava prosjeka omogućava vam da pojednostavite njegovo izračunavanje.
Pretpostavimo da su sve opcije (x) prvo smanjene za isti broj A, a zatim smanjene za faktor B. Najveće pojednostavljenje se postiže kada se vrednost sredine intervala sa najvećom frekvencijom odabere kao A, a vrednost intervala (za serije sa identičnim intervalima) se izabere kao B. Količina A naziva se ishodište, pa se ovaj metod izračunavanja prosjeka naziva način b om referenca od uvjetne nule ili način trenutaka.
Nakon takve transformacije, dobijamo novi niz varijacionih distribucija, čije su varijante jednake . Njihova aritmetička sredina, tzv trenutak prvog reda, izražava se formulom i, prema drugom i trećem svojstvu, aritmetička sredina je jednaka sredini originalne verzije, umanjena prvo za A, a zatim za B puta, tj.
Za dobijanje pravi prosek(prosjek originalne serije) trebate pomnožiti trenutak prvog reda sa B i dodati A:

Izračunavanje aritmetičke sredine metodom momenata ilustrovano je podacima u tabeli. 2.
Tabela 2 – Raspodjela radnika u radnji prema radnom stažu


Staž zaposlenih, godine

Broj radnika

Sredina intervala

0 – 5
5 – 10
10 – 15
15 – 20
20 – 25
25 – 30

12
16
23
28
17
14

2,5
7,5
12,7
17,5
22,5
27,5

15
-10
-5
0
5
10

3
-2
-1
0
1
2

36
-32
-23
0
17
28

Pronalaženje trenutka prve narudžbe . Zatim, znajući da je A = 17,5 i B = 5, izračunavamo prosječan radni staž radnika u radionici:
godine

Harmonična sredina
Kao što je gore prikazano, aritmetička sredina se koristi za izračunavanje prosječne vrijednosti karakteristike u slučajevima kada su poznate njene varijante x i njihove frekvencije f.
Ako statistička informacija ne sadrži frekvencije f za pojedinačne opcije x populacije, već je prikazana kao njihov proizvod, primjenjuje se formula ponderisana harmonijska sredina. Za izračunavanje prosjeka, označimo gdje . Zamjenom ovih izraza u formulu za aritmetički ponderirani prosjek, dobijamo formulu za harmonijski ponderisani prosjek:
,
gdje je volumen (težina) vrijednosti atributa indikatora u intervalu označenom brojem i (i=1,2, …, k).

Dakle, harmonijska sredina se koristi u slučajevima kada nisu same opcije podložne sumiranju, već njihove recipročne vrijednosti: .
U slučajevima kada je težina svake opcije jednako jedan, tj. pojedinačne vrijednosti inverzne karakteristike se javljaju jednom, primjenjuju se znači harmonično jednostavno:
,
gdje su pojedinačne varijante inverzne karakteristike, koje se javljaju jednom;
N – opcija broja.
Ako postoje harmonični prosjeki za dva dijela populacije, onda se ukupni prosjek za cijelu populaciju izračunava pomoću formule:

i zove se ponderisana harmonijska sredina grupnih sredina.

Primjer. Tokom trgovanja na berzi, u prvom satu rada zaključene su tri transakcije. Podaci o iznosu prodaje grivne i tečaju grivne prema američkom dolaru dati su u tabeli. 3 (kolone 2 i 3). Odredite prosječni tečaj grivne u odnosu na američki dolar za prvi sat trgovanja.
Tabela 3 – Podaci o toku trgovanja na devizama

Prosječni kurs dolara određen je omjerom količine prodane grivne tokom svih transakcija i iznosa dolara stečenih kao rezultat istih transakcija. Konačni iznos prodaje grivne poznat je iz kolone 2 tabele, a broj dolara kupljenih u svakoj transakciji određuje se dijeljenjem iznosa prodaje grivne s njenim tečajem (kolona 4). Ukupno je kupljeno 22 miliona dolara tokom tri transakcije. To znači da je prosječni tečaj grivna za jedan dolar bio
.
Rezultirajuća vrijednost je stvarna, jer zamjena stvarnim tečajem grivne u transakcijama neće promijeniti konačni iznos prodaje grivne, koji služi kao indikator definicije: miliona UAH
Ako bi se za izračunavanje koristila aritmetička sredina, tj. grivna, zatim po kursu za kupovinu od 22 miliona dolara. bilo bi potrebno potrošiti 110,66 miliona UAH, što nije tačno.

Geometrijska sredina
Geometrijska sredina se koristi za analizu dinamike pojava i omogućava nam da odredimo prosječni koeficijent rast. Prilikom izračunavanja geometrijske sredine, pojedinačne vrijednosti karakteristike su relativni indikatori dinamika konstruisana u obliku lančanih veličina, kao omjer svakog nivoa prema prethodnom.
Jednostavna geometrijska sredina izračunava se pomoću formule:
,
gdje je znak proizvoda,
N – broj prosječnih vrijednosti.
Primjer. Broj registrovanih krivičnih djela za 4 godine povećan je za 1,57 puta, i to za 1. – 1,08 puta, za 2. – 1,1 puta, za 3. – 1,18 i za 4. – 1,12 puta. Tada je prosječna godišnja stopa rasta broja krivičnih djela: , tj. broj registrovanih krivičnih djela rastao je godišnje u prosjeku za 12%.

1,8
-0,8
0,2
1,0
1,4

1
3
4
1
1

3,24
0,64
0,04
1
1,96

3,24
1,92
0,16
1
1,96

Da bismo izračunali ponderisani srednji kvadrat, određujemo i unosimo u tabelu i . Tada je prosječno odstupanje dužine proizvoda od date norme jednako:

Aritmetički prosjek bi u ovom slučaju bio neprikladan, jer kao rezultat dobili bismo nultu devijaciju.
Korištenje srednjeg kvadrata će se dalje raspravljati u smislu varijacije.

Aritmetička sredina je statistički indikator koji pokazuje prosječnu vrijednost datog niza podataka. Ovaj indikator se izračunava kao razlomak, čiji je brojnik zbir svih vrijednosti u nizu, a nazivnik je njihov broj. Aritmetička sredina je važan koeficijent koji se koristi u svakodnevnim proračunima.

Značenje koeficijenta

Aritmetička sredina je elementarni indikator za poređenje podataka i izračunavanje prihvatljive vrijednosti. Na primjer, različite trgovine prodaju limenku piva određenog proizvođača. Ali u jednoj prodavnici košta 67 rubalja, u drugoj - 70 rubalja, u trećoj - 65 rubalja, au poslednjoj - 62 rubalja. Raspon cijena je prilično širok, pa će kupca zanimati prosječna cijena limenke kako bi prilikom kupovine proizvoda mogao uporediti svoje troškove. Prosječna cijena limenke piva u gradu je:

Prosječna cijena = (67 + 70 + 65 + 62) / 4 = 66 rubalja.

Poznavajući prosječnu cijenu, lako je odrediti gdje je isplativo kupiti proizvod, a gdje ćete morati preplatiti.

Aritmetička sredina se stalno koristi u statističkim proračunima u slučajevima kada se analizira homogeni skup podataka. U gornjem primjeru, ovo je cijena limenke piva iste marke. Međutim, ne možemo uspoređivati ​​cijene piva različitih proizvođača ili cijene piva i limunade, jer će u tom slučaju širenje vrijednosti biti veće, prosječna cijena će biti zamagljena i nepouzdana, a sam smisao kalkulacije će biti izobličeno u karikaturu "prosječne temperature u bolnici". Za izračunavanje heterogenih skupova podataka koristi se ponderisana aritmetička sredina, kada svaka vrijednost dobije svoj težinski koeficijent.

Izračunavanje aritmetičke sredine

Formula za izračun je izuzetno jednostavna:

P = (a1 + a2 + … an) / n,

gdje je an vrijednost količine, n je ukupan broj vrijednosti.

Za šta se ovaj indikator može koristiti? Prva i očigledna upotreba je u statistici. Gotovo svaka statistička studija koristi aritmetičku sredinu. To može biti prosječna dob ulaska u brak u Rusiji, prosječna ocjena iz predmeta za učenika ili prosječna dnevna potrošnja namirnica. Kao što je gore spomenuto, bez uzimanja u obzir pondera, izračunavanje prosjeka može proizvesti čudne ili apsurdne vrijednosti.

Na primjer, predsjednik Ruska Federacija dao izjavu da je prema statistici prosječna plata Rusa 27.000 rubalja. Za većinu stanovnika Rusije ovaj nivo plata izgledao je apsurdno. Nije iznenađujuće ako se prilikom izračunavanja uzmu u obzir prihodi oligarha, šefova industrijskih preduzeća, velikih bankara s jedne strane i plate učitelja, čistačica i prodavaca s druge strane. Čak i prosječne plate u jednoj specijalnosti, na primjer, računovođa, imat će ozbiljne razlike u Moskvi, Kostromi i Jekaterinburgu.

Kako izračunati prosjek za heterogene podatke

U situacijama platnog spiska, važno je uzeti u obzir težinu svake vrijednosti. To znači da bi plate oligarha i bankara dobijale ponder od, na primjer, 0,00001, a plate prodavača - 0,12. Ovo su brojke iz vedra neba, ali one otprilike ilustruju rasprostranjenost oligarha i prodavača u ruskom društvu.

Dakle, za izračunavanje prosjeka prosjeka ili prosječnih vrijednosti u heterogenom skupu podataka, potrebno je koristiti aritmetički ponderisani prosjek. U suprotnom ćete dobiti prosječnu platu u Rusiji od 27.000 rubalja. Ako želite da znate svoje prosječna ocjena iz matematike ili prosječnog broja golova koje je postigao odabrani hokejaš, onda će vam odgovarati kalkulator aritmetičkog prosjeka.

Naš program je jednostavan i praktičan kalkulator za izračunavanje aritmetičkog prosjeka. Da biste izvršili proračune, potrebno je samo unijeti vrijednosti parametara.

Pogledajmo nekoliko primjera

Izračun prosječne ocjene

Mnogi nastavnici koriste metod aritmetičkog prosjeka za određivanje godišnje ocjene za predmet. Zamislimo da je dijete iz matematike dobilo sljedeće četvrtine: 3, 3, 5, 4. Koju godišnju ocjenu će mu dati nastavnik? Koristimo kalkulator i izračunajmo aritmetičku sredinu. Za početak odaberite odgovarajući broj polja i unesite vrijednosti ocjene u ćelije koje se pojavljuju:

(3 + 3 + 5 + 4) / 4 = 3,75

Nastavnik će zaokružiti vrijednost u korist učenika, a učenik će dobiti solidnu B za godinu.

Obračun pojedenih bombona

Ilustrujmo neke od apsurdnosti aritmetičkog prosjeka. Zamislimo da su Maša i Vova imali 10 bombona. Maša je pojela 8 bombona, a Vova samo 2. Koliko je slatkiša u proseku pojelo svako dete? Koristeći kalkulator, lako je izračunati da su djeca u prosjeku pojela 5 bombona, što je potpuno u suprotnosti sa realnošću i zdravim razumom. Ovaj primjer pokazuje da je aritmetička sredina važna za smislene skupove podataka.

Zaključak

Izračunavanje aritmetičke sredine se široko koristi u mnogim naučnim oblastima. Ovaj indikator je popularan ne samo u statističkim proračunima, već iu fizici, mehanici, ekonomiji, medicini ili finansijama. Koristite naše kalkulatore kao pomoćnika za rješavanje zadataka koji uključuju izračunavanje aritmetičke sredine.

Prosječne vrijednosti se široko koriste u statistici. Prosječne vrijednosti karakteriziraju kvalitativne pokazatelje komercijalne djelatnosti: troškove distribucije, profit, profitabilnost itd.

Prosjek - Ovo je jedna od uobičajenih tehnika generalizacije. Pravilno razumijevanje suštine prosjeka određuje njegov poseban značaj u tržišnoj ekonomiji, kada nam prosjek, kroz individualni i slučajni, omogućava da identifikujemo opšte i neophodno, da identifikujemo trend obrazaca ekonomskog razvoja.

prosječna vrijednost - ovo su opšti pokazatelji u kojima se izražavaju akcije opšti uslovi, obrasci fenomena koji se proučava.

Statistički prosjeci se izračunavaju na osnovu masovnih podataka iz pravilno statistički organizovanog posmatranja mase (kontinuirano i selektivno). Međutim, statistički prosjek će biti objektivan i tipičan ako se izračuna iz masovnih podataka za kvalitativno homogenu populaciju (masovne pojave). Na primjer, ako izračunate prosječnu platu u zadrugama i državnim preduzećima, a rezultat proširite na cjelokupno stanovništvo, onda je prosjek fiktivan, jer se računa za heterogenu populaciju i takav prosjek gubi svaki smisao.

Uz pomoć prosjeka izglađuju se razlike u vrijednosti neke karakteristike koje iz ovog ili onog razloga nastaju u pojedinim jedinicama posmatranja.

Na primjer, prosječna produktivnost prodavača zavisi od više razloga: kvalifikacije, dužina radnog staža, godine, oblik usluge, zdravlje itd.

Prosječan učinak odražava opću imovinu cjelokupne populacije.

Prosječna vrijednost je odraz vrijednosti karakteristike koja se proučava, stoga se mjeri u istoj dimenziji kao i ova karakteristika.

Svaka prosječna vrijednost karakterizira populaciju koja se proučava prema bilo kojoj osobini. Da bi se postiglo potpuno i sveobuhvatno razumijevanje populacije koja se proučava prema nizu bitnih karakteristika, općenito je potrebno imati sistem prosječnih vrijednosti koji može opisati fenomen iz različitih uglova.

Postoje različiti proseci:

    aritmetička sredina;

    geometrijska sredina;

    harmonijska sredina;

    srednji kvadrat;

    prosečan hronološki.

Pogledajmo neke vrste prosjeka koji se najčešće koriste u statistici.

Aritmetička sredina

Prosta aritmetička sredina (neponderisana) jednaka je zbroju pojedinačnih vrijednosti atributa podijeljenom sa brojem ovih vrijednosti.

Pojedinačne vrijednosti karakteristike nazivaju se varijantama i označavaju se sa x(); broj jedinica stanovništva je označen sa n, prosečna vrednost karakteristike je označena sa . Stoga je aritmetička prosta sredina jednaka:

Prema podacima serije diskretnih distribucija, jasno je da se iste karakteristične vrijednosti (varijante) ponavljaju više puta. Dakle, opcija x se pojavljuje ukupno 2 puta, a opcija x 16 puta, itd.

Broj identičnih vrijednosti karakteristike u seriji distribucije naziva se frekvencija ili težina i označava se simbolom n.

Izračunajmo prosječnu platu jednog radnika u rub.:

Fond zarada za svaku grupu radnika jednak je proizvodu opcija i učestalosti, a zbir ovih proizvoda daje ukupan platni fond svih radnika.

U skladu s tim, proračuni se mogu predstaviti u opštem obliku:

Rezultirajuća formula naziva se ponderirana aritmetička sredina.

Kao rezultat obrade, statistički materijal se može prikazati ne samo u obliku diskretnih distribucijskih serija, već iu obliku intervalnih varijacionih serija sa zatvorenim ili otvorenim intervalima.

Prosjek za grupisane podatke izračunava se korištenjem formule ponderiranog aritmetičkog prosjeka:

U praksi ekonomske statistike ponekad je potrebno izračunati prosjek korištenjem grupnih prosjeka ili prosjeka pojedinih dijelova populacije (parcijalni prosjek). U takvim slučajevima, grupni ili privatni prosjeci se uzimaju kao opcije (x), na osnovu kojih se ukupni prosjek izračunava kao obični ponderirani aritmetički prosjek.

Osnovna svojstva aritmetičke sredine .

Aritmetička sredina ima niz svojstava:

1. Vrijednost aritmetičke sredine neće se promijeniti smanjenjem ili povećanjem frekvencije svake vrijednosti karakteristike x za n puta.

Ako se sve frekvencije podijele ili pomnože sa bilo kojim brojem, prosječna vrijednost se neće promijeniti.

2. Zajednički množitelj pojedinačnih vrijednosti karakteristike može se uzeti izvan predznaka prosjeka:

3. Prosek zbira (razlike) dve ili više veličina jednak je zbiru (razlici) njihovih proseka:

4. Ako je x = c, gdje je c konstantna vrijednost, onda
.

5. Zbir odstupanja vrijednosti atributa X od aritmetičke sredine x jednak je nuli:

Harmonična sredina.

Uz aritmetičku sredinu, statistika koristi harmonijsku sredinu, inverznu aritmetičku sredinu inverznih vrijednosti atributa. Kao i aritmetička sredina, može biti jednostavna i ponderirana.

Karakteristike varijacionih serija, zajedno sa prosecima, su mod i medijan.

Moda - to je vrijednost karakteristike (varijante) koja se najčešće ponavlja u populaciji koja se proučava. Za diskretne distributivne serije, mod će biti vrijednost varijante s najvećom frekvencijom.

Za nizove intervalne distribucije sa jednakim intervalima, mod se određuje formulom:

Gdje
- početna vrijednost intervala koji sadrži mod;

- vrijednost modalnog intervala;

- frekvencija modalnog intervala;

- učestalost intervala koji prethodi modalnom;

- učestalost intervala koji slijedi nakon modalnog.

Medijan - ovo je opcija koja se nalazi u sredini serije varijacija. Ako je serija distribucije diskretna i ima neparan brojčlanova, tada će medijan biti opcija koja se nalazi u sredini uređenog niza (uređeni niz je raspored jedinica stanovništva u rastućem ili opadajućem redoslijedu).

U većini slučajeva podaci su koncentrisani oko neke centralne tačke. Dakle, da bi se opisali bilo koji skup podataka, dovoljno je navesti prosječnu vrijednost. Razmotrimo sekvencijalno tri numeričke karakteristike koje se koriste za procjenu prosječne vrijednosti distribucije: aritmetičku sredinu, medijan i mod.

Prosjek

Aritmetička sredina (koja se često naziva jednostavno sredinom) je najčešća procjena srednje vrijednosti distribucije. To je rezultat dijeljenja zbroja svih promatranih numeričkih vrijednosti njihovim brojem. Za uzorak koji se sastoji od brojeva X 1, X 2, …, Xn, srednja vrijednost uzorka (označena sa ) jednako = (X 1 + X 2 + … + Xn) / n, ili

gdje je srednja vrijednost uzorka, n- veličina uzorka, Xii-ti element uzorci.

Preuzmite bilješku u formatu ili, primjere u formatu

Razmislite o izračunavanju aritmetičkog prosjeka petogodišnjih prosječnih godišnjih prinosa 15 vrlo rizičnih investicijskih fondova (Slika 1).

Rice. 1. Prosječni godišnji prinosi 15 vrlo rizičnih investicijskih fondova

Srednja vrijednost uzorka se izračunava na sljedeći način:

Ovo je dobar prinos, posebno u poređenju sa prinosom od 3-4% koji su štediše banke ili kreditne unije primili u istom vremenskom periodu. Ako sortiramo prinose, lako je uočiti da osam fondova ima prinose iznad prosjeka, a sedam - ispod prosjeka. Aritmetička sredina deluje kao tačka ravnoteže, tako da fondovi sa niskim prinosima balansiraju sredstva sa visokim prinosima. Svi elementi uzorka su uključeni u izračunavanje prosjeka. Nijedna od drugih procjena srednje vrijednosti raspodjele nema ovo svojstvo.

Kada treba izračunati aritmetičku sredinu? Pošto aritmetička sredina zavisi od svih elemenata u uzorku, prisustvo ekstremnih vrednosti značajno utiče na rezultat. U takvim situacijama, aritmetička sredina može iskriviti značenje numeričkih podataka. Stoga, kada se opisuje skup podataka koji sadrži ekstremne vrijednosti, potrebno je navesti medijan ili aritmetičku sredinu i medijan. Na primjer, ako iz uzorka uklonimo prinose fonda RS Emerging Growth, prosjek uzorka od 14 fondova se smanjuje za skoro 1% na 5,19%.

Medijan

Medijan predstavlja srednju vrijednost uređenog niza brojeva. Ako niz ne sadrži ponavljajuće brojeve, tada će polovina njegovih elemenata biti manja od, a polovina veća od medijane. Ako uzorak sadrži ekstremne vrijednosti, bolje je koristiti medijanu umjesto aritmetičke sredine za procjenu srednje vrijednosti. Da bi se izračunao medijan uzorka, prvo se mora naručiti.

Ova formula je dvosmislena. Njegov rezultat ovisi o tome da li je broj paran ili neparan n:

  • Ako uzorak sadrži neparan broj elemenata, medijan je (n+1)/2-th element.
  • Ako uzorak sadrži paran broj elemenata, medijan leži između dva srednja elementa uzorka i jednak je aritmetičkoj sredini izračunatoj za ova dva elementa.

Da biste izračunali medijan uzorka koji sadrži prinose 15 vrlo rizičnih investicijskih fondova, prvo morate sortirati neobrađene podatke (Slika 2). Tada će medijan biti suprotan broju srednjeg elementa uzorka; u našem primjeru br. 8. Excel ima posebnu funkciju =MEDIAN() koja radi i sa neuređenim nizovima.

Rice. 2. Medijan 15 fondova

Dakle, medijan je 6,5. To znači da prinos na jednu polovinu veoma rizičnih fondova ne prelazi 6,5, a na drugu polovinu je veći. Imajte na umu da medijan od 6,5 nije mnogo veći od srednje vrijednosti 6,08.

Ako iz uzorka izuzmemo prinos fonda RS Emerging Growth, onda se medijan preostalih 14 fondova smanjuje na 6,2%, odnosno ne toliko značajno kao aritmetička sredina (Slika 3).

Rice. 3. Medijan 14 fondova

Moda

Termin je prvi skovao Pearson 1894. Moda je broj koji se najčešće pojavljuje u uzorku (najmoderniji). Moda dobro opisuje, na primjer, tipičnu reakciju vozača na signal semafora da se zaustavi. Klasičan primjer korištenja mode je izbor veličine cipela ili boje tapeta. Ako distribucija ima nekoliko načina, onda se kaže da je multimodalna ili multimodalna (ima dva ili više „vrhova“). Multimodalnost distribucije pruža važne informacije o prirodi varijable koja se proučava. Na primjer, u sociološkim istraživanjima, ako varijabla predstavlja sklonost ili stav prema nečemu, tada multimodalnost može značiti da postoji nekoliko različitih različita mišljenja. Multimodalnost takođe služi kao indikator da uzorak nije homogen i da zapažanja mogu biti generisana dvema ili više „preklapajućih“ distribucija. Za razliku od aritmetičke sredine, outliers ne utiču na mod. Za kontinuirano distribuirane slučajne varijable, kao što je prosječni godišnji prinos investicijskih fondova, modus ponekad uopće ne postoji (ili nema smisla). Budući da ovi indikatori mogu poprimiti vrlo različite vrijednosti, ponavljajuće vrijednosti su izuzetno rijetke.

Kvartili

Kvartili su metrika koja se najčešće koristi za procjenu distribucije podataka kada se opisuju svojstva velikih numeričkih uzoraka. Dok medijan dijeli uređeni niz na pola (50% elemenata niza je manje od medijane, a 50% veće), kvartili dijele uređeni skup podataka na četiri dijela. Vrijednosti Q 1 , medijana i Q 3 su 25., 50. i 75. percentil, redom. Prvi kvartil Q 1 je broj koji dijeli uzorak na dva dijela: 25% elemenata je manje od, a 75% veće od prvog kvartila.

Treći kvartil Q 3 je broj koji također dijeli uzorak na dva dijela: 75% elemenata je manje od, a 25% veće od trećeg kvartila.

Da biste izračunali kvartile u verzijama Excel-a prije 2007. godine, koristite funkciju =QUARTILE(niz,dio). Počevši od Excel 2010, koriste se dvije funkcije:

  • =QUARTILE.ON(niz,dio)
  • =QUARTILE.EXC(niz,dio)

Ove dvije funkcije daju malo različita značenja(Sl. 4). Na primjer, kada se izračunavaju kvartili uzorka koji sadrži prosječne godišnje prinose 15 vrlo rizičnih investicijskih fondova, Q 1 = 1,8 ili –0,7 za QUARTILE.IN i QUARTILE.EX, respektivno. Usput, funkcija QUARTILE korištena ranije odgovara moderna funkcija QUARTILE.INCL. Za izračunavanje kvartila u Excelu koristeći gornje formule, niz podataka ne mora biti uređen.

Rice. 4. Izračunavanje kvartila u Excelu

Da još jednom naglasimo. Excel može izračunati kvartile za univarijantu diskretne serije, koji sadrži vrijednosti slučajne varijable. Izračun kvartila za distribuciju zasnovanu na frekvenciji dat je u nastavku u odjeljku.

Geometrijska sredina

Za razliku od aritmetičke sredine, geometrijska sredina vam omogućava da procenite stepen promene varijable tokom vremena. Geometrijska sredina je korijen n stepena iz rada n količine (u Excelu se koristi funkcija =SRGEOM):

G= (X 1 * X 2 * … * X n) 1/n

Sličan parametar je prosječan geometrijsko značenje stopa prinosa određena je formulom:

G = [(1 + R 1) * (1 + R 2) * … * (1 + R n)] 1/n – 1,

Gdje R i– profitna stopa za i th vremenski period.

Na primjer, pretpostavimo da je početna investicija 100 000 USD. Do kraja prve godine padne na 50 000 USD, a do kraja druge godine se oporavlja na početni nivo od 100 000 USD. Stopa povrata ove investicije u dvije -godišnji period je 0, pošto su početni i konačni iznosi sredstava međusobno jednaki. Međutim, aritmetički prosjek godišnjih stopa prinosa je = (–0,5 + 1) / 2 = 0,25 ili 25%, budući da je stopa prinosa u prvoj godini R 1 = (50.000 – 100.000) / 100.000 = –0.5 , a u drugom R 2 = (100.000 – 50.000) / 50.000 = 1. Istovremeno, geometrijska srednja vrijednost profitne stope za dvije godine jednaka je: G = [(1–0,5) * (1+ 1 )] 1/2 – 1 = ½ – 1 = 1 – 1 = 0. Dakle, geometrijska sredina preciznije odražava promjenu (tačnije, izostanak promjena) u obimu ulaganja u periodu od dvije godine od aritmetička sredina.

Zanimljivosti. Prvo, geometrijska sredina će uvijek biti manja od aritmetičke sredine istih brojeva. Osim u slučaju kada su svi uzeti brojevi međusobno jednaki. Drugo, nakon razmatranja imovine pravougaonog trougla, može se razumjeti zašto se sredina naziva geometrijska. Visina pravokutnog trokuta, spuštenog na hipotenuzu, je prosječna proporcionalna između projekcija kateta na hipotenuzu, a svaka kateta je prosječna proporcionalna između hipotenuze i njene projekcije na hipotenuzu (slika 5). Ovo daje geometrijski način da se konstruiše geometrijska sredina dva (dužina) segmenta: potrebno je da konstruišete kružnicu na zbiru ova dva segmenta kao prečnik, zatim visinu koja se vraća od tačke njihove veze do preseka sa kružnicom će dati željenu vrijednost:

Rice. 5. Geometrijska priroda geometrijske sredine (slika sa Wikipedije)

Sekunda važna imovina brojčani podaci - njihovi varijacija, karakterišući stepen disperzije podataka. Dva različita uzorka mogu se razlikovati i po srednjim vrijednostima i po varijacijama. Međutim, kao što je prikazano na sl. 6 i 7, dva uzorka mogu imati iste varijacije, ali različita sredina, ili ista sredina i potpuno različite varijacije. Podaci koji odgovaraju poligonu B na Sl. 7, mijenjaju se mnogo manje od podataka na kojima je konstruiran poligon A.

Rice. 6. Dvije simetrične distribucije u obliku zvona sa istim širenjem i različitim srednjim vrijednostima

Rice. 7. Dvije simetrične distribucije u obliku zvona sa istim srednjim vrijednostima i različitim širinama

Postoji pet procjena varijacije podataka:

  • obim,
  • interkvartilni raspon,
  • disperzija,
  • standardna devijacija,
  • koeficijent varijacije.

Obim

Raspon je razlika između najvećeg i najmanjeg elementa uzorka:

Raspon = XMaks – XMin

Opseg uzorka koji sadrži prosječne godišnje prinose 15 vrlo rizičnih investicijskih fondova može se izračunati korištenjem uređenog niza (vidi sliku 4): Raspon = 18,5 – (–6,1) = 24,6. To znači da je razlika između najvećeg i najnižeg prosječnog godišnjeg prinosa veoma rizičnih fondova 24,6%.

Raspon mjeri ukupnu rasprostranjenost podataka. Iako je raspon uzorka vrlo jednostavna procjena ukupnog širenja podataka, njegova slabost je u tome što ne uzima u obzir kako su podaci raspoređeni između minimalnih i maksimalnih elemenata. Ovaj efekat je jasno vidljiv na sl. 8, koja ilustruje uzorke koji imaju isti opseg. Skala B pokazuje da ako uzorak sadrži barem jednu ekstremnu vrijednost, raspon uzorka je vrlo neprecizna procjena širenja podataka.

Rice. 8. Poređenje tri uzorka istog raspona; trokut simbolizira oslonac skale, a njegova lokacija odgovara srednjoj vrijednosti uzorka

Interkvartilni raspon

Interkvartil, ili prosjek, raspon je razlika između trećeg i prvog kvartila uzorka:

Interkvartilni raspon = Q 3 – Q 1

Ova vrijednost nam omogućava da procijenimo rasipanje 50% elemenata i ne uzimamo u obzir uticaj ekstremnih elemenata. Interkvartilni raspon uzorka koji sadrži prosječne godišnje prinose 15 vrlo rizičnih investicijskih fondova može se izračunati korištenjem podataka na Sl. 4 (na primjer, za funkciju QUARTILE.EXC): Interkvartilni raspon = 9,8 – (–0,7) = 10,5. Interval omeđen brojevima 9,8 i -0,7 često se naziva srednjom polovinom.

Treba napomenuti da vrijednosti Q 1 i Q 3 , a samim tim i interkvartilni raspon, ne zavise od prisutnosti outliera, jer njihov proračun ne uzima u obzir nijednu vrijednost koja bi bila manja od Q 1 ili veća nego Q 3 . Zbirne mjere kao što su medijan, prvi i treći kvartil i interkvartilni raspon na koje ne utječu outliers nazivaju se robusne mjere.

Iako raspon i interkvartilni raspon daju procjene ukupnog i prosječnog širenja uzorka, nijedna od ovih procjena ne uzima u obzir tačno kako se podaci distribuiraju. Varijanca i standardna devijacija su lišene ovog nedostatka. Ovi indikatori vam omogućavaju da procijenite stepen do kojeg podaci fluktuiraju oko prosječne vrijednosti. Varijanca uzorka je aproksimacija aritmetičke sredine izračunate iz kvadrata razlika između svakog elementa uzorka i srednje vrijednosti uzorka. Za uzorak X 1, X 2, ... X n, varijansa uzorka (označena simbolom S 2 data je sljedećom formulom:

Općenito, varijansa uzorka je zbir kvadrata razlika između elemenata uzorka i srednje vrijednosti uzorka, podijeljen s vrijednošću jednakom veličini uzorka minus jedan:

Gdje - aritmetička sredina, n- veličina uzorka, X i - i th selekcijski element X. U Excelu prije verzije 2007, funkcija =VARIN() se koristila za izračunavanje varijanse uzorka; od verzije 2010. koristi se funkcija =VARIAN().

Najpraktičnija i najprihvaćenija procjena širenja podataka je uzorak standardne devijacije. Ovaj indikator je označen simbolom S i jednak je kvadratni korijen iz varijance uzorka:

U Excelu prije verzije 2007, funkcija =STDEV.() se koristila za izračunavanje standardne devijacije uzorka, od verzije 2010. koristi se funkcija =STDEV.V(). Za izračunavanje ovih funkcija, niz podataka može biti neuređen.

Ni varijansa uzorka ni standardna devijacija uzorka ne mogu biti negativni. Jedina situacija u kojoj indikatori S 2 i S mogu biti nula je ako su svi elementi uzorka međusobno jednaki. U ovom potpuno nevjerovatnom slučaju, raspon i interkvartilni raspon su također nula.

Numerički podaci su inherentno varijabilni. Svaka varijabla može uzeti mnogo različita značenja. Na primjer, različiti zajednički fondovi imaju različiti indikatori profitabilnost i gubitke. Zbog varijabilnosti numeričkih podataka, veoma je važno proučavati ne samo procjene srednje vrijednosti, koje su sumarne prirode, već i procjene varijanse koje karakteriziraju širenje podataka.

Disperzija i standardna devijacija vam omogućavaju da procijenite širenje podataka oko prosječne vrijednosti, drugim riječima, odredite koliko je elemenata uzorka manje od prosjeka, a koliko veće. Disperzija ima neka vrijedna matematička svojstva. Međutim, njegova vrijednost je kvadrat mjerne jedinice - kvadratni postotak, kvadratni dolar, kvadratni inč itd. Stoga je prirodna mjera disperzije standardna devijacija, koja se izražava u uobičajenim jedinicama procenta prihoda, dolarima ili inčima.

Standardna devijacija vam omogućava da procenite količinu varijacije elemenata uzorka oko prosečne vrednosti. U gotovo svim situacijama, većina promatranih vrijednosti leži u rasponu plus ili minus jedne standardne devijacije od srednje vrijednosti. Prema tome, poznavajući aritmetičku sredinu elemenata uzorka i standardnu ​​devijaciju uzorka, moguće je odrediti interval kojem pripada najveći dio podataka.

Standardna devijacija prinosa za 15 vrlo rizičnih investicijskih fondova je 6,6 (Slika 9). To znači da se profitabilnost najvećeg dijela sredstava razlikuje od prosječne vrijednosti za najviše 6,6% (tj. varira u rasponu od – S= 6,2 – 6,6 = –0,4 do +S= 12,8). U stvari, petogodišnji prosječni godišnji prinos od 53,3% (8 od 15) fondova leži u ovom rasponu.

Rice. 9. Standardna devijacija uzorka

Imajte na umu da kada se zbrajaju kvadratne razlike, stavke uzorka koje su dalje od srednje vrijednosti imaju veću težinu od stavki koje su bliže srednjoj vrijednosti. Ovo svojstvo je glavni razlog zašto se aritmetička sredina najčešće koristi za procjenu sredine distribucije.

Koeficijent varijacije

Za razliku od prethodnih procjena raspršenosti, koeficijent varijacije je relativna procjena. Uvijek se mjeri kao postotak, a ne u jedinicama originalnih podataka. Koeficijent varijacije, označen simbolima CV, mjeri disperziju podataka oko srednje vrijednosti. Koeficijent varijacije jednak je standardnoj devijaciji podijeljenoj sa aritmetičkom sredinom i pomnoženoj sa 100%:

Gdje S- standardna devijacija uzorka, - prosjek uzorka.

Koeficijent varijacije vam omogućava da uporedite dva uzorka čiji su elementi izraženi u različitim mjernim jedinicama. Na primjer, menadžer službe za dostavu pošte namjerava da obnovi svoj vozni park. Prilikom utovara paketa, potrebno je uzeti u obzir dva ograničenja: težinu (u funtama) i zapreminu (u kubnim stopama) svakog paketa. Pretpostavimo da je u uzorku koji sadrži 200 vreća srednja težina 26,0 funti, standardna devijacija težine 3,9 funti, srednja zapremina vreće je 8,8 kubnih stopa, a standardna devijacija zapremine je 2,2 kubna stopa. Kako uporediti varijacije u težini i zapremini pakovanja?

Pošto se jedinice mjere za težinu i zapreminu razlikuju jedna od druge, menadžer mora uporediti relativnu širinu ovih veličina. Koeficijent varijacije težine je CV W = 3,9 / 26,0 * 100% = 15%, a koeficijent varijacije zapremine je CV V = 2,2 / 8,8 * 100% = 25%. Dakle, relativna varijacija u zapremini paketa je mnogo veća od relativne varijacije u njihovoj težini.

Obrazac za distribuciju

Treće važno svojstvo uzorka je oblik njegove distribucije. Ova raspodjela može biti simetrična ili asimetrična. Da bismo opisali oblik distribucije, potrebno je izračunati njenu srednju vrijednost i medijan. Ako su te dvije iste, varijabla se smatra simetrično raspoređenom. Ako je srednja vrijednost varijable veća od medijane, njena distribucija ima pozitivnu asistenciju (slika 10). Ako je medijan veći od srednje vrijednosti, distribucija varijable je negativno iskrivljena. Pozitivna asimetrija se javlja kada se srednja vrijednost poveća do neuobičajene mjere visoke vrijednosti. Negativna iskrivljenost nastaje kada se srednja vrijednost smanji na neobično male vrijednosti. Varijabla je simetrično raspoređena ako ne uzima ekstremne vrijednosti ni u jednom smjeru, tako da se velike i male vrijednosti varijable međusobno poništavaju.

Rice. 10. Tri vrste distribucija

Podaci prikazani na skali A su negativno iskrivljeni. Na ovoj slici možete vidjeti dugačak rep i lijevu kosinu uzrokovanu prisustvom neobično malih vrijednosti. Ove izuzetno male vrijednosti pomiču prosječnu vrijednost ulijevo, čineći je manjom od medijane. Podaci prikazani na skali B raspoređeni su simetrično. Lijeva i desna polovina distribucije su same sebe zrcalne slike. Velike i male vrijednosti balansiraju jedna drugu, a srednja vrijednost i medijan su jednaki. Podaci prikazani na skali B su pozitivno iskrivljeni. Ova slika prikazuje dugačak rep i iskošenje udesno uzrokovano prisustvom neobično visokih vrijednosti. I ove su velike količine pomjeriti prosječnu vrijednost udesno i ona postaje veća od medijane.

U Excelu se deskriptivna statistika može dobiti pomoću dodatka Paket analiza. Prođite kroz meni PodaciAnaliza podataka, u prozoru koji se otvori odaberite liniju Deskriptivna statistika i kliknite Uredu. U prozoru Deskriptivna statistika obavezno naznačite Interval unosa(Sl. 11). Ako želite da vidite deskriptivnu statistiku na istom listu kao i originalni podaci, izaberite radio dugme Izlazni interval i odredite ćeliju u koju treba postaviti gornji lijevi ugao prikazane statistike (u našem primjeru, $C$1). Ako želite ispisati podatke na novi list ili na nova knjiga, samo odaberite odgovarajući prekidač. Označite polje pored Zbirna statistika. Po želji možete i birati Nivo težine,kth najmanji ikth najveći.

Ako je na depozit Podaci u oblasti Analiza ne vidite ikonu Analiza podataka, prvo morate instalirati dodatak Paket analiza(vidi, na primjer,).

Rice. 11. Deskriptivna statistika petogodišnjih prosječnih godišnjih prinosa sredstava sa vrlo visokim nivoom rizika, izračunata korištenjem dodatka Analiza podataka Excel programi

Excel izračunava brojne statistike o kojima je bilo riječi: srednja vrijednost, medijana, mod, standardna devijacija, varijansa, raspon ( interval), minimalna, maksimalna i veličina uzorka ( provjeriti). Excel takođe izračunava neke statistike koje su nam nove: standardnu ​​grešku, eksces i iskrivljenost. Standardna greška jednaka standardnoj devijaciji podijeljenoj s kvadratnim korijenom veličine uzorka. Asimetrija karakterizira odstupanje od simetrije distribucije i predstavlja funkciju koja ovisi o kocki razlike između elemenata uzorka i prosječne vrijednosti. Kurtosis je mjera relativne koncentracije podataka oko srednje vrijednosti u poređenju sa repovima distribucije i ovisi o razlikama između elemenata uzorka i srednje vrijednosti podignute na četvrtu potenciju.

Kalkulacija deskriptivna statistika Za stanovništva

Srednja vrijednost, širenje i oblik distribucije o kojoj smo gore raspravljali su karakteristike određene iz uzorka. Međutim, ako skup podataka sadrži numerička mjerenja cjelokupne populacije, njegovi parametri se mogu izračunati. Takvi parametri uključuju očekivanu vrijednost, disperziju i standardnu ​​devijaciju populacije.

Očekivana vrijednost jednak zbroju svih vrijednosti u populaciji podijeljen s veličinom populacije:

Gdje µ - očekivana vrijednost, Xi- i th posmatranje varijable X, N- obim opšte populacije. U Excelu, za izračunavanje matematičkog očekivanja, koristi se ista funkcija kao i za aritmetički prosjek: =AVERAGE().

Varijanca stanovništva jednak zbiru kvadrata razlika između elemenata opće populacije i mat. očekivanja podijeljena sa veličinom populacije:

Gdje σ 2– disperzija opšte populacije. U Excelu prije verzije 2007, funkcija =VARP() se koristi za izračunavanje varijanse populacije, počevši od verzije 2010 =VARP().

Standardna devijacija stanovništva jednak kvadratnom korijenu varijanse populacije:

U Excelu prije verzije 2007, funkcija =STDEV() se koristi za izračunavanje standardne devijacije populacije, počevši od verzije 2010 =STDEV.Y(). Imajte na umu da se formule za varijansu populacije i standardnu ​​devijaciju razlikuju od formula za izračunavanje varijanse uzorka i standardne devijacije. Prilikom izračunavanja uzorak statistike S 2 I S imenilac razlomka je n – 1, te prilikom izračunavanja parametara σ 2 I σ - obim opšte populacije N.

Pravilo

U većini situacija, veliki dio opažanja koncentrisan je oko medijane, formirajući klaster. U skupovima podataka s pozitivnom asimetrijom, ovaj klaster se nalazi lijevo (tj. ispod) matematičkog očekivanja, a u skupovima s negativnom asimetrijom, ovaj klaster se nalazi desno (tj. iznad) matematičkog očekivanja. Za simetrične podatke, srednja vrijednost i medijan su isti, a opažanja se grupišu oko srednje vrijednosti, formirajući distribuciju u obliku zvona. Ako distribucija nije jasno iskrivljena i podaci su koncentrirani oko centra gravitacije, pravilo koje se može koristiti za procjenu varijabilnosti je da ako podaci imaju distribuciju u obliku zvona, onda je otprilike 68% opservacija unutar jedna standardna devijacija očekivane vrijednosti.približno 95% opservacija nije udaljeno više od dvije standardne devijacije od matematičkog očekivanja, a 99,7% zapažanja nije više od tri standardne devijacije od matematičkog očekivanja.

Dakle, standardna devijacija, koja je procjena prosječne varijacije oko očekivane vrijednosti, pomaže da se razumije kako se opservacije distribuiraju i da se identifikuju odstupnici. Opće pravilo je da se za distribucije u obliku zvona samo jedna vrijednost od dvadeset razlikuje od matematičkog očekivanja za više od dvije standardne devijacije. Dakle, vrijednosti su izvan intervala µ ± 2σ, mogu se smatrati izvanrednim. Osim toga, samo tri od 1000 opservacija razlikuju se od matematičkog očekivanja za više od tri standardne devijacije. Dakle, vrijednosti su izvan intervala µ ± 3σ su skoro uvek van granica. Za distribucije koje su jako nakrivljene ili nisu u obliku zvona, može se primijeniti Bienamay-Chebyshev pravilo.

Prije više od stotinu godina, matematičari Bienamay i Chebyshev su nezavisno otkrili korisno svojstvo standardna devijacija. Otkrili su da je za bilo koji skup podataka, bez obzira na oblik distribucije, postotak opažanja koji se nalaze na udaljenosti od k standardne devijacije od matematičkih očekivanja, ne manje (1 – 1/ k 2)*100%.

Na primjer, ako k= 2, Bienname-Chebyshev pravilo kaže da najmanje (1 – (1/2) 2) x 100% = 75% opservacija mora ležati u intervalu µ ± 2σ. Ovo pravilo važi za sve k, preko jednog. Bienamay-Chebyshev pravilo je vrlo općenito i vrijedi za distribucije bilo kojeg tipa. Određuje minimalni broj opažanja, udaljenost od koje do matematičkog očekivanja ne prelazi određenu vrijednost. Međutim, ako je distribucija u obliku zvona, pravilo palca preciznije procjenjuje koncentraciju podataka oko očekivane vrijednosti.

Izračunavanje deskriptivne statistike za distribuciju zasnovanu na frekvenciji

Ako originalni podaci nisu dostupni, distribucija frekvencija postaje jedini izvor informacija. U takvim situacijama moguće je izračunati približne vrijednosti kvantitativnih pokazatelja distribucije, kao što su aritmetička sredina, standardna devijacija i kvartili.

Ako su podaci uzorka predstavljeni kao distribucija frekvencije, aproksimacija aritmetičke sredine može se izračunati uz pretpostavku da su sve vrijednosti unutar svake klase koncentrisane u midpoint klasa:

Gdje - prosjek uzorka, n- broj zapažanja ili veličina uzorka, With- broj časova u distribuciji frekvencija, m j- sredina j razred, fj- odgovarajuća frekvencija j-th class.

Za izračunavanje standardne devijacije od distribucije frekvencije, također se pretpostavlja da su sve vrijednosti unutar svake klase koncentrisane na srednjoj tački klase.

Da biste razumeli kako se kvartili serije određuju na osnovu učestalosti, razmotrite izračun donjeg kvartila na osnovu podataka za 2013. o raspodeli ruskog stanovništva prema prosečnom monetarnom dohotku po glavi stanovnika (slika 12).

Rice. 12. Udio ruskog stanovništva sa prosječnim novčanim prihodima po glavi stanovnika mjesečno, rublje

Da biste izračunali prvi kvartil niza intervalnih varijacija, možete koristiti formulu:

gdje je Q1 vrijednost prvog kvartila, xQ1 je donja granica intervala koji sadrži prvi kvartil (interval je određen akumuliranom frekvencijom koja prva prelazi 25%); i – vrijednost intervala; Σf – zbir frekvencija cijelog uzorka; vjerovatno uvijek jednako 100%; SQ1–1 – akumulirana frekvencija intervala koji prethodi intervalu koji sadrži donji kvartil; fQ1 – frekvencija intervala koji sadrži donji kvartil. Formula za treći kvartil se razlikuje po tome što na svim mjestima trebate koristiti Q3 umjesto Q1 i zamijeniti ¾ umjesto ¼.

U našem primeru (Sl. 12), donji kvartil je u opsegu 7000,1 – 10 000, čija je akumulirana frekvencija 26,4%. Donja granica ovog intervala je 7000 rubalja, vrednost intervala je 3000 rubalja, akumulirana učestalost intervala koji prethodi intervalu koji sadrži donji kvartil je 13,4%, učestalost intervala koji sadrži donji kvartil je 13,0%. Dakle: Q1 = 7000 + 3000 * (¼ * 100 – 13,4) / 13 = 9677 rub.

Zamke povezane s deskriptivnom statistikom

U ovom postu pogledali smo kako opisati skup podataka koristeći različite statistike koje procjenjuju njegovu srednju vrijednost, širenje i distribuciju. Sljedeći korak je analiza i interpretacija podataka. Do sada smo proučavali objektivna svojstva podataka, a sada prelazimo na njihovu subjektivnu interpretaciju. Istraživač se suočava s dvije greške: pogrešno odabranim predmetom analize i pogrešnom interpretacijom rezultata.

Analiza prinosa 15 vrlo rizičnih investicijskih fondova prilično je nepristrasna. Doveo je do potpuno objektivnih zaključaka: svi zajednički fondovi imaju različite prinose, raspon prinosa fonda kreće se od -6,1 do 18,5, a prosječan prinos je 6,08. Objektivnost analize podataka je osigurana pravi izbor ukupni kvantitativni pokazatelji distribucije. Razmotreno je nekoliko metoda za procjenu srednje vrijednosti i raspršenosti podataka, te su naznačene njihove prednosti i nedostaci. Kako odabrati pravu statistiku za pružanje objektivne i nepristrasne analize? Ako je distribucija podataka malo iskrivljena, treba li odabrati medijanu umjesto srednje vrijednosti? Koji indikator preciznije karakterizira širenje podataka: standardna devijacija ili raspon? Treba li istaći da je distribucija pozitivno iskrivljena?

S druge strane, interpretacija podataka je subjektivan proces. Različiti ljudi dolaze do različitih zaključaka kada tumače iste rezultate. Svako ima svoje gledište. Ukupne prosječne godišnje prinose 15 fondova sa vrlo visokim nivoom rizika neko smatra dobrim i prilično je zadovoljan primljenim prihodima. Drugi mogu smatrati da ova sredstva imaju preniske prinose. Dakle, subjektivnost treba nadoknaditi iskrenošću, neutralnošću i jasnoćom zaključaka.

Etička pitanja

Analiza podataka je neraskidivo povezana sa etičkim pitanjima. Trebali biste biti kritični prema informacijama koje šire novine, radio, televizija i internet. S vremenom ćete naučiti da budete skeptični ne samo prema rezultatima, već i prema ciljevima, predmetu i objektivnosti istraživanja. Čuveni britanski političar Benjamin Disraeli je to najbolje rekao: “Postoje tri vrste laži: laži, proklete laži i statistika”.

Kao što je navedeno u bilješci, etička pitanja se javljaju prilikom odabira rezultata koji bi trebali biti predstavljeni u izvještaju. Trebali biste objaviti i pozitivne i negativni rezultati. Osim toga, prilikom izrade izvještaja ili pisanog izvještaja rezultati moraju biti prikazani iskreno, neutralno i objektivno. Treba napraviti razliku između neuspješnih i nepoštenih prezentacija. Da biste to učinili, potrebno je utvrditi koje su bile namjere govornika. Ponekad govornik izostavi važne informacije iz neznanja, a ponekad je to namjerno (na primjer, ako koristi aritmetičku sredinu za procjenu prosjeka jasno iskrivljenih podataka kako bi dobio željeni rezultat). Takođe je nepošteno potiskivati ​​rezultate koji ne odgovaraju gledištu istraživača.

Korišteni su materijali iz knjige Levin i dr. Statistika za menadžere. – M.: Williams, 2004. – str. 178–209

Funkcija QUARTILE je ostavljena da se kombinuje sa više ranije verzije Excel