• Increase font size
  • Default font size
  • Decrease font size

EMPIRIJSKE RASPODELE

Jedan od zadataka statistike je da ukaže na postupke prikupljanja, sređivanja i prezentacije podataka. Problemima ovog tipa bavi se deskriptivna statistika. Statistička anliza se može završiti u domenu deskriptivne statistike ili se preći na probleme statističkog zaključivanja. Naprimer, ako se podaci o grupi studenata evidentiraju samo da bi se prikazao uspeh te grupe studenata, a ne da bi generalizovao uspeh cele generacije, onda je to domen deskriptivne statistike, a u protivnom je domen statističkog zaključivanja.

1.1 Statistički podaci

Podaci
su skup činjenica koji su dobijeni kao rezlutat posmatranja individualnih objekata. Oni su osnovna sirovina statistike i nijedan tip statističke analize nije moguć dok se podaci ne prikupe i ne organizuju na odgovrarajući način. Podaci nas okružuju i mogu se naći u svim sferama svakodnevnog života. Naprimer, 

  • u poslovanju svakog preduzeća dnevno se proizvede veliki broj papira koji su izvor podataka o cenama proizvoda, prodatim količinama robe, zahtevima za pojedinom robom,...; 

  • u školama se upisuju ocene, izostanci,...; 

  • u sportskim klubovima rezultati, lični podaci,...; 

  • u zdravstvenim kartonima su podaci o bolestima, lekovima...; 

  • u ekonomskim revijama se nalaze podaci o kamatnim stopama, kursnim listama, cenama na berzi,... itd.

Obeležje
je karakteristika (osobina) koja se analizira. Kada se vrednost obeležja izražava brojevima onda je ono kvantitativno ili numeričko. Kada vrednost obeležja nije numerička, već se opisuje nekim atributom, onda je ono kvalitativno. U statistici se i atributivna obeležja mogu izraziti numerički, preko kodova, rangova, procenata i sl. Ako su vrednosti numeričkog obeležja celi brojevi ono je prekidno, a ako su vrednosti iz skupa realnih brojeva ono je neprekidno. 

Primer:

U Tabeli 1.1 prikazani su podaci za 5 studenata, koji se mogu nalaziti u nekom kartonu u studentskoj službi.

Tabela 1.1

Student

Godina
rođenja

Pol

Visina
(cm)

Težina
(kg)

Boja kose

Broj članova porodice

Jelena

1975

z

175

65,5

plava

3

Petar

1974

m

191

85,7

smeđa

4

Mika

1973

m

187

87,0

smeđa

4

Pera

1974

m

195

90,5

crna

3

Gordana

1974

z

180

68,5

smeđa

5

Jedinice posmatranja su studenti Jelena, Petar, Mika, Pera i Gordana.

Obeležje može biti bilo koja karakteristika opisana u prvom redu tabe: godina rođenja, pol, visina, težina, boja kose i broj članova porodice. Godina rođenja, visina, težina i broj članova porodice su numerička - kvantitativna obeležja. Godina rođenja i broj članova porodice je prekidno obeležje, a visina i težina neprekidno. Boja kose i pol su kvalitativna - atributivna obeležja.

Jedno posmatranje obeležja visina može biti visina studenta Pere i iznosi 191.

1.2 Formiranje distribucije frekvencije

Karakteristika statističkih zaključivanja je da se na osnovu informacije dobijene posmatranjem uzorka (dela celine) donose zaključci o populaciji (celini). Osnova statističkih ispitivanja su empirijski podaci. To su numeričke vrednosti koje treba aranžirati tako da daju adekvatnu sliku o prirodi pojave i omoguće primenu statistčkih procedura.

NEUREĐENI STATISTIČKI PODACI
su
niz neuređenih numeričkih vrednosti dobijenih kao rezultat posmatranja svake jedinice u izabranom skupu.

Primer neuređenih statističkih podataka predstavlja broj prodatih TV aparata u toku 30 dana.

10

12

8

10

12

11

9

10

15

9

11

9

11

11

13

9

10

12

11

13

11

14

10

12

8

13

13

11

10

12

UREĐENA STATISTIČKA SERIJA
je niz numeričkih podataka sređenih po veličini od najmanje do najveće vrednosti.

Primer:

Urediti podatake o prodatim TV aparatima u rastućem poretku.

Rešenje:

Uređena statistička serija za podatke iz prethodnog primera je

8

8

9

9

9

9

10

10

10

10

10

10

11

11

11

11

11

11

11

12

12

12

12

12

13

13

13

13

14

15

Primer:

Da bi se odredila norma za izradu jednog proizvoda mereno je vreme izrade u minutima za 40 radnika, i dobijeni su sledeći podaci:

 

16,2

15,8

15,7

15,8

15,6

15,5

16,3

15,6

15,7

16,0

16,2

16,1

15,9

16,1

16,0

16,7

16,4

15,2

15,9

15,9

16,8

16,9

16,7

15,5

15,4

15,7

15,8

15,9

16,0

16,2

16,3

16,0

16,4

16,6

15,6

15,6

16,9

15,3

16,7

16,3

Srediti podatke u uređenu statističku seriju.

Rešenje:

Uređena statistička serija je:

15,2

15,6

15,7

15,9

16,0

16,2

16,3

16,7

15,3

15,6

15,7

15,9

16,0

16,2

16,4

16,7

15,4

15,6

15,8

15,9

16,0

16,2

16,4

16,8

15,5

15,6

15,8

15,9

16,1

16,3

16,6

16,9

15,5

15,7

15,8

16,0

16,1

16,3

16,7

16,9

Iz uređene statističke serije brzo se uočava najmanja i najveća vrednost obeležja, podaci se lako dele u grupe, lako se uočava da li se neka vrednost pojavljuje više od jedanput u nizu, lako se uočavaju razlike između uzastopnih podataka u seriji.

U primeru o prodatim TV aparatima:

  • najmanja vrednost je 9 a najveća 14

  • prvih 15 podataka je između 8 i 11, a poslednjih 15 podataka između 11 i 14, slično prva trećina podataka je manja od 8 do 10, druga traćina od 10 do 12 i treća trećina od 12 do 14

  • Šest vrednosti se javlja više od jedanput u nizu, a dve vrednosti samo jedanput

  • Razlika između uzastopnih podataka je 1

Uređena statistička serija, bez obzira na prednosti koje ima, nije zahvalna kada se prikazuju serije sa velikim brojem podataka. U tom slučaju podaci se moraju na neki način sažeti i prikazati tako da omogućuju interpretaciju i donošenje zaključaka.

KLASA
je grupa istih vrednosti obeležja. Ako su vrednost obeležja celi brojevi klase mogu biti izolovane tačke x1, x2, ... ,xk. Kada su vrednosti obeležja realni brojevi, pri dovoljno preciznim merenjima mali broj jedinica ima istu vrednost, pa se klase formiraju kao intervali x1-x2, x2-x3, ... , xk-1-xk, xk-xk+1. U tom slučaju donja i gornja granica svake klase moraju biti jasno i nedvosmisleno određeni. Obično se biraju intervali iste širine. Intervalne klase se mogu formirati i za cele vrednosti obeležja. 

Primer:

Odrediti broj klasa za podatake o broju prodatih TV aparata:

Rešenje:

U primeru sa TV aparatima različite vrednosti obeležja su: 8, 9, 10, 11, 12, 13, 14 i 15. Dakle, u uzorku od 30 jedinica ima 8 klasa.

Primer:

Za podatke o vremenu izrade proizvoda predložiti neke klase sa istom širinom intervala.

Rešenje:

Na osnovu minimalne i maksimalne vrednosti 40 jedinica iz uzorka neke moguće klase su:

  • Predlog 1: Za širinu klasnog intervala 0,3 klase su: 15,2-15,4; 15,5-15,7; 15,8-16,0; 16,1-16,3; 16,4-16,6; 16,7-16,9

  • Predlog 2: Za širinu klasnog intervala 0,4 klase su: 15,2-15,5; 15,6-15,9; 16,0-16,3; 16,4-16,7; 16,8-17,1

  • Predlog 3: Za širinu klasnog intervala 0,5 klase su: 15,2-15,6; 15,7-16,1; 16,2-16,6; 16,7-17,1

Zbog preciznog definisanja granica klasa donje granice prethodnog intervala se razlikuju od gornjih granica narednog intervala za 0,1.

GRANICE KLASE

Kada se odredi dužina intervala određuju se granice intervala. Granice moraju biti određene jasno i nedvosmisleno, tako da svaki podatak može pripasti samo jednoj klasi. U našim primerima uvek postoji razlika između gornje granice prethodnog i donje granice narednog intervala. Naprimer, ako bi intervali bili 15,2-15,7; 15,7-16,2; ... ne bi se znalo kom intervalu pripada vrednost 15,7, pa se zbog toga piše: 15,2-15,6; 15,7-15-8; ..., ili 15,2-15,69; 15,7-16,2; ..., ili 15,2 do 15,7; 15,7 do 16,2; ...

Klasni intervali mogu biti zatvoreni i otvoreni. Kod zatvorenih intervala poznata je vrednost donje i gornje granice, što nije slučaj za otvorene intervale. Naprimer, intervali tipa "5 i više", "veće od 15", "'manje od 12" su otvoreni.

Posle definisanja granica intervala prebrojava se broj vrednosti iz statističke serije koje pripadaju svakoj klasi.

KLASNA SREDINA
je vrednost sredine intervala. Pri izračunavanju klasne sredine zanemaruje se razlika između gornje granice prethodnog i donje granice narednog intervala. Sa klasnom sredinom u obračunima se zamenjuje ceo interval.

Primer:

Odrediti klasne sredine za intervale iz Predloga 1.

Rešenje:

U tabeli su prikazani intervali i sredine:

Tabela 1.2

Vreme izrade
x

Sredina
intervala
m

15,2-15,4

15,3

15,5-15,7

15,6

15,8-16,0

15,9

16,1-16,3

16,2

16,4-16,6

16,5

16,7-16,9

16,8

APSOLUTNA FREKVENCIJA
je broj podataka u koji pripadaju jednoj klasi. Apsultne frekvencije se označavaju sa fi, gde je i broj klase kojoj pripadaju. Zbir apsolutnih frekvencija klasa je jednak broju jedinica u statističkoj seriji i označva se sa n:

RELATIVNE FREKVENCIJE
su količnik apsolutne frekvencije i ukupnog broja jedinica u statističkoj seriji

Zbir relativnih frekvencija klasa je jednak 1. Množenjem relativnih frekvencija sa 100 one se izražavaju u procentima, pa je tada njihov zbir jednak 100.

DISTRIBUCIJA FREKVENCIJE
je raspodela frekvencija prema klasama i pokazuje koliko jedinica iz statističke serije pripada određenoj klasi.

Distribucija frekvencije može biti prikazana tabelarno ili grafički. U prvoj koloni tabele unose se klase obeležja i ova kolona se označava sa x, a u drugoj kolini se unose vrednosti frekvencija i ova kolona se označava sa f.

Primer:

Formirati distribuciju frekvencije na osnovu podataka o prodatim TV aparatima.

Rešenje:

Sve vrednosti mogu se grupisati u 8 klasa. Raspored frekvencija prema mogućime vrednostima obeležja je: 

Tabela 1.3

Broj prodatih
TV aparata
x

Broj dana
u mesecu
f

Relativne frekvencije
p=f/n

8

2

0,07

9

4

0,13

10

6

0,20

11

7

0,23

12

5

0,17

13

4

0,13

14

1

0,03

15

1

0,03

ukupno

30

1,00

    ,  

Primer:

Za predložene klase vremena izrade proizvoda formirati distribucije frekvencija i izračunati relativne frekvencije.

Rešenje:

Predlog 1:

Tabela 1.4

Vreme izrade
X

Broj radnika
f

Relativne rekvencije
p=f/n

15,2-15,4

3

0,075

15,5-15,7

9

0,225

15,8-16,0

11

0,275

16,1-16,3

8

0,200

16,4-16,6

5

0,125

16,7-16,9

4

0,100

ukupno

40

1,000

Predlog 2:

Tabela 1.5

Vreme izrade
X

Broj radnika
f

Relativne rekvencije
p=f/n

15,2-15,5

5

0,125

15,6-15,9

14

0,350

16,0-16,3

12

0,300

16,4-16,7

4

0,100

16,8-17,1

5

0,125

ukupno

40

1,000

Predlog 3:

Tabela 1.6

Vreme izrade
X

Broj radnika
f

Relativne rekvencije
p=f/n

15,2-15,6

9

0,225

15,7-16,1

16

0,400

16,2-16,6

9

0,225

16,7-17,1

6

0,150

ukupno

40

1,000

  ,  

GRAFIK DISTRIBUCIJE FREKVENCIJE
je način prikazaivanja podataka u dvodimenzionoj ravni. Na horizontalnoj, x-osi, nanose se vrednosti obeležja, a na vertikalnoj, y-osi, vrednosti frekvencija. Grafik se može crtati i za apsolutne i za relativne frekvencije. Sa grafika se lako uočava tendencija pojava, što nije uvek moguće iz tabele.

POLIGON
je grafički prikaz distribucije frekvencije pomoću tačaka koje se spajaju u izlomljenu liniju. Prva kordinata svake tačke odgovara vrednosti obeležja. U slučaju intervalnih klasa umesto intervala koristi se njegova sredina. Druga kordinata odgovara vrednosti frekvencija. 

Primer: 
Nacrati poligon apsolutnih i relativnih frekvencija za podatke o prodatim TV aparatima iz Tabele 1.3

Rešenje:

Slika 1.1. Poligon apsolutnih frekvencija

 

Slika 1.2 Poligon relativnih frekvencija

HISTOGRAM
je grafički prikaz distribucije frekvencije pomoću stubaca (pravougaonika) kod kojih je širina proporcinalna širini klasnog intervala, a visina broju jedinica koji pripadaju toj klasi. Histogram može biti dat za apsolutne i za relativne frekvencije.

Primer:

Nacrtati histrogam i poligon apsolutnih i relativnih frekvencija za podatke o vremenu izrade proizvoda iz Tabele 1.4

Rešenje:

Slika 1.3 Histogram apsolutnih frekvencija

 

Slika 1.4 Histogram relativnih frekvencija

KUMULATIVNE FREKVENCIJE
se izračunavaju sabiranjem, kumuliranjem, frekvencija od najmanje do najveće vrednosti obeležja.

Kumulativna frekvencija predstavlja broj jedinica koje su manje ili jednake od neke posmatrane vrednosti xi. Izračunavaju se sabiranjem frekvencije sa svim frekvencijama koje odgovaraju vrednostima obeležja koje su manje od xi. Kumulacija frekvencija može biti za apsolutne i za relativne frekvencije. Neka je fi frekvencija koja odgovara vrednosti obeležja xi i neka su vrednosti obeležja date u rastućem poretku, tada je broj jedinica koje imaju vrednost manju od xi jednak:

Primer:

Izračunati kumulativne frekvencije za podatke iz Tabele 1.3

Rešenje:

 Kumulativne frekvencije su:

Broj dana kada je prodato 8 i manje od 8:    K1=2
Broj dana kada je prodato 9 i manje od 9:    K2=2+4=6
Broj dana kada je prodato 10 i manje od 10: K3=2+4+6=12
Broj dana kada je prodato 11 i manje od 11: K4=2+4+6+7=19
Broj dana kada je prodato 12 i manje od 12: K4=2+4+6+7+5=24
Broj dana kada je prodato 13 i manje od 13: K4=2+4+6+7+5+4=28
Broj dana kada je prodato 14 i manje od 14: K4=2+4+6+7+5+4+1=29
Broj dana kada je prodato 15 i manje od 15: K4=2+4+6+7+5+4+1+1=30

 Tabela 1.7

Broj prodatih
TV aparata
X

Broj dana
u mesecu
f

Relativne 
frekvencije
p=f/n

Kumulativne
apsolutne 
frekvencije

Kumulativne
relativne
frekvencije

8

2

0,07

2

0,07

9

4

0,13

6

0,20

10

6

0,20

12

0,40

11

7

0,23

19

0,63

12

5

0,17

24

0,80

13

4

0,13

28

0,93

14

1

0,03

29

0,96

15

1

0,03

30

1,00

ukupno

30

1,00

   

Iz tabele kumulativnih frekvencija lako se vidi da je 19 dana prodato manje od 11 i 11 TV aparata, a da je više od 13 i 13 TV aparata prodato 6 dana u mesecu (30-24=6).

Grafik kumulativnih frekvencija

Na x-osi se nanose vrednosti obeležja a na y-osi kumulativne frekvencije koje pokazuju koliko jedinica ima vrednost manju ili jedaku x . To je neopadajuća izlomljena linija koja ima minimalnu vrednost f1 i maksimalnu n ako se odnosi na apsolutne frekvencije, a 0 i 1 ako se odnosi na relativne frekvencije.

Primer:

Nacrati grafik kumulativnih frekvencija za apsolutne i relativne frekvencije za podatke iz Tabele 1.7

Rešenje:

Slika 1.5 Grafik kumulativnih 
apsolutnih frekvencija

 

Slika 1.6 Grafik kumulativnih 
relativnih frekvencija


 

Pretraga

Kontakt

diplomski radovi broj telefona

MBPCMBPC

Baneri

Akcije, popusti, snizenja, brendovi.net
Muzzzika.net
StudentskiOglasi.net - Prvi i jedini portal namenjen samo studentskim oglasima!!!