Srednja vrijednost ili prosječna vrijednost je jedan od statističih pokazatelja centralne tendencije određenog skupa mjerenja. Postoji nekoliko njenih tipova u raznim granam matematike (a posebno statistike).
Za skup podataka, aritmetička sredina, koja se naziva i matematičko očekivanje ili prosjek, je centralna vrijednost diskretnog skupa brojeva: konkretno, zbir tih vrijednosti podeljen sa njihovim brojem. Aritmetička sredina skupa brojeva 1, 2, ... → n obično se označava kao , izgovara se " sa crtom”. Ako se skup podataka zasniva na nizu opažanja dobijenih uzimanjem uzorka iz statističke populacije, aritmetička sredina je srednja vrijednost uzorka (označena ), da bi se razlikovala od srednje vrijednosti ishodišne distribucije, populacijske srednje vrijednosti (označene sa ili ).[1]
U procjeni vjerovatnoće i statistici, populacijska sredina ili očekivana vrijednost mjerilo su centralne tendencije,bilo raspodjele vjerovatnoće ili slučajne promenljive koju karakterizira data distribucija.[2] U slučaju diskretne raspodjele vjerovatnoće slučajno promenljive , prosjek je jednak zbiru svih mogućih vrijednosti ponderiranih njihovom vjerovatnoćom, tj. izračunava se uzimajući proizvod svih mogućih vrijednosti iz i njegove vjerovatnoće (, a zatim sabiranjem svih tih proizvoda zajedno, što daje .[3][4] Analogna formula odnosi se na slučaj kontinuirane distribucije vejrovatnoće. Definiranu srednju vrijednost nema svaka distribucija vjerovatnoće. To je na primjer slučaj sa Cauchyijevavom distribucijom. Štaviše, za neke distribucije srednja vrijednost je beskonačna.
Za konačnu populaciju, populacijska srednja vrijednost svojstva jednaka je aritmetičkoj sredini datog svojstva, uzimajući u obzir svaki član populacije. Naprimjer, prosječna visina populacije jednaka je zbiru visina svakog pojedinca podeljeno sa ukupnim brojem jedinki. Srednja vrijednost uzorka može se razlikovati od prosjeka populacije, posebno za male uzorke. Zakon velikih brojeva uslovljava da što je veća veličina uzorka, veća je vjerovatnoća da će srednja vrijednost uzorka biti blizu populacjskie sredine.[5]
Izvan vjerovatnoće i statistike, u geometriji i matematičkoj analizi često se koristi širok spektar drugih pojmova "srednje vrijednosti", koji su dati ispod.
Aritmetička srednja vrijednost (ili jednostavno sredina) za uzorak , obično označena sa , je zbir vrijednosti uzorka podeljen brojem članova uzorka:
Naprimjer, aritmetička sredina pet vrijednosti: 4, 36, 45, 50, 75 je:
Geometrijska sredina je prosjek koji je koristan za skupove pozitivnih brojeva koji se tumače u skladu sa njihovim proizvodom, a ne njihovim zbirom (kao što je slučaj sa aritmetičkom sredinom); npr. stope rasta.
Naprimjer, geometrijska sredina pet vrijednosti: 4, 36, 45, 50, 75 je:
Harmonijska sredina je prosjek koji je koristan za skupove brojeva koji su definirani u odnosu na neku jedinicu, naprimjer brzinu (rastojanje po jedinici vremena).
Naprimjer, harmonijska sredina pet vrijednosti: 4, 36, 45, 50, 75 je:
AS, GS i HS zadovoljavaju ove nejednakosti:
Jednakost važi samo ako su svi elementi datog uzorka jednaki.
U deskriptivnoj statistici, srednja vrijednost može se pogrešno poistovijetiti sa medijanom, modusom ili sredinom opsega, jer se bilo koja od njih može nazvati "prosjekom" (formalnije, mjerom centralne tendencije). Srednja vrijednost skupa mjerenja je aritmetička sredina vrijednosti. Međutim, za zakrivljene distribucije, srednja vrijednost nije nužno ista kao centralna vrijednost (medijana) ili najvjerovatnija vrijednost (modus). Naprimjer, distribucijska kriva srednjeg dohotka, tipski je zakrivljena, naviše zbog malog broja ljudi sa veoma velikim primanjima, tako da većina ima prihod niži od prosjeka. Nasuprot tome, medijana prihoda je nivo na kojem je polovina stanovništva niže, a polovina iznad prosjeka. Modusni prihod je najvjerovatniji dohodak i pogoduje većem broju ljudi sa nižim primanjima. Dok su medijana i modus često intuitivnije mjere za takve zakrivljene podatke, mnoge zakrivljene distribucije se zapravo najbolje opisuju njihovom srednjom vrijednošću, uključujući eksponencijalnu i Poassonovu distribuciju.
Srednja vrijednost raspodjele vjerovatnoće je dugotrajna aritmetička sredina slučajne promenljive varijable, koja ima tu distribuciju. U tom slučaju, ona je također poznata i kao očekivana vrijednost. Za diskretnu distribuciju vjerovatnoće, srednja vrijednost je data izrazom , gdje se zbir uzima nad svim mogućim vrijednostima slučajno promjenjive varijable i je funkcija vjerovatnoće mase. Za kontinuiranu distribuciju, srednja vrijednost je , gdje je funkcija gustoće vjerovatnoće. U svim slučajevima, uključujući i one u kojima distribucija nije ni diskretna, niti kontinuirana, srednja vrijednost je Lebesgueov integral slučajno promjenjive varijable, u odnosu na njenu mjeru vjerovatnoće. Srednja vrijednost ne mora postojati ili biti konačna; za neke distribucije vjerovatnoće, srednja vrijednost je beskonačna (+∞ ili −∞), dok za ostale nema srednje vrijednosti.
Generalizovana srednja vrijednost, znana i kao stepenska srednja vrijednost ili Helderova sredina, je apstrakcija kvadratne, aritmetičke, geometrijske i harmonijke sredine. Definira se za skup od pozitivnih brojeva i, sa
Birajući različite vrijednosti za parameter , dobijaju se slijedeći tipovi srednje vrijednosti:
Maksimum -a | |
Kvadratna sredina | |
Aritmetička sredina | |
Geometrijska sredina | |
Harmonijska sredina | |
Minimum -a |
Ova vrijednost može se dalje uopćavati i kao generalizirana ƒ–srednja vrijednost
i ponovo odgovarajući izbor nepretvorljivog f daje:
= | Aritmetička sredina, |
Harmonijska sredina, | |
Stepenska sredina, | |
Geometrijska sredina. |
Ponderirana aritmetička sredina (ili ponderirana sredina) koristi se u slučajevima kada se kombiniraju srednje vrijednosti iz uzorka date populacije sa različitim veličinama uzorka:
Težine predstavljaju veličine raznih uzoraka. U drugim aplikacijama, one su mjera pouzdanosti uticaja na srednju vrijednost odgovarajučih vrijednosti.
Ponekad skup brojeva može da sadrži osamljene dijelove, tj. vrijednosti podataka koje su znatno niže ili znatno veće od ostalih. Često su takve vrijednosti pogrešni podaci izazvani artefaktima. U tom slučaju, može se koristiti zarubljena sredina. To uključuje odbacivanje datih dijelova podataka na gornjem ili donjem kraju, obično jednake količine na svakom, a zatim uzimanje srednje aritmetičke vrijednosti preostalih podataka. Broj uklonjenih vrijednosti prikazan je u procentima od ukupnog broja vrijednosti.
Interkvartilna sredina je specifični primjer zarubljene sredine. To je jednostavno aritmetička sredina nakon uklanjanja najniže i najviše četvrtine vrijednosti.
uz pretpostavku da su vrijednosti poređane, to je jednostavno specifičan primjer ponderirane srednje vrijednosti za specifični skup težina.
U nekim okolnostima, mogu se izračunati sredinu beskonačnog (čak i neizbrojivog) skupa vrijednosti. To se može dogoditi pri izračunavanju srednje vrijednosti funkcije . Ovo se intuitivno može zamisliti kao izračunavanje površine ispod sekcije krive, a zatim dijeljenje sa dužinom te sekcije. Ovo se može učiniti grubim brojenjem kvadrata na grafičkom papiru ili tačnije integracijom. Formula integracije se izražava kao:
Mora se voditi računa da dati integral konvertira. Srednja vrijednost može biti konačna, čak i ako sama funkcija u nekim tačkama teži ka beskonačnosti.
Uglovi, doba dana i druge ciklične veličine zahtijevaju modulsku aritmetiku za dodavanje i kombiniranje brojeva. U svim ovim situacijama, neće postojati jedinstvena sredina. Naprimjer, vremena u satima prije i poslije dvanaest sati su jednako udaljena od ponoći i podneva. Također postoji mogućnost da srednja vrijednost ne postoji. Ako se razmatra točak boja, ne postoji srednja vrijednost skupa svih boja. U tim situacijama mora se odlučiti koja je srednja vrijednost najkorisnija. To se može učiniti podešavanjem vrijednosti prije trženja prosjeka ili korišćenjem specijaliziranog pristupa za srednju vrijednost kružne količine.
Fréchetova sredina je način određivanja "centra" raspodjele mase na površini, ili općenitije i Riemannovoj mnogostrukosti. Za razliku od mnogih drugih pristupa, Fréchetova sredina definirana je na prostoru čiji se elementi ne mogu nužno sabirati ili množiti skaliranjem.
Aritmetička sredina populacije ili populacijski prosjek označava se sa µ. Srednja vrijednost uzorka (aritmetička sredina uzorka vrijednosti izvučenih iz populacije) čini dobar procenjivač populacjske srednje vrijednosti, pošto je njegova očekivana vrijednost jednaka populacjskoj srednjoj vrijednosti (to je tzv. nepristrasni procenjivač, koji procjenjuje naklonost istraživača poželjnoj vrijednosti). Srednja vrijednost uzorka je slučajna promenljiva, a ne konstanta, jer se njena izračunata vrijednost razlikuje slučsjno, u zavisnosti od toga koji su pripadnici populacije uključeni, a konsekventno ima svoju sopstvenu distribuciju. Za slučajni uzorak od nezavisnih opažanja, očekivana vreličina srednje vrijednosti uzorka je:
a varijansa prosječne vrijednosti uzorka je
Ako je populacija normalno distribuirana, i srednja vrijednost uzorka će biti normalno distribuirana:
Ako populacija nije normalno distribuirana, srednja vrijednost uzorka je ipak približno normalno distribuirana, ako je -{n}- veliko i σ2/-{n}- < +∞. To proizlazi iz teoreme centralne granice.
Sveukupna srednja vrijednost liste (engleski grand total) predstavljaja zbir svih mjerenja podijeljene veličinom liste.