Średnia

Średnia
Polecane artykuły

Średnia - termin ten ma w statystyce dwa pokrewne znaczenia:

  • Średnia z próby,
  • Wartość oczekiwana zmiennej losowej (wartość średnia w populacji),

Średnia jest najpopularniejszą miarą tendencji centralnej (oprócz średnich klasycznych istnieją także mediana i modalna). Informuje o przeciętnym poziomie cechy, nie odzwierciedlając różnic pomiędzy poszczególnymi jednostkami. Obliczanie jej wartości ma sens tylko wtedy, gdy zbiorowość jest jednorodna.

Dla zmiennej losowej X, średnia jest wartością oczekiwaną X. Jest więc momentem pierwszego rzędu. Często średnią oznacza się jako μ.

Ogólnie jest to funkcja \(\mu (x_{1},\ldots, x_{m})\) taka, że dla dowolnych \(x_{1}, x_{2},.., x_{m}\) spełnia warunek

\(\min (x_{1},\ldots, a_{m})\leq\mu (x_{1},\ldots, x_{m})\leq \max (x_{1},\ldots, x_{m}).\)

i jednocześnie jest niemalejąca ze względu na każdą zmienną \(x_i\).

Dla dyskretnej zmiennej losowej, która może przyjąc m możliwych skończonych wartości \(x_{1}, x_{2},.., x_{m}\) średnia wynosi:

\(E (X)\equiv\sum\limits_{i=1}^m p (x_{i})x_{i}\)

Każda możliwa realizacja zmiennej losowej jest mnożona przez prawdopodobieństwo jej wystąpienia.

Dla ciągłej zmiennej losowej średnia definiowana jest analogicznie:

\(E (X)\equiv\int_{-\infty}^{ \infty} x f (x) dx\)

gdzie \(f (x)\) jest gęstością prawdopodobieństwa.

Należy pamiętać, że nie każda zmienna losowa posiada moment pierwszego rzędu.

Poza statystyką średnie używane są często w innych naukach ścisłych, które wykształciły wiele średnich specyficznych dla danej dziedziny (np. średnia logarytmiczna w inżynierii chemicznej).

Średnia ważona jest to rodzaj średniej do obliczenia której potrzebujemy wagę(znaczenie) poszczególnych elementów. Dla każdego składnika przypisane są określone wagi, mające na celu ukazanie istotności danego elementu. Im element ma większą wagę, tym większy ma wpływ na średnią. W przypadku, gdzie wszystkie wagi są takie same, średnia ważona jest równa średniej bazowej, czyli wyjściowej.

Miary średnie dzielą się na dwie grupy: średnie klasyczne i pozycyjne. Obie grupy średnich uzupełniają się, bowiem każda z nich opisuje poziom wartości zmiennej pod innym kątem.


Średnie klasyczne

Obliczamy je na podstawie wszystkich wartości szeregu. Do średnich klasycznych należą: średnia arytmetyczna, średnia geometryczna, średnia harmoniczna oraz średnia potęgowa.

Średnia arytmetyczna

Średnia arytmetyczna wartości cechy jest najpopularniejszą miarą tendencji centralnej. Jest często utożsamiana z pojęciem średniej. Otrzymuje się ją, dzieląc sumę wartości zmiennej wszystkich jednostek badanej zbiorowości przez liczbę tych jednostek. (J. Podgórski 2010, s. 45). Jest miarą mianowaną.

Dla zmiennej, która przyjmuje wartości \(x_{1}, x_{2},.., x_{m}\) średnia arytmetyczna wynosi:

\( \mu=\frac{x_{1} + x_{2} +\dots+ x_{m}}{m}=\frac{1}{m} \sum\limits_{i=1}^m x_{i} \)

Istnieje także średnia arytmetyczna ważona, używana, gdy wartości zmiennych występują z różną częstością:

\( \mu=\frac{f_{1}x_{1} + f_{2}x_{2} +\ldots+ f_{k}x_{mk}}{f_{1}+f_{2}+\ldots+f_{k}}=\frac{1}{m} \sum\limits_{i=1}^k f_{i}x_{i} \)

gdzie:

k - liczba wariantów zmiennej losowej,

\(f_{i}\)-liczba jednostek odpowiadająca i-temu wariantowi zmiennej losowej

\(m=\sum\limits_{i=1}^k f_{i}\)

Własności średniej arytmetycznej:

  • jest wypadkową wartości cechy dla wszystkich wartości zmiennej \(x_{min}≤\mu≤x_{max}\),
  • suma wartości zmiennej jest równa iloczynowi średniej arytmetycznej i liczebności zbiorowości,
  • suma odchyleń wartości cechy dla poszczególnych jednostek od średniej arytmetycznej jest równa zeru,
  • suma kwadratów odchyleń poszczególnych jednostek od wartości średniej równa się minimum co znaczy, że jest mniejsza od jakiejkolwiek dowolnej liczby,
  • jeśli wszystkie wartości zmiennej powiększymy (lub pomniejszymy/podzielimy/pomnożymy) o pewną stałą, to średnia arytmetyczna będzie równa sumie (lub różnicy/ilorazowi/iloczynowi) średniej arytmetycznej wyjściowych zmiennych i tej stałej,
  • na poziom średniej arytmetycznej silny poziom wywierają wartości skrajne.

Średnia arytmetyczna:

  • jest miarą prawidłową tylko dla jednorodnych zbiorowości posiadających niewielkie zróżnicowanie wartości zmiennej,
  • Średniej tej nie można obliczyć gdy przedziały są otwarte jeśli mają dużą liczebność. Przedziału muszą być domknięte (umownie: otwarte przedziały klasowe można zamykać gdy liczba jednostek w nich zawartych nie przekracza 5% liczebności całej populacji),
  • szereg nie musi mieć wszystkich przedziałów o jednakowej rozpiętości,
  • w interpretacji średniej należy być ostrożnym, gdy występuje bardzo silna asymetria, rozkład jest bimodalny bądź wielomodalny lub rozkład jest siodłowy w kształcie litery U,
  • gdy dostępne są tylko informacje o wartościach średnich dla pewnych grup, to średnia arytmetyczna całości jest średnią arytmetyczną ważoną ze średnich dla poszczególnych grup.

Średnia arytmetyczna należy do grupy tak zwanych klasycznych miar opisowych rozkładu. Od innych wyróżniają się faktem, że uwzględniają w obliczeniach wszystkie wartości danego zbioru. Oznacza to, że zmiana któregokolwiek ze składników w zbiorze danych będzie prowadziła do zmiany wartości miary klasycznej.

Średnia geometryczna

Średnia geometryczna jest pierwiastkiem m-tego stopnia iloczynu m wartości zmiennej. Stosuje się ją głównie przy badaniu zmian tempa zjawisk i gdy zmienna ma rozkład lognormalny. Jest ona szczególnym przypadkiem średniej potęgowej rzędu 0. Średnia geometryczna w mniejszym stopniu niż średnia arytmetyczna odzwierciedla wpływ wartości ekstremalnych na przeciętny poziom zmiennej. Jest dana wzorem:

\( \mu=\sqrt[m]{x_1 \cdot x_2 \cdot \dots \cdot x_m}\)

Istnieje także średnia geometryczna ważona, używana gdy wartości zmiennych występują z różną częstością:

\( \mu=\sqrt[m]{x_{1}^{f_1} \cdot x_{2}^{f_2} \cdot \dots \cdot x_{m}^{f_m}}\)

Własności średniej geometrycznej:

  • jeśli choć jedn wartośc jest równa zero, to średnia geometryczna jest równa zero,
  • nadaje się jedynie do charakteryzowania wartości dodatnich,
  • jest mniej wrażliwa na wartości skrajne aniżeli średnia arytmetyczna,
  • odchylenia względne wartości cechy od średniej geometrycznej znoszą się wzajemnie,
  • odchylenia względne są większe lub mniejsze od jedności zależnie od tego, czy wartość cechy dla danej jednostki są większe lub mniejsze od średniej geometrycznej,
  • średnia geometryczna iloczynu dwóch szeregów równa się iloczynowi średnich geometrycznych obu szeregów,
  • średnią geometryczną sprowadzamy do średniej arytmetycznej za pomocą transformacji logarytmicznej.

Średnia harmoniczna

Średnią harmoniczna (dla liczb różnych od zera) nazywamy odwrotność średniej arytmetycznej odwrotności tych liczb. Średnia harmoniczna jest więc średnią potęgową rzędu -1. Oblicza się ją, gdy wartości zmiennej są podane w jednostkach względnych, np. w km/h, kg/osobę. Jest dana wzorem:

\(\mu=(\frac{1}{m} \sum\limits_{i=1}^m \frac{1}{x_{i}})^{-1}\)

przy czym\[\sum\limits_{i=1}^m \frac{1}{x_{i}}\neq0\]

Gdy konieczne jest obliczenie średniej harmonicznej z szeregów rozdzielczych (przedziałowych bądż punktowych) trzeba zastosować wagi (uwzględnienie liczebności). W takich przypadkach, średnia harmoniczna ważona dana jest wzorem:

\(\mu=(\frac{1}{m} \sum\limits_{i=1}^k \frac{f_{i}}{x_{i}})^{-1}\)

Średnia potęgowa

Średnia potęgowa (dla liczb dodatnich) jest pierwiastkiem n-tego stopnia ze średniej arytmetycznej obliczonej dla wartości zmiennych podniesionych do potęgi n. Średnia potęgowa rzędu -1 to średnia harmoniczna, rzędu 0 - średnia geometryczna, rzędu 1 - średnia arytmetyczna a rzędu 2 - średnia kwadratowa. Wzór średniej potęgowej jest następujący:

\(\mu=\sqrt[n]{\frac{1}{m} \sum\limits_{i=1}^m x_{i}}\)

Wzór dla ważonej średniej potęgowej rzędu n przedstawia się nastepująco:

\((\frac{\sum\limits_{1}^{m}f_{i}x_{i}^{n}}{\sum\limits_{i=1}^{m}f_{i}})^{\frac{1}{n}}\)

Średnie pozycyjne

Najczęściej wykorzystywanymi średnimi pozycyjnymi są dominanta oraz kwantyle.

Dominanta

Dominanta, czyli inaczej modalna, wartość najczęstsza, to wartość cechy, która powtarza się w szeregu największą ilość razy. Dominanta jest skuteczną miarą tendencji w przypadku na przykład badań rynkowych, marketingowych, socjologicnzych i tak dalej.

Właściwości dominanty:

  • nadaje się do charakteryzowania cech jakościowych,
  • jest mniej abstrakcyjna niż średnia,
  • w szeregu rozdzielczym punktowym wyznaczanie dominanty sprowadza się do wskazania najczęściej pojawiającej się wartości cechy,
  • w szeregu rozdzielczym przedziałowym możliwe jest wskazanie przedziału, w którym znajduje się dominanta.
\(D_{0} = x_{0} + \frac { (n_{0} - n_{-1}) * h_{0} }{ (n_{0} - n_{-1}) + (n_{0} - n_{+1}) } \)

\( x_{0} \) dolna granica przedziału klasowego, który zawiera dominantę (przedział charakteryzuje się największa częstością) \(n_{0} \) częstość (absolutna lub względna) przedziału klasowego domkniętego zawierającego dominantę (o maksimum częstości w rozkładzie) \(n_{-1} \) częstość (absolutna lub względna) przedziału klasowego poprzedzającego przedział zawierający dominantę \(n_{+1} \) częstość (absolutna lub względna) przedziału klasowego następującego po przedziale zawierający dominantę \(h_{0} \) rozpiętość przedziału dominanty (przedziały sąsiadujące muszą mieć taką samą rozpiętość)

Wyznaczanie dominanty jest uzasadnione wówczas, gdy szereg spełnia następujące warunki:

  • rozkład empiryczny ma jeden ośrodek dominujący (jest więc rozkładem jednomodalnym),
  • asymetria rozkładu jest umiarkowana,
  • przedział, w ktorym wystepuje dominanta oraz dwa sąsiadujące z nim przedziały mają jednakowe rozpiętości.

Kwantyle

Kwantyle są to wartości cechy badanej zbiorowości, które dzielą ją na określone części pod względem liczby jednostek. Części te mogą być równe lub pozostawać do siebie w określonych proporcjach. Szeregi z których wyznacza się kwantyle, muszą być koniecznie uporządkowane (według rosnących lub malejących wartości cechy statystycznej. Wśród kwantyli wyróżniamy:

  • kwartyle (dzielące zbiorowość na cztery części),
  • kwintyle (dzielące zbiorowość na pięć części),
  • decyle (dzielące zbiorowość na dziesięć części),
  • centyle, inaczej percentyle (dzielące zbiorowość na sto części).

Wśród kwartyli wyróżniamy:

  • Kwartyl I (dolny) - dzieli zbiorowość uporządkowaną na dwie części w ten sposób, że 25% jednostek zbiorowości ma wartości mniejsze lub równe kwartylowi I, a 75% jednostek przyjmuje wartości większe lub równe wartości kwartyla I.
  • Kwartyl III (górny) - dzieli zbiorowość uporządkowaną na dwie części w ten sposób, że 75% jednostek zbiorowości ma wartości mniejsze lub równe kwartylowi III, a 25% jednostek przyjmuje wartości większe lub równe wartości kwartyla III.
  • Kwartyl II (wartość środkowa, mediana)

Mediana to wartość cechy dzieląca uporządkowaną zbiorowość statystyczną na dwie jednakowe pod względem liczebności części w ten sposób, że połowa jednostek zbiorowości przyjmuje wartości mniejsze lub większe lub równe wartości mediany. Jeśli liczba zmiennych jest parzysta, to numer środkowej zmiennej nie jest liczbą całkowitą co wiąże się z faktem, że nie uda się wskazać konkretnej środkowej jednostki. W takim przypadku sumujemy dwie środkowe zmienne i dzielimy tą sumę przez liczbę zmiennych. Właściwości mediany:

  • nie zależy od wartości skrajnych,
  • można ją wyznaczyć przy otwartych przedziałach klasowych i skrajnej asymetrii,
  • dokładność przybliżeń mediany zależy od rozpiętości przedziałów klasowych.

Decyle i centyle wyznacza się podobnie do kwartyli. Decyle dzielą zbiorowość uporządkowaną na 10 części. Na przykład decyl czwarty, to taka wartość cechy, że 0,4 wszystkich jednostek zbiorowości ma wartości niższe od niej, a 0,6 ma wartości wyższe. Decyli jest 9, a piąty decyl jest medianą. Centyle dzielą zbiorowość uporządkowaną na 100 części. Na przykład centyl 39 jest taką wartością, że 0,39 wszystkich jednostek zbiorowości ma wartości niższe od niej, a 0,61 jednostek ma wartości wyższe. Centyli jest 99 a pięćdziesiąty centyl jest medianą. (M.Sobczyk 2010, s. 42)

Bibliografia

  • Paradysz J. (2005) Statystyka, Akademia Ekonomiczna w Poznaniu, Poznań
  • Podgórski J. (2010)Statystyka dla studiów licencjackich, Polskie Wydawnictwo Ekonomiczne, Warszawa, wyd. III
  • Roeske-Słomka I. (2010), Statystyka opisowa, Wydawnictwo Uniwersytetu Ekonomicznego, Poznań
  • Sagan A. Przykłady stosowania podstawowych technik analitycznych i graficznych, Akademia Ekonomiczna w Krakowie
  • Sobczyk M. (2010) Statystyka opisowa, Wydawnictwo C.H. Beck, Warszawa
  • Tadeusiewicz R. Statystyka - nauka o wielu obliczach, Dziennik Kraków
  • Zimny A. (2010) Statystyka opisowa Statystyka opisowa, Wydawnictwo Państwowej Wyższej Szkoły Zawodowej w Koninie. Konin

Autor: Magdalena Kucypera