Histogram: Różnice pomiędzy wersjami

Z Encyklopedia Zarządzania
m (Dodanie MetaData Description)
mNie podano opisu zmian
 
(Nie pokazano 19 wersji utworzonych przez 2 użytkowników)
Linia 1: Linia 1:
{{infobox4
'''Histogram''' to zestawienie [[Dane|danych]] statystycznych w postaci wykresu powierzchniowego złożonego z przylegających
|list1=
<ul>
<li>[[Wykres słupkowy]]</li>
<li>[[Metody statystyczne]]</li>
<li>[[Analiza regresji]]</li>
<li>[[Kwartyl]]</li>
<li>[[ANOVA]]</li>
<li>[[Rozkład normalny]]</li>
<li>[[Skala porządkowa]]</li>
<li>[[Wykres pudełkowy]]</li>
<li>[[Analiza przyczynowa]]</li>
</ul>
}}
 
 
 
 
'''Histogram''' to zestawienie [[Dane|danych]] statystycznych w postaci wykresu powierzchniowego złożonego z przylegających  
do siebie słupków (prostokątów), których wysokość ilustruje liczebność występowania badanej cechy w [[Populacja|populacji]] lub jej próbie <ref>E.Siwek 2002</ref>, a podstawy (które spoczywają na osi odciętych) są rozpiętościami przedziałów klasowych.
do siebie słupków (prostokątów), których wysokość ilustruje liczebność występowania badanej cechy w [[Populacja|populacji]] lub jej próbie <ref>E.Siwek 2002</ref>, a podstawy (które spoczywają na osi odciętych) są rozpiętościami przedziałów klasowych.


Linia 24: Linia 6:


==Zastosowanie==
==Zastosowanie==
Histogram ma zastosowanie również w dziedzinie statystyki służy do graficznego zaprezentowania częstości występowania zmiennej losowej w danym przedziale, zaś jeśli chodzi o analizę jakości ten rodzaj wykresu ma za [[zadanie]] wizualizację zmienności co w dalszych etapach ułatwia podjęcie decyzji dotyczących usprawnienia działań i poprawy jakości badanego obiektu <ref> M. Dykiel, s.16 </ref>.
Histogram ma zastosowanie również w dziedzinie statystyki służy do graficznego zaprezentowania częstości występowania zmiennej losowej w danym przedziale, zaś jeśli chodzi o analizę jakości ten rodzaj wykresu ma za [[zadanie]] wizualizację zmienności co w dalszych etapach ułatwia podjęcie decyzji dotyczących usprawnienia działań i poprawy jakości badanego obiektu.
 
Wspomniany rodzaj wykresu jest uważany jako jeden z siedmiu podstawowych narzędzi, które służą do doskonalenia jakości o bardzo szerokim zastosowaniu. Za jego pomocą możliwe jest graficzne przestawienie rozkładu badanej cechy, a w konsekwencji umożliwia lepsze zrozumienie analizowanego zjawiska <ref>B.Detyna 2011, s.137</ref>.
Wspomniany rodzaj wykresu jest uważany jako jeden z siedmiu podstawowych narzędzi, które służą do doskonalenia jakości o bardzo szerokim zastosowaniu. Za jego pomocą możliwe jest graficzne przestawienie rozkładu badanej cechy, a w konsekwencji umożliwia lepsze zrozumienie analizowanego zjawiska <ref>B.Detyna 2011, s.137</ref>.
<google>t</google>


Ułatwia identyfikacje jakiego rodzaju jest rozkład ciągły prawdopodobieństwa, który służy do prognozowania. Zadaniem wymienionej techniki jest eliminowanie ewentualnych wad, [[ostrzeżenie]] przed potencjalnymi trudnościami z zakresu jakości przed ich liczniejszym wystąpieniem <ref> Frąś J. 2011, s. 377 </ref>.
Ułatwia identyfikacje jakiego rodzaju jest rozkład ciągły prawdopodobieństwa, który służy do prognozowania. Zadaniem wymienionej techniki jest eliminowanie ewentualnych wad, [[ostrzeżenie]] przed potencjalnymi trudnościami z zakresu jakości przed ich liczniejszym wystąpieniem <ref> Frąś J. 2011, s. 377 </ref>.


Taki sposób konstrukcji histogramu jest stosowany wówczas, kiedy przedziały szeregu rozdzielczego są równe.Jeżeli szereg ma nierówne przedziały, to wysokość prostokątów jest określona przez wskaźniki natężenia liczebności (częstości) odpowiadające poszczególnym klasom.
Taki sposób konstrukcji histogramu jest stosowany wówczas, kiedy przedziały szeregu rozdzielczego są równe.Jeżeli szereg ma nierówne przedziały, to wysokość prostokątów jest określona przez wskaźniki natężenia liczebności (częstości) odpowiadające poszczególnym klasom.
<google>n</google>


==Ustalenie wskaźników liczebności==
==Ustalenie wskaźników liczebności==
Linia 37: Linia 21:
[[wskaźnik]] <math>_{\text{natezenia}}</math> =<math>\frac{k*i}{l}</math>
[[wskaźnik]] <math>_{\text{natezenia}}</math> =<math>\frac{k*i}{l}</math>


gdzie:  
gdzie:
:''k'' - to liczebność danej klasy
:''k'' - to liczebność danej klasy
:''i'' - to interwał klasy najwęższej
:''i'' - to interwał klasy najwęższej
:''l'' - to interwał danej klasy <ref name="Sobczyk">M.Sobczyk 2005, 29s.</ref>
:''l'' - to interwał danej klasy <ref name="Sobczyk">M.Sobczyk 2005, 29s.</ref>


Histogramy są stosowane głównie dla przedstawienia struktury zbiorowości (lub zjawiska),<br/>
Histogramy są stosowane głównie dla przedstawienia struktury zbiorowości (lub zjawiska),
a więc szeregów strukturalnych dotyczących cech jakościowych i ilościowych.<br/>
 
a więc szeregów strukturalnych dotyczących cech jakościowych i ilościowych.
 
Wykresy podkreślające podstawowe cechy danej [[Zbiorowość statystyczna|zbiorowości]] (lub zjawiska) muszą być precyzyjnie dostosowane do charakteru
 
tychże cech. Tak więc opisując przykładowo rozkład studentów według liczby dni spędzonych na nauce w danym okresie
 
czy rozkład zatrudnionych według liczby dni nie przepracowanych z powodu choroby w danym okresie
 
sporządzimy '''histogram'''. Nie możemy natomiast posłużyć się tym wykresem do opisania tendencji rozwojowej,
 
wahań sezonowych i przypadkowych (gdzie zaleca się stosowanie krzywej dynamiki)


Wykresy podkreślające podstawowe cechy danej [[Zbiorowość statystyczna|zbiorowości]] (lub zjawiska) muszą być precyzyjnie dostosowane do charakteru<br/>
tychże cech. Tak więc opisując przykładowo rozkład studentów według liczby dni spędzonych na nauce w danym okresie<br/>
czy rozkład zatrudnionych według liczby dni nie przepracowanych z powodu choroby w danym okresie<br/>
sporządzimy '''histogram'''. Nie możemy natomiast posłużyć się tym wykresem do opisania tendencji rozwojowej,<br/>
wahań sezonowych i przypadkowych (gdzie zaleca się stosowanie krzywej dynamiki)<br/>
czy opisania współzależności (którą należy przedstawić na wykresie korelacji)<ref>M.Krzysztofiak, A. Luszniewicz 1976, s. 58</ref>.
czy opisania współzależności (którą należy przedstawić na wykresie korelacji)<ref>M.Krzysztofiak, A. Luszniewicz 1976, s. 58</ref>.


==Budowa histogramu==
==Budowa histogramu==
:Histogram podobnie jak pozostałe wykresy statystyczne składa się z kilku części:
:Histogram podobnie jak pozostałe wykresy statystyczne składa się z kilku części:
* pola
* pola
* wykresu
* wykresu
* skali (aby ułatwić czytanie wykresu, stosuje się nieraz, zwłaszcza w prostokątnym układzie współrzędnych, dwie jednakowe skale na obu krańcach obrazu graficznego, <br>tj skalę poziomą oraz dwie skale pionowe po lewej i po prawej stronie pola wykresu)
* skali (aby ułatwić czytanie wykresu, stosuje się nieraz, zwłaszcza w prostokątnym układzie współrzędnych, dwie jednakowe skale na obu krańcach obrazu graficznego,  
tj skalę poziomą oraz dwie skale pionowe po lewej i po prawej stronie pola wykresu)
* tytułu (w wykresach popularyzacyjnych tytuł należy umieścić nad obrazem graficznym, natomiast w publikacjach można go umieścić również pod rysunkiem)
* tytułu (w wykresach popularyzacyjnych tytuł należy umieścić nad obrazem graficznym, natomiast w publikacjach można go umieścić również pod rysunkiem)
* legendy
* legendy
*źródła (jeżeli obok wykresu w tej samej publikacji zamieszczamy tablicę statystyczną z danymi liczbowymi i opatrzona jest ona opisem źródła informacji,<br> wystarczy pod wykresem wymienić jako źródło numer kolejny tej tablicy) i innych objaśnień.<ref>K.Zając 1982, s. 128</ref>
* źródła (jeżeli obok wykresu w tej samej publikacji zamieszczamy tablicę statystyczną z danymi liczbowymi i opatrzona jest ona opisem źródła informacji, wystarczy pod wykresem wymienić jako źródło numer kolejny tej tablicy) i innych objaśnień.<ref>K.Zając 1982, s. 128</ref>
 
Podstawą sporządzania histogramu opisującego prawidłowości występujące w zbiorowościach (zjawiskach)
 
jest układ współrzędnych prostokątnych, przy czym główną uwagę należy skupić na doborze skali
 
i precyzyjnym obrazie graficznym, a nie na opisie wykresu i jego atrakcyjności.


Podstawą sporządzania histogramu opisującego prawidłowości występujące w zbiorowościach (zjawiskach)<br/>
Szczególną postacią histogramu jest ''''histogram kumulacyjny''''. Na osi odciętych w prostokątnym układzie
jest układ współrzędnych prostokątnych, przy czym główną uwagę należy skupić na doborze skali<br/>
i precyzyjnym obrazie graficznym, a nie na opisie wykresu i jego atrakcyjności.<br/>


Szczególną postacią histogramu jest ''''histogram kumulacyjny''''. Na osi odciętych w prostokątnym układzie <br/>
współrzędnych odkłada się wówczas liczebności skumulowane <ref name="Sobczyk" />.
współrzędnych odkłada się wówczas liczebności skumulowane <ref name="Sobczyk" />.


Linia 78: Linia 71:
# Obliczenie szerokości przedziałów
# Obliczenie szerokości przedziałów
## Rozpiętość przedziałów ustalamy na podstawie różnicy między najwyższą (<math>x_{\text{max}}</math> i najniższą <math>x_{\text{min}}</math>)
## Rozpiętość przedziałów ustalamy na podstawie różnicy między najwyższą (<math>x_{\text{max}}</math> i najniższą <math>x_{\text{min}}</math>)
: wartością cechy (tzw. [[rozstęp]]), podzielonej przez liczbą klas:  
: wartością cechy (tzw. [[rozstęp]]), podzielonej przez liczbą klas:


: <math>c = \frac{ \left (x_{\text{max}} - x_{\text{min}}\right)}{k}</math>
: <math>c = \frac{ \left (x_{\text{max}} - x_{\text{min}}\right)}{k}</math>


Szereg jest zawsze bardziej przejrzysty, jeżeli możliwe jest przyjęcie rozpiętości przedziałów w postaci liczby 5, 10, 50, 100 itd.
Szereg jest zawsze bardziej przejrzysty, jeżeli możliwe jest przyjęcie rozpiętości przedziałów w postaci liczby 5, 10, 50, 100 itd.
# Ustalenie dolnej granicy pierwszego przedziału jako:  
# Ustalenie dolnej granicy pierwszego przedziału jako:


: <math>x_i0= x_{\text{min}} - \frac{c}{2}</math>,
: <math>x_i0= x_{\text{min}} - \frac{c}{2}</math>,
Linia 89: Linia 82:
# określenie ilości obserwacji w danym przedziale
# określenie ilości obserwacji w danym przedziale


W przypadku nierównych przedziałów klasowych przy konstruowaniu histogramu należy pamiętać<br>
W przypadku nierównych przedziałów klasowych przy konstruowaniu histogramu należy pamiętać
 
o następujących zasadach:
o następujących zasadach:
:* na osi przedziałów klasowych odkładamy szerokości poszczególnych kolumn proporcjonalnie do rozpiętości przedziału klasowego,
:* na osi przedziałów klasowych odkładamy szerokości poszczególnych kolumn proporcjonalnie do rozpiętości przedziału klasowego,
:*wysokości kolumn zmniejszamy lub zwiększamy w stosunku odwrotnie proporcjonalnym do stopnia zmniejszenia lub zwiększenia
:* wysokości kolumn zmniejszamy lub zwiększamy w stosunku odwrotnie proporcjonalnym do stopnia zmniejszenia lub zwiększenia
szerokości kolumn <ref>K.Kocimowski, J.Kwiatek 1976, s. 27</ref>.
szerokości kolumn <ref>K.Kocimowski, J.Kwiatek 1976, s. 27</ref>.


==Przykładowy histogram==
==Przykładowy histogram==
[[Image:Przykład histogramu.gif]]
[[Image:Przykład histogramu.gif]]


Linia 104: Linia 97:


==Typy histogramów==
==Typy histogramów==
:Kształt histogramu jest kluczowym elementem bowiem podkreśla rodzaj informacji bądź zaburzeń. Wyróżniamy kilka rodzajów histogramów :
:Kształt histogramu jest kluczowym elementem bowiem podkreśla rodzaj informacji bądź zaburzeń. Wyróżniamy kilka rodzajów histogramów :
 
* '''Typ podstawowy''' - charakteryzuje się systematycznym kształtem przypominającym zarys dzwonu, [[Plik:typpodstawowy.jpg|300px|right|thumb|Rys. 2 Typ podstawowy]] a jego [[wartość]] średnia znajduje się w centralnej jego części. Ten typ sugerować może rozkład normalny, a w konsekwencji prawdopodobnie występowanie jednej przyczyny, która wpływa na jego zmienność.
 
* '''Typ grzebieniowy''' - z tego typu wykresem mamy do czynienia gdy nie ma wyraźnego jednego wzniesienia,[[Plik:typgrzebieniowy.jpg|300px|right|thumb|Rys. 3 Typ grzebieniowy]] lecz wysokości danych słupków są naprzemiennie duże bądź małe przypominające kształtem grzebień. Taka [[różnorodność]] ich wysokości może świadczyć o występowaniu kilku przyczyn zmienności histogramu.
* '''Typ podstawowy''' - charakteryzuje się systematycznym kształtem przypominającym zarys dzwonu, [[Plik:typpodstawowy.jpg|300px|right|thumb|Rys. 2 Typ podstawowy]] a jego [[wartość]] średnia znajduje się w centralnej jego części. Ten typ sugerować może rozkład normalny, a w konsekwencji prawdopodobnie występowanie jednej przyczyny, która wpływa na jego zmienność.  
* '''Typ asymetryczny''' - charakteryzuje go występowanie wartości średniej wyraźnie po jednej [[Plik:typasymetryczny.jpg|300px|right|thumb|Rys. 4 Typ asymetryczny]] ze stron rozkładu, w której skupia się większość obserwacji. Ten histogram ma miejsce wtedy gdy chcemy utrzymać dolną bądź górną granicę tolerancji (może być wyznaczona odgórnie lub określona teoretycznie).
 
* '''Typ jednostronny''' - cechuje się tym iż wartość średnia znajduje się w przedziale granicznym. [[Plik:typjednostronny.jpg|300px|right|thumb|Rys. 5 Typ jednostronny]] Podkreśla wytypowanie bądź eliminację wartości, które znajdują się ponad bądź poniżej pewnej granicy.
 
* '''Typ kopca ''' - charakteryzuje się skupieniem zbliżonych częstości w przedziałach [[Plik:typkopca.jpg|300px|right|thumb|Rys. 6 Typ kopca]] znajdujących się pośrodku oraz spadających ich wartości bliżej granic danego rozkładu. Taki histogram świadczy o występowaniu kilku podobnych co do wartości zbiorów, które posiadają różniące się wartości średnie.
 
 
 
 
 
 
 
 
* '''Typ grzebieniowy''' - z tego typu wykresem mamy do czynienia gdy nie ma wyraźnego jednego wzniesienia,[[Plik:typgrzebieniowy.jpg|300px|right|thumb|Rys. 3 Typ grzebieniowy]] lecz wysokości danych słupków są naprzemiennie duże bądź małe przypominające kształtem grzebień. Taka [[różnorodność]] ich wysokości może świadczyć o występowaniu kilku przyczyn zmienności histogramu.  
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
* '''Typ asymetryczny''' - charakteryzuje go występowanie wartości średniej wyraźnie po jednej [[Plik:typasymetryczny.jpg|300px|right|thumb|Rys. 4 Typ asymetryczny]] ze stron rozkładu, w której skupia się większość obserwacji. Ten histogram ma miejsce wtedy gdy chcemy utrzymać dolną bądź górną granicę tolerancji (może być wyznaczona odgórnie lub określona teoretycznie).  
 
 
 
 
 
 
 
 
 
 
 
 
* '''Typ jednostronny''' - cechuje się tym iż wartość średnia znajduje się w przedziale granicznym. [[Plik:typjednostronny.jpg|300px|right|thumb|Rys. 5 Typ jednostronny]] Podkreśla wytypowanie bądź eliminację wartości, które znajdują się ponad bądź poniżej pewnej granicy.  
 
 
 
 
 
 
 
 
 
 
 
 
* '''Typ kopca '''- charakteryzuje się skupieniem zbliżonych częstości w przedziałach [[Plik:typkopca.jpg|300px|right|thumb|Rys. 6 Typ kopca]] znajdujących się pośrodku oraz spadających ich wartości bliżej granic danego rozkładu. Taki histogram świadczy o występowaniu kilku podobnych co do wartości zbiorów, które posiadają różniące się wartości średnie.  
 
 
 
 
 
 
 
 
 
 
 
 
* '''Typ siodła''' - występują tu dwie wartości modalne (dominanty, mody), czyli wartości najczęstsze. [[Plik:typsiodla.jpg|300px|right|thumb|Rys. 7 Typ siodła]] Przedstawia połączenie dwóch rozkładów posiadających odmienne wartości średnich i przedstawia odchylenia, które są łatwe w zidentyfikowaniu.
* '''Typ siodła''' - występują tu dwie wartości modalne (dominanty, mody), czyli wartości najczęstsze. [[Plik:typsiodla.jpg|300px|right|thumb|Rys. 7 Typ siodła]] Przedstawia połączenie dwóch rozkładów posiadających odmienne wartości średnich i przedstawia odchylenia, które są łatwe w zidentyfikowaniu.
 
* '''Typ z izolowanym pagórkiem''' - najczęściej występuje w przypadku zmieszania różnych [[Plik:typzizolowanympagorkiem.jpg|300px|right|thumb|Rys. 8 Typ z izolowanym pagórkiem]] rozkładów o odmiennych parametrach. Charakterystyczny jest dla niego "pagórek" znacznie wyższy od pozostałości słupków i wyróżniający się na tle całego wykresu.
 
 
 
 
 
 
 
 
 
 
 
 
 
* '''Typ z izolowanym pagórkiem''' - najczęściej występuje w przypadku zmieszania różnych [[Plik:typzizolowanympagorkiem.jpg|300px|right|thumb|Rys. 8 Typ z izolowanym pagórkiem]] rozkładów o odmiennych parametrach. Charakterystyczny jest dla niego "pagórek" znacznie wyższy od pozostałości słupków i wyróżniający się na tle całego wykresu.  
 
 
 
 
 
 
 
 
 
 
 
 
 
* '''Typ bez wartości skrajnych''' - z tym typem wykresu możemy się spotkać, gdy poprzednia[[Plik:typbezwartosciskrajnych.jpg|300px|right|thumb|Rys. 9 Typ bez wartości skrajnych]] [[selekcja]] innego rozkładu już się odbyła i zostały usunięte w niej wartości skrajne <ref>M.Wiśniewska 2014, s.53-54 </ref>.
* '''Typ bez wartości skrajnych''' - z tym typem wykresu możemy się spotkać, gdy poprzednia[[Plik:typbezwartosciskrajnych.jpg|300px|right|thumb|Rys. 9 Typ bez wartości skrajnych]] [[selekcja]] innego rozkładu już się odbyła i zostały usunięte w niej wartości skrajne <ref>M.Wiśniewska 2014, s.53-54 </ref>.


 
{{infobox5|list1={{i5link|a=[[Wykres słupkowy]]}} &mdash; {{i5link|a=[[Metody statystyczne]]}} &mdash; {{i5link|a=[[Analiza regresji]]}} &mdash; {{i5link|a=[[Kwartyl]]}} &mdash; {{i5link|a=[[ANOVA]]}} &mdash; {{i5link|a=[[Rozkład normalny]]}} &mdash; {{i5link|a=[[Skala porządkowa]]}} &mdash; {{i5link|a=[[Wykres pudełkowy]]}} &mdash; {{i5link|a=[[Analiza przyczynowa]]}} }}
 
 
 


==Przypisy==
==Przypisy==
 
<references />
<references/>


==Bibliografia==
==Bibliografia==
 
<noautolinks>
 
* Detyna B. (2011), ''[https://www.dbc.wroc.pl/Content/30452/detyna_zarzadzanie.pdf Zarządzanie jakością w logistyce]'', Wydawnictwo Państwowej Szkoły Zawodowej im. Angelusa Silesiusa, Wałbrzych
* Dykiel M.  ''[https://www.pwsz.krosno.pl/gfx/pwszkrosno/pl/defaultopisy/1155/3/1/03._magdalena_dykiel_grzegorz_jasinski_izabela_betlej_znaczenie_wybranych_narzedzi_w_zarzadzaniu_jakoscia.pdf Znaczenie wybranych narzędzi w zarządzaniu jakością] ''
* Frąś J., Siwkowski M. (2011), ''[http://www.wneiz.pl/nauka_wneiz/frfu/46-2011/FRFU-46-369.pdf Metody i techniki zarządzania jakością]'', Finanse, rynki finansowe, ubezpieczenia nr 46
* Detyna B. (2011). ''[http://www.dbc.wroc.pl/Content/30452/detyna_zarzadzanie.pdf Zarządzanie jakością w logistyce]'', Wydawnictwo Państwowej Szkoły Zawodowej im. Angelusa Silesiusa, Wałbrzych
* Kocimowski K., Kwiatek J. (1976), ''Wykresy i mapy statystyczne'', GUS, Warszawa
* Frąś J. (2011). ''[http://www.wneiz.pl/nauka_wneiz/frfu/46-2011/FRFU-46-369.pdf Metody i techniki zarządzania jakością]'' "Zeszyty naukowe Uniwersytetu Szczecińskiego Finanse, Rynki Finansowe, Ubezpieczenia", nr 46  
* Krzysztofiak M., Luszniewicz A. (1976), ''Statystyka'', PWE, Warszawa
* Kocimowski K. Kwiatek J. (1976). ''Wykresy i mapy statystyczne'', GUS, Warszawa
* Siwek E. (2002), ''Słownik encyklopedyczny'', Cykada, Katowice
* Krzysztofiak M., Luszniewicz A. (1976) ''[[Statystyka]]'', PWE, Warszawa
* Sobczyk M. (2007), ''Statystyka'', Wydawnictwo Naukowe PWN, Warszawa
* Siwek E. (2002). ''Słownik Encyklopedyczny'', Cykada
* Wiśniewska M. (2014), ''Zarządzanie jakością i innowacyjność w świetle doświadczeń organizacji Pomorza'', InnoBaltica, Gdańsk
* Sobczyk M. (2005). ''Statystyka'', PWN, Warszawa
* Zając K. (1994), ''Zarys metod statystycznych'', Wydawnictwo PWE, Warszawa
* Wiśniewska M.(2014). ''[https://www.researchgate.net/publication/284721164_Zarzadzanie_jakoscia_i_innowacyjnosc_w_swietle_doswiadczen_organizacji_Pomorza Zarządzanie jakością i innowacyjność w świetle doświadczeń organizacji Pomorza]'' InnoBaltica, Gdańsk  
</noautolinks>
* Zając K. (1982). ''Zarys metod statystycznych'', PWE, Warszawa


{{a|Bernadeta Nowacka, Karolina Walczyk}}
{{a|Bernadeta Nowacka, Karolina Walczyk}}
[[Kategoria:Statystyka i Ekonometria]]
[[Kategoria:Prezentacja danych]]
[[Kategoria:Podstawowe narzędzia jakości]]
[[en:Histogram]]
[[en:Histogram]]


{{#metamaster:description|Histogram to wykres przedstawiający dane statystyczne w postaci słupków, których wysokość odpowiada liczebności badanej cechy.}}
{{#metamaster:description|Histogram to wykres przedstawiający dane statystyczne w postaci słupków, których wysokość odpowiada liczebności badanej cechy.}}

Aktualna wersja na dzień 22:57, 13 sty 2024

Histogram to zestawienie danych statystycznych w postaci wykresu powierzchniowego złożonego z przylegających do siebie słupków (prostokątów), których wysokość ilustruje liczebność występowania badanej cechy w populacji lub jej próbie [1], a podstawy (które spoczywają na osi odciętych) są rozpiętościami przedziałów klasowych.

TL;DR

Histogram to wykres statystyczny, który ilustruje częstość występowania danej cechy w populacji lub próbie. Jest ważnym narzędziem do analizy jakości i umożliwia lepsze zrozumienie badanego zjawiska. Histogramy są stosowane głównie do przedstawienia struktury zbiorowości i mogą mieć różne typy, takie jak podstawowy, grzebieniowy, asymetryczny, jednostronny, kopców, siodła, z izolowanym pagórkiem i bez wartości skrajnych. Przygotowanie histogramu wymaga zebrania wyników pomiarowych, ustalenia ilości przedziałów i obliczenia szerokości przedziałów.

Zastosowanie

Histogram ma zastosowanie również w dziedzinie statystyki służy do graficznego zaprezentowania częstości występowania zmiennej losowej w danym przedziale, zaś jeśli chodzi o analizę jakości ten rodzaj wykresu ma za zadanie wizualizację zmienności co w dalszych etapach ułatwia podjęcie decyzji dotyczących usprawnienia działań i poprawy jakości badanego obiektu.

Wspomniany rodzaj wykresu jest uważany jako jeden z siedmiu podstawowych narzędzi, które służą do doskonalenia jakości o bardzo szerokim zastosowaniu. Za jego pomocą możliwe jest graficzne przestawienie rozkładu badanej cechy, a w konsekwencji umożliwia lepsze zrozumienie analizowanego zjawiska [2].

Ułatwia identyfikacje jakiego rodzaju jest rozkład ciągły prawdopodobieństwa, który służy do prognozowania. Zadaniem wymienionej techniki jest eliminowanie ewentualnych wad, ostrzeżenie przed potencjalnymi trudnościami z zakresu jakości przed ich liczniejszym wystąpieniem [3].

Taki sposób konstrukcji histogramu jest stosowany wówczas, kiedy przedziały szeregu rozdzielczego są równe.Jeżeli szereg ma nierówne przedziały, to wysokość prostokątów jest określona przez wskaźniki natężenia liczebności (częstości) odpowiadające poszczególnym klasom.

Ustalenie wskaźników liczebności

Wskaźniki liczebności (częstości) ustala się w następujący sposób:

wskaźnik =

gdzie:

k - to liczebność danej klasy
i - to interwał klasy najwęższej
l - to interwał danej klasy [4]

Histogramy są stosowane głównie dla przedstawienia struktury zbiorowości (lub zjawiska),

a więc szeregów strukturalnych dotyczących cech jakościowych i ilościowych.

Wykresy podkreślające podstawowe cechy danej zbiorowości (lub zjawiska) muszą być precyzyjnie dostosowane do charakteru

tychże cech. Tak więc opisując przykładowo rozkład studentów według liczby dni spędzonych na nauce w danym okresie

czy rozkład zatrudnionych według liczby dni nie przepracowanych z powodu choroby w danym okresie

sporządzimy histogram. Nie możemy natomiast posłużyć się tym wykresem do opisania tendencji rozwojowej,

wahań sezonowych i przypadkowych (gdzie zaleca się stosowanie krzywej dynamiki)

czy opisania współzależności (którą należy przedstawić na wykresie korelacji)[5].

Budowa histogramu

Histogram podobnie jak pozostałe wykresy statystyczne składa się z kilku części:
  • pola
  • wykresu
  • skali (aby ułatwić czytanie wykresu, stosuje się nieraz, zwłaszcza w prostokątnym układzie współrzędnych, dwie jednakowe skale na obu krańcach obrazu graficznego,

tj skalę poziomą oraz dwie skale pionowe po lewej i po prawej stronie pola wykresu)

  • tytułu (w wykresach popularyzacyjnych tytuł należy umieścić nad obrazem graficznym, natomiast w publikacjach można go umieścić również pod rysunkiem)
  • legendy
  • źródła (jeżeli obok wykresu w tej samej publikacji zamieszczamy tablicę statystyczną z danymi liczbowymi i opatrzona jest ona opisem źródła informacji, wystarczy pod wykresem wymienić jako źródło numer kolejny tej tablicy) i innych objaśnień.[6]

Podstawą sporządzania histogramu opisującego prawidłowości występujące w zbiorowościach (zjawiskach)

jest układ współrzędnych prostokątnych, przy czym główną uwagę należy skupić na doborze skali

i precyzyjnym obrazie graficznym, a nie na opisie wykresu i jego atrakcyjności.

Szczególną postacią histogramu jest 'histogram kumulacyjny'. Na osi odciętych w prostokątnym układzie

współrzędnych odkłada się wówczas liczebności skumulowane [4].

Jak przygotować histogram

Przygotowanie histogramu składa się z kilku etapów tj:

  1. Zebranie wyników pomiarowych
    1. Należy pamiętać, aby odbrać próbkę w sposób losowy
    2. Upewnić się, że metoda pomiaru danej cechy jest poprawna
  2. Ustalenie ilości przedziałów (klas)
    1. liczba klas (k) zależy od liczebności badanej zbiorowości (n) i w przybliżeniu ustalamy ją jako:
  3. Obliczenie szerokości przedziałów
    1. Rozpiętość przedziałów ustalamy na podstawie różnicy między najwyższą ( i najniższą )
wartością cechy (tzw. rozstęp), podzielonej przez liczbą klas:

Szereg jest zawsze bardziej przejrzysty, jeżeli możliwe jest przyjęcie rozpiętości przedziałów w postaci liczby 5, 10, 50, 100 itd.

  1. Ustalenie dolnej granicy pierwszego przedziału jako:
,
stąd znajdzie się w środku pierwszego przedziału.
  1. określenie ilości obserwacji w danym przedziale

W przypadku nierównych przedziałów klasowych przy konstruowaniu histogramu należy pamiętać

o następujących zasadach:

  • na osi przedziałów klasowych odkładamy szerokości poszczególnych kolumn proporcjonalnie do rozpiętości przedziału klasowego,
  • wysokości kolumn zmniejszamy lub zwiększamy w stosunku odwrotnie proporcjonalnym do stopnia zmniejszenia lub zwiększenia

szerokości kolumn [7].

Przykładowy histogram

Przykład histogramu.gif

Rys. 1. Przykład histogramu

źródło: opracowanie własne na podstawie danych Rocznika statystycznego GUS 1993, s. 46

Typy histogramów

Kształt histogramu jest kluczowym elementem bowiem podkreśla rodzaj informacji bądź zaburzeń. Wyróżniamy kilka rodzajów histogramów :
  • Typ podstawowy - charakteryzuje się systematycznym kształtem przypominającym zarys dzwonu,
    Rys. 2 Typ podstawowy
    a jego wartość średnia znajduje się w centralnej jego części. Ten typ sugerować może rozkład normalny, a w konsekwencji prawdopodobnie występowanie jednej przyczyny, która wpływa na jego zmienność.
  • Typ grzebieniowy - z tego typu wykresem mamy do czynienia gdy nie ma wyraźnego jednego wzniesienia,
    Rys. 3 Typ grzebieniowy
    lecz wysokości danych słupków są naprzemiennie duże bądź małe przypominające kształtem grzebień. Taka różnorodność ich wysokości może świadczyć o występowaniu kilku przyczyn zmienności histogramu.
  • Typ asymetryczny - charakteryzuje go występowanie wartości średniej wyraźnie po jednej
    Rys. 4 Typ asymetryczny
    ze stron rozkładu, w której skupia się większość obserwacji. Ten histogram ma miejsce wtedy gdy chcemy utrzymać dolną bądź górną granicę tolerancji (może być wyznaczona odgórnie lub określona teoretycznie).
  • Typ jednostronny - cechuje się tym iż wartość średnia znajduje się w przedziale granicznym.
    Rys. 5 Typ jednostronny
    Podkreśla wytypowanie bądź eliminację wartości, które znajdują się ponad bądź poniżej pewnej granicy.
  • Typ kopca - charakteryzuje się skupieniem zbliżonych częstości w przedziałach
    Rys. 6 Typ kopca
    znajdujących się pośrodku oraz spadających ich wartości bliżej granic danego rozkładu. Taki histogram świadczy o występowaniu kilku podobnych co do wartości zbiorów, które posiadają różniące się wartości średnie.
  • Typ siodła - występują tu dwie wartości modalne (dominanty, mody), czyli wartości najczęstsze.
    Rys. 7 Typ siodła
    Przedstawia połączenie dwóch rozkładów posiadających odmienne wartości średnich i przedstawia odchylenia, które są łatwe w zidentyfikowaniu.
  • Typ z izolowanym pagórkiem - najczęściej występuje w przypadku zmieszania różnych
    Rys. 8 Typ z izolowanym pagórkiem
    rozkładów o odmiennych parametrach. Charakterystyczny jest dla niego "pagórek" znacznie wyższy od pozostałości słupków i wyróżniający się na tle całego wykresu.
  • Typ bez wartości skrajnych - z tym typem wykresu możemy się spotkać, gdy poprzednia
    Rys. 9 Typ bez wartości skrajnych
    selekcja innego rozkładu już się odbyła i zostały usunięte w niej wartości skrajne [8].


Histogramartykuły polecane
Wykres słupkowyMetody statystyczneAnaliza regresjiKwartylANOVARozkład normalnySkala porządkowaWykres pudełkowyAnaliza przyczynowa

Przypisy

  1. E.Siwek 2002
  2. B.Detyna 2011, s.137
  3. Frąś J. 2011, s. 377
  4. 4,0 4,1 M.Sobczyk 2005, 29s.
  5. M.Krzysztofiak, A. Luszniewicz 1976, s. 58
  6. K.Zając 1982, s. 128
  7. K.Kocimowski, J.Kwiatek 1976, s. 27
  8. M.Wiśniewska 2014, s.53-54

Bibliografia

  • Detyna B. (2011), Zarządzanie jakością w logistyce, Wydawnictwo Państwowej Szkoły Zawodowej im. Angelusa Silesiusa, Wałbrzych
  • Frąś J., Siwkowski M. (2011), Metody i techniki zarządzania jakością, Finanse, rynki finansowe, ubezpieczenia nr 46
  • Kocimowski K., Kwiatek J. (1976), Wykresy i mapy statystyczne, GUS, Warszawa
  • Krzysztofiak M., Luszniewicz A. (1976), Statystyka, PWE, Warszawa
  • Siwek E. (2002), Słownik encyklopedyczny, Cykada, Katowice
  • Sobczyk M. (2007), Statystyka, Wydawnictwo Naukowe PWN, Warszawa
  • Wiśniewska M. (2014), Zarządzanie jakością i innowacyjność w świetle doświadczeń organizacji Pomorza, InnoBaltica, Gdańsk
  • Zając K. (1994), Zarys metod statystycznych, Wydawnictwo PWE, Warszawa


Autor: Bernadeta Nowacka, Karolina Walczyk