Współczynnik determinacji: Różnice pomiędzy wersjami

Z Encyklopedia Zarządzania
m (Infobox update)
 
m (cleanup bibliografii i rotten links)
 
(Nie pokazano 16 wersji utworzonych przez 3 użytkowników)
Linia 1: Linia 1:
{{infobox4
'''Współczynnik determinacji''' informuje o tym, jak część zmian zmiennej objaśnianej jest wyjaśniona przez zmiany zmiennej
|list1=
objaśniającej (D. Chudy - Hyski 2006, s. 138). Inaczej mówiąc, pokazuje jaki procent zmiennej zależnej (objaśnianej) jest wyjaśniany za pomocą zmiennej niezależnej (czynnik [[zmienna]] objaśniająca). Głównie można się z nim spotkać w statystyce i ekonometrii. Oznaczany jest jako '''<math> R^2 \,</math>'''. Można go przedstawić za pomocą poniższego wzoru:
<ul>
 
<li>[[Rozkład normalny]]</li>
<math>R^2 = \frac{ \sum_{t=1}^n ( \hat{y_t} - \bar{y} )^2 }{ \sum_{t=1}^n ( y_t - \bar{y} )^2 }</math>
<li>[[Średnia geometryczna]]</li>
<li>[[Błąd bezwzględny]]</li>
<li>[[Skala interwałowa]]</li>
<li>[[Błąd względny]]</li>
<li>[[ANOVA]]</li>
<li>[[Analiza regresji]]</li>
<li>[[Estymator nieobciążony]]</li>
<li>[[Histogram]]</li>
</ul>
}}


gdzie:


<math> R^2 \,</math> - współczynnik determinacji


'''Współczynnik determinacji''' informuje o tym, jak część zmian zmiennej objaśnianej jest wyjaśniona przez zmiany zmiennej
<math> y_t \,</math> - rzeczywista [[wartość]] zmiennej zależnej
objaśniającej (D. Chudy - Hyski 2006, s. 138). Inaczej mówiąc, pokazuje jaki procent zmiennej zależnej (objaśnianej) jest wyjaśniany za pomocą zmiennej niezależnej (czynnik zmienna objaśniająca). Głównie można się z nim spotkać w statystyce i ekonometrii. Oznaczany jest jako '''<math> R^2 \,</math>'''. Można go przedstawić za pomocą poniższego wzoru:


  <math> R^2 = \frac{ \sum_{t=1}^n (\hat y_t \ - \bar y \)^2 }{ \sum_{t=1}^n (y_t - \bar y \)^2 }</math>
<math> \hat y_t \,</math> - przewidywana wartość zmiennej zależnej


gdzie: <br>
<math> R^2 \,</math> - współczynnik determinacji<br>
<math> y_t \,</math> - rzeczywista wartość zmiennej zależnej <br>
<math> \hat y_t \,</math> - przewidywana wartość zmiennej zależnej <br>
<math> \bar y \,</math> - średnia wartość rzeczywistej zmiennej zależnej
<math> \bar y \,</math> - średnia wartość rzeczywistej zmiennej zależnej
<google>t</google>


== Wartość współczynnika determinacji ==
==TL;DR==
"Współczynnik determinacji przyjmuje wartości z przedziału [0, 1] oraz udowadnia, że im większa jest wyjaśniona modelem zmienność zmiennej objaśnianej tym bliższa jedności jest wartość współczynnika <math> R^2 \,</math>" (B. Borkowski, H. Dudek, W. Szczesny 2007, s. 43). Wynika z tego fakt, iż im wyższe będzie <math> R^2 \,</math> tym dokładniejsze będą nasze prognozy. Wartości współczynnika opisują w swojej książce Amir D. Aczel i Jayavel Sounderpandian, pisząc: "Wartość <math> R^2 \,</math> powyżej 0,9 można uważać za bardzo dobrą, powyżej 0,8 - za dobrą, a powyżej 0,6 - za zadowalającą w niektórych zastosowaniach, choć w tym ostatnim przypadku musimy liczyć się ze stosunkowo dużymi błędami prognozy; Gdy <math> R^2 \,</math> jest poniżej 0,5, to [[regresja]] wyjaśnia tylko mniej niż 50% zmienności ''Y''; prognozy mogą okazać się nietrafne; Jeżeli chcemy tylko zrozumieć związki między zmiennymi, to niższe wartości <math> R^2 \,</math> są do przyjęcia, ale musimy zdawać sobie sprawę, że model regresji niewiele wtedy wyjaśnia" (A. D. Aczel, J. Sounderpandian 2018, s. 637 - 638). Z kolei "im większa będzie liczba zmiennych objaśniających tym nie mniejsza będzie wartość współczynnika determinacji" (A. Nowak - Brzezińska 2018, s. 97). Jednak nie można jedynie za pomocą tego współczynnika określić jakości modelu, ponieważ jest on jedynie jedną z kilku miar jakości modelu, stąd też należy przy badaniu wziąć też pod uwagę inne czynniki. Opisane zostało to w książce pod redakcją m.in. M. Gruszczyńskiego "Należy pamiętać, że współczynnik <math> R^2 \,</math> stanowi wewnątrzpróbowe kryterium oceny dopasowania modelu; Jego konstrukcja uwzględnia jedynie te obserwacje, które należą do próby, a zatem nie daje informacji o wartości prognostycznej modelu" (M. Gruszczyński, T. Kuszewski, M. Podgórska 2009, s. 52).  
Współczynnik determinacji (R^2) informuje o tym, jak duża część zmian zmiennej objaśnianej jest wyjaśniana przez zmiany zmiennej objaśniającej. Im wyższa wartość R^2, tym dokładniejsze prognozy. Wartości R^2 powyżej 0,9 są uważane za bardzo dobre, powyżej 0,8 za dobre, a powyżej 0,6 za zadowalające. Jednak R^2 nie jest jedynym kryterium oceny modelu, należy uwzględnić inne czynniki. Współczynnik determinacji może prowadzić do efektu katalizy, gdzie wartość R^2 jest wysoka, ale powiązania między zmiennymi nie uzasadniają tego wyniku. R^2 jest wykorzystywany przy analizach statystycznych, m.in. do porównywania modeli i określania, które zmienne najlepiej wyjaśniają zmienną zależną. Może być również stosowany w innych dziedzinach nauki, takich jak medycyna.


== Efekt katalizy ==
<google>n</google>
 
==Wartość współczynnika determinacji==
"Współczynnik determinacji przyjmuje wartości z przedziału [0, 1] oraz udowadnia, że im większa jest wyjaśniona modelem zmienność zmiennej objaśnianej tym bliższa jedności jest wartość współczynnika <math> R^2 \,</math>" (B. Borkowski, H. Dudek, W. Szczesny 2007, s. 43). Wynika z tego fakt, iż im wyższe będzie <math> R^2 \,</math> tym dokładniejsze będą nasze prognozy. Wartości współczynnika opisują w swojej książce Amir D. Aczel i Jayavel Sounderpandian, pisząc: "Wartość <math> R^2 \,</math> powyżej 0,9 można uważać za bardzo dobrą, powyżej 0,8 - za dobrą, a powyżej 0,6 - za zadowalającą w niektórych zastosowaniach, choć w tym ostatnim przypadku musimy liczyć się ze stosunkowo dużymi błędami prognozy; Gdy <math> R^2 \,</math> jest poniżej 0,5, to [[regresja]] wyjaśnia tylko mniej niż 50% zmienności ''Y''; prognozy mogą okazać się nietrafne; Jeżeli chcemy tylko zrozumieć związki między zmiennymi, to niższe wartości <math> R^2 \,</math> są do przyjęcia, ale musimy zdawać sobie sprawę, że [[model]] regresji niewiele wtedy wyjaśnia" (A. D. Aczel, J. Sounderpandian 2018, s. 637-638). Z kolei "im większa będzie liczba zmiennych objaśniających tym nie mniejsza będzie wartość współczynnika determinacji" (A. Nowak-Brzezińska 2018, s. 97). Jednak nie można jedynie za pomocą tego współczynnika określić jakości modelu, ponieważ jest on jedynie jedną z kilku miar jakości modelu, stąd też należy przy badaniu wziąć też pod uwagę inne czynniki. Opisane zostało to w książce pod redakcją m.in. M. Gruszczyńskiego "Należy pamiętać, że współczynnik <math> R^2 \,</math> stanowi wewnątrzpróbowe kryterium oceny dopasowania modelu; Jego konstrukcja uwzględnia jedynie te obserwacje, które należą do próby, a zatem nie daje informacji o wartości prognostycznej modelu" (M. Gruszczyński, T. Kuszewski, M. Podgórska 2009, s. 52).
 
==Efekt katalizy==
Omawiany współczynnik ze względu na zmienność jego wartości przez ilość i związek między badanymi zmiennymi doprowadza czasem do pewnych zjawisk. Jednym z nich jest najczęściej omawiany w polskich literaturach '''efekt katalizy'''. Co to takiego? Jest to efekt dający możliwość otrzymania wysokiej wartości współczynnika determinacji mimo że charakter i siła powiązań zmiennych objaśniających i zmiennej objaśnianej nie uzasadniają takiego wyniku. Efekt katalizy może wystąpić tam, gdzie występuje zmienna, czyli '''katalizator
Omawiany współczynnik ze względu na zmienność jego wartości przez ilość i związek między badanymi zmiennymi doprowadza czasem do pewnych zjawisk. Jednym z nich jest najczęściej omawiany w polskich literaturach '''efekt katalizy'''. Co to takiego? Jest to efekt dający możliwość otrzymania wysokiej wartości współczynnika determinacji mimo że charakter i siła powiązań zmiennych objaśniających i zmiennej objaśnianej nie uzasadniają takiego wyniku. Efekt katalizy może wystąpić tam, gdzie występuje zmienna, czyli '''katalizator
'''.  
'''.


== Zastosowanie <math> R^2 \,</math> ==
==Zastosowanie <math> R^2 \,</math>==
Współczynnik determinacji wykorzystywany jest przy analizach:
Współczynnik determinacji wykorzystywany jest przy analizach:
* daje nam informację, na ile nasze badanie (nasz założony czynnik) wyjaśnia to co chcemy mierzyć
* daje nam informację, na ile nasze badanie (nasz założony czynnik) wyjaśnia to co chcemy mierzyć
* służy określeniu, na ile poszczególne modele statystyczne, czynniki "dobrze" wyjaśniają to co chcemy wyjaśnić, która ze zmiennych (jeżeli badamy w badaniu kilka) lepiej wyjaśnia zmienną zależną
* służy określeniu, na ile poszczególne [[modele]] statystyczne, czynniki "dobrze" wyjaśniają to co chcemy wyjaśnić, która ze zmiennych (jeżeli badamy w badaniu kilka) lepiej wyjaśnia zmienną zależną
* jest miarą najczęściej stosowaną w modelu statystycznym czy ekonometrycznym niż w zwykłej analizie korelacji
* jest miarą najczęściej stosowaną w modelu statystycznym czy ekonometrycznym niż w zwykłej analizie korelacji
* pozwala oszacować, który z analizowanych modeli jest lepszy
* pozwala oszacować, który z analizowanych modeli jest lepszy
Skoro używa się tej miary przy analizie statystycznej, to można ją wykorzystać wykonując statystyki w różnych dziedzinach nauki. Chociażby w medycynie. Ciekawym przypadkiem jest dokonanie takiej analizy przy badaniu poziomu lęku a natężeniem depresji w okresie przedoperacyjnym i po zabiegu rewaskularyzacji mięśnia sercowego. Na podstawie badania stwierdzono, m.in. dzięki współczynnikowi <math> R^2 \,</math>, jakie natężenie i czy istnieje związek między lękiem a depresją przed i po zabiegu (A. Pawlak i wsp. 2012, s. 63-74).
Skoro używa się tej miary przy analizie statystycznej, to można ją wykorzystać wykonując statystyki w różnych dziedzinach nauki. Chociażby w medycynie. Ciekawym przypadkiem jest dokonanie takiej analizy przy badaniu poziomu lęku a natężeniem depresji w okresie przedoperacyjnym i po zabiegu rewaskularyzacji mięśnia sercowego. Na podstawie badania stwierdzono, m.in. dzięki współczynnikowi <math> R^2 \,</math>, jakie natężenie i czy istnieje związek między lękiem a depresją przed i po zabiegu (A. Pawlak i wsp. 2012, s. 63-74).


== Bibliografia ==
{{infobox5|list1={{i5link|a=[[Rozkład normalny]]}} &mdash; {{i5link|a=[[Średnia geometryczna]]}} &mdash; {{i5link|a=[[Błąd bezwzględny]]}} &mdash; {{i5link|a=[[Skala interwałowa]]}} &mdash; {{i5link|a=[[Błąd względny]]}} &mdash; {{i5link|a=[[ANOVA]]}} &mdash; {{i5link|a=[[Analiza regresji]]}} &mdash; {{i5link|a=[[Estymator nieobciążony]]}} &mdash; {{i5link|a=[[Histogram]]}} &mdash; {{i5link|a=[[Materializm historyczny]]}} }}
* Aczel A. D., Sounderpandian J. (2018). ''Statystyka w zarządzaniu'' Wydawnictwo Naukowe PWN
 
* Borkowski B., Dudek H., Szczesny W. (2007). ''Ekonometria. Wybrane zagadnienia'' Wydawnictwo Naukowe PWN
==Bibliografia==
* Chudy - Hyski D. (2006). ''[http://www.infraeco.pl/pl/art/a_14325.htm?plik=135 Ocena wybranych uwarunkowań rozwoju funkcji turystycznej obszaru]'' Nr 2/1/2006, Polska Akademia Nauk, Oddział w Krakowie
<noautolinks>
* Gruszczyński M., Kuszewski T., Podgórska M. (2009). ''Ekonometria i badania operacyjne'' Wydawnictwo Naukowe PWN
* Aczel A. (2018), ''Statystyka w zarządzaniu'', Wydawnictwo Naukowe PWN, Warszawa
* Nowak - Brzezińska A. ''[http://zsi.tech.us.edu.pl/~nowak/odzw/PED_w2.pdf Klasyfikacja danych]'' Zakład Systemów Informatycznych, Uniwersytet Śląski
* Borkowski B., Dudek H., Szczęsny W. (2007), ''Ekonometria. Wybrane zagadnienia'', Wydawnictwo Naukowe PWN, Warszawa
* Pawlak A. i wsp. (2012). ''[http://www.psychiatriapolska.pl/uploads/images/PP_1_2012/Pawlak63_PP1_2012.pdf Ocena lęku i depresji w okresie okołooperacyjnym u pacjentów poddawanych rewaskularyzacji mięśnia sercowego]'' Psychiatria Polska, tom XLVI, numer 1
* Chudy-Hyski D. (2006), ''[http://www.infraeco.pl/pl/art/a_14325.htm?plik=135 Ocena wybranych uwarunkowań rozwoju funkcji turystycznej obszaru]'', Nr 2/1, Polska Akademia Nauk, Oddział w Krakowie
* Gruszczyński M., Kuszewski T., Podgórska M. (2009), ''Ekonometria i badania operacyjne'', Wydawnictwo Naukowe PWN, Warszawa
* Nowak-Brzezińska A. (2011), ''Klasyfikacja danych'', Zakład Systemów Informatycznych, Uniwersytet Śląski
</noautolinks>


{{a|Patrycja Rygiel}}
{{a|Patrycja Rygiel}}
[[Kategoria:Statystyka i Ekonometria]]
[[Kategoria:Miary statystyczne]]
 
{{#metamaster:description|Współczynnik determinacji to miara wyjaśniania zmiany jednej zmiennej przez drugą. Dowiedz się więcej na stronie encyklopedii.}}

Aktualna wersja na dzień 19:29, 18 sty 2024

Współczynnik determinacji informuje o tym, jak część zmian zmiennej objaśnianej jest wyjaśniona przez zmiany zmiennej objaśniającej (D. Chudy - Hyski 2006, s. 138). Inaczej mówiąc, pokazuje jaki procent zmiennej zależnej (objaśnianej) jest wyjaśniany za pomocą zmiennej niezależnej (czynnik zmienna objaśniająca). Głównie można się z nim spotkać w statystyce i ekonometrii. Oznaczany jest jako . Można go przedstawić za pomocą poniższego wzoru:

gdzie:

- współczynnik determinacji

- rzeczywista wartość zmiennej zależnej

- przewidywana wartość zmiennej zależnej

- średnia wartość rzeczywistej zmiennej zależnej

TL;DR

Współczynnik determinacji (R^2) informuje o tym, jak duża część zmian zmiennej objaśnianej jest wyjaśniana przez zmiany zmiennej objaśniającej. Im wyższa wartość R^2, tym dokładniejsze są prognozy. Wartości R^2 powyżej 0,9 są uważane za bardzo dobre, powyżej 0,8 za dobre, a powyżej 0,6 za zadowalające. Jednak R^2 nie jest jedynym kryterium oceny modelu, należy uwzględnić inne czynniki. Współczynnik determinacji może prowadzić do efektu katalizy, gdzie wartość R^2 jest wysoka, ale powiązania między zmiennymi nie uzasadniają tego wyniku. R^2 jest wykorzystywany przy analizach statystycznych, m.in. do porównywania modeli i określania, które zmienne najlepiej wyjaśniają zmienną zależną. Może być również stosowany w innych dziedzinach nauki, takich jak medycyna.

Wartość współczynnika determinacji

"Współczynnik determinacji przyjmuje wartości z przedziału [0, 1] oraz udowadnia, że im większa jest wyjaśniona modelem zmienność zmiennej objaśnianej tym bliższa jedności jest wartość współczynnika " (B. Borkowski, H. Dudek, W. Szczesny 2007, s. 43). Wynika z tego fakt, iż im wyższe będzie tym dokładniejsze będą nasze prognozy. Wartości współczynnika opisują w swojej książce Amir D. Aczel i Jayavel Sounderpandian, pisząc: "Wartość powyżej 0,9 można uważać za bardzo dobrą, powyżej 0,8 - za dobrą, a powyżej 0,6 - za zadowalającą w niektórych zastosowaniach, choć w tym ostatnim przypadku musimy liczyć się ze stosunkowo dużymi błędami prognozy; Gdy jest poniżej 0,5, to regresja wyjaśnia tylko mniej niż 50% zmienności Y; prognozy mogą okazać się nietrafne; Jeżeli chcemy tylko zrozumieć związki między zmiennymi, to niższe wartości są do przyjęcia, ale musimy zdawać sobie sprawę, że model regresji niewiele wtedy wyjaśnia" (A. D. Aczel, J. Sounderpandian 2018, s. 637-638). Z kolei "im większa będzie liczba zmiennych objaśniających tym nie mniejsza będzie wartość współczynnika determinacji" (A. Nowak-Brzezińska 2018, s. 97). Jednak nie można jedynie za pomocą tego współczynnika określić jakości modelu, ponieważ jest on jedynie jedną z kilku miar jakości modelu, stąd też należy przy badaniu wziąć też pod uwagę inne czynniki. Opisane zostało to w książce pod redakcją m.in. M. Gruszczyńskiego "Należy pamiętać, że współczynnik stanowi wewnątrzpróbowe kryterium oceny dopasowania modelu; Jego konstrukcja uwzględnia jedynie te obserwacje, które należą do próby, a zatem nie daje informacji o wartości prognostycznej modelu" (M. Gruszczyński, T. Kuszewski, M. Podgórska 2009, s. 52).

Efekt katalizy

Omawiany współczynnik ze względu na zmienność jego wartości przez ilość i związek między badanymi zmiennymi doprowadza czasem do pewnych zjawisk. Jednym z nich jest najczęściej omawiany w polskich literaturach efekt katalizy. Co to takiego? Jest to efekt dający możliwość otrzymania wysokiej wartości współczynnika determinacji mimo że charakter i siła powiązań zmiennych objaśniających i zmiennej objaśnianej nie uzasadniają takiego wyniku. Efekt katalizy może wystąpić tam, gdzie występuje zmienna, czyli katalizator .

Zastosowanie

Współczynnik determinacji wykorzystywany jest przy analizach:

  • daje nam informację, na ile nasze badanie (nasz założony czynnik) wyjaśnia to co chcemy mierzyć
  • służy określeniu, na ile poszczególne modele statystyczne, czynniki "dobrze" wyjaśniają to co chcemy wyjaśnić, która ze zmiennych (jeżeli badamy w badaniu kilka) lepiej wyjaśnia zmienną zależną
  • jest miarą najczęściej stosowaną w modelu statystycznym czy ekonometrycznym niż w zwykłej analizie korelacji
  • pozwala oszacować, który z analizowanych modeli jest lepszy

Skoro używa się tej miary przy analizie statystycznej, to można ją wykorzystać wykonując statystyki w różnych dziedzinach nauki. Chociażby w medycynie. Ciekawym przypadkiem jest dokonanie takiej analizy przy badaniu poziomu lęku a natężeniem depresji w okresie przedoperacyjnym i po zabiegu rewaskularyzacji mięśnia sercowego. Na podstawie badania stwierdzono, m.in. dzięki współczynnikowi , jakie natężenie i czy istnieje związek między lękiem a depresją przed i po zabiegu (A. Pawlak i wsp. 2012, s. 63-74).


Współczynnik determinacjiartykuły polecane
Rozkład normalnyŚrednia geometrycznaBłąd bezwzględnySkala interwałowaBłąd względnyANOVAAnaliza regresjiEstymator nieobciążonyHistogramMaterializm historyczny

Bibliografia

  • Aczel A. (2018), Statystyka w zarządzaniu, Wydawnictwo Naukowe PWN, Warszawa
  • Borkowski B., Dudek H., Szczęsny W. (2007), Ekonometria. Wybrane zagadnienia, Wydawnictwo Naukowe PWN, Warszawa
  • Chudy-Hyski D. (2006), Ocena wybranych uwarunkowań rozwoju funkcji turystycznej obszaru, Nr 2/1, Polska Akademia Nauk, Oddział w Krakowie
  • Gruszczyński M., Kuszewski T., Podgórska M. (2009), Ekonometria i badania operacyjne, Wydawnictwo Naukowe PWN, Warszawa
  • Nowak-Brzezińska A. (2011), Klasyfikacja danych, Zakład Systemów Informatycznych, Uniwersytet Śląski


Autor: Patrycja Rygiel