Przejdź do zawartości

Pseudo R-kwadrat

Z Wikipedii, wolnej encyklopedii

Pseudo R-kwadrat – ogólna nazwa miar dopasowania stosowanych do oceny modelu regresji, w którym zmienna objaśniana jest nominalna lub porządkowa, w związku z czym współczynnik determinacji R2 nie może być zastosowany.

W przypadku regresji logistycznej stosuje się kilka konkurencyjnych miar, z których każda ma swoje ograniczenia[1]. Należą do nich między innymi:

  • Pseudo R-kwadrat Coxa i Snella
  • Pseudo R-kwadrat Nagelkerke'a (Cragga-Uchlera)
  • Pseudo R-kwadrat McFaddena

Pseudo R-kwadrat Coxa-Snella[edytuj | edytuj kod]

Pseudo R-kwadrat Coxa-Snella wyraża się następującym wzorem:

gdzie to liczebność próby, zaś i to funkcje wiarygodności odpowiednio dla modelu zerowego (zawierającego jedynie wyraz wolny) i modelu ocenianego. Miara Coxa-Snella jest problematyczna ze względu na to, że jej maksymalna wartość , która jest osiągana gdy analizowany model przewiduje zmienną objaśnianą w sposób doskonały, może być wyraźnie mniejsza niż 1[2].

Pseudo R-kwadrat Nagelkerke'a[edytuj | edytuj kod]

Miara pseudo R-kwadrat Nagelkerke'a, znana również pod nazwą pseudo R-kwadrat Cragga-Uchlera[2] jest modyfikacją miary , tak żeby jej wartość maksymalna wynosiła 1:

Pseudo R-kwadrat McFaddena[edytuj | edytuj kod]

Miara pseudo R-kwadrat McFaddena opiera się na logarytmie funkcji wiarygodności i jest zdefiniowana w następujący sposób[3]:

Przypisy[edytuj | edytuj kod]

  1. Paul D. Allison: Measures of fit for logistic regression.
  2. a b Andrzej Stanisz, Modele regresji logistycznej: zastosowanie w medycynie, naukach przyrodniczych i społecznych, Kraków: Wydawnictwo StatSoft Polska, 2016, s. 255-261, ISBN 978-83-88724-73-2 [dostęp 2024-05-27].
  3. Michał Rubaszek i inni, Skrypt do przedmiotu Ekonometria I [online], Szkoła Główna Handlowa w Warszawie, 2020 [dostęp 2024-05-27] (pol.).