D Somersa
D Somersa (Delta Somersa) – jedna z miar zależności, badająca siłę związku pomiędzy zmiennymi porządkowymi. Nazwana jest na cześć amerykańskiego socjologa i statystyka Roberta Somersa, który zaproponował ją w 1962 roku[1].
Definicja[edytuj | edytuj kod]
D Somersa można zdefiniować z wykorzystaniem miary tau Kendalla (). Dla dwóch zmiennych: X i Y, nazywanej zależną, D Somersa wynosi[2]:
Wykorzystanie[edytuj | edytuj kod]
W praktyce D Somersa wykorzystuje się najczęściej w sytuacji, gdy zmienna Y jest zmienną dychotomiczną (zero-jedynkową). W takiej sytuacji D jest przekształceniem liniowym pola pod krzywą ROC (AUC):
- .
i można je zinterpretować następująco: jeżeli wylosujemy dwie obserwacje, jedną spośród obserwacji spełniających warunek Y=1 z odpowiadającą jej wartością X1 i drugą z grupy Y=0 z odpowiadającą jej wartością X0, to D jest różnicą prawdopodobieństw[2]:
- .
W praktyce bankowych modeli scoringowych D Somersa znane jest pod nazwą statystyki Giniego[3].
Przypisy[edytuj | edytuj kod]
- ↑ Andrew Colman , A Dictionary of Psychology, Oxford University Press, 2015, s. 714, ISBN 978-0-19-105784-7 [dostęp 2024-04-20] (ang.).
- ↑ a b Roger Newson , Parameters behind “Nonparametric” Statistics: Kendall's tau, Somers’ D and Median Differences, „The Stata Journal: Promoting communications on statistics and Stata”, 2 (1), 2002, s. 45–64, DOI: 10.1177/1536867X0200200103, ISSN 1536-867X [dostęp 2024-04-20] (ang.).
- ↑ Karol Przanowski , Credit scoring. Studia przypadków procesów biznesowych, 2015 (pol.).