1 Analiza współzależności dwóch zjawiskdr inż. Iwona Staniec Zakład Metod Ilościowych w Zarządzaniu Politechniki Łódzkiej
2 Analiza współzależnościPunktem wyjściowym do badania współzależności cech są dane, w których dla każdej jednostki statystycznej określono wartości dwóch cech: X i Y. Mamy więc zbiór n jednostek i przyporządkowane im pary cech (xi, yi), i = 1, 2, ... n.
3 Szereg szczegółowy dla dwóch obserwowanych cech
4 Tablica korelacyjna
5 Przykład
6 Dane pogrupowane w tabeli korelacyjnej
7 Współzależność występująca między cechami może być dwojakiego rodzaju:funkcyjna (dokładna) stochastyczna (probabilistyczna). Szczególnym przypadkiem zależności stochastycznej jest zależność korelacyjna (statystyczna).
8 Przy badaniu współzależności cech przyjmuje się zwykle jedną cechę za niezależną (objaśniającą), której zmienność jest uwarunkowana czynnikami zewnętrznymi, a drugą za zmienną zależną (objaśnianą), tzn. jej wahania próbuje się wyjaśnić (przynajmniej częściowo) zmiennością cechy niezależnej. Zależność korelacyjna może być obustronna lub jednostronna.
9
10
11 Dwie cechy mierzalne 1. Kowariancjadla szeregu szczegółowego dla szeregu w tablicy korelacyjnej
12 Kowariancja Jest to: miara symetryczna;przyjmuje wartości z przedziału <‑SxSy, SxSy>; informuje o kierunku korelacji między zmiennymi.
13 Współczynnik korelacji liniowej Pearsona:Jest to: miara symetryczna; przyjmuje wartości z przedziału <‑1,1>; informuje o sile oraz kierunku korelacji liniowej między zmiennymi. Dwie cechy mierzalne
14 Kierunek zależności rxy= 0 świadczy o braku korelacji liniowej między badanymi cechami (możliwe, że istnieje między nimi korelacja krzywoliniowa!), rxy> 0 informuje nas, że mamy do czynienia z korelacją dodatnią (wraz ze wzrostem wartości jednej cechy wzrasta średnia warunkowa drugiej), rxy< 0 korelacja jest ujemna (wzrostowi wartości jednej cechy towarzyszy spadek średniej warunkowej drugiej). przy rxy= 1 lub -1 mamy liniową zależność funkcyjną.
15 W analizach statystycznych zwykle przyjmuje się, że jeżeli rxy wynosi:mniej niż 0,2 - praktycznie brak związku liniowego między badanymi cechami, może występować korelacja krzywoliniowa; <0,2-0,4) - zależność liniowa wyraźna, lecz niska; <0,4-0,7) - zależność umiarkowana; <0,7-0,9) - zależność znacząca; <0,9-1> zależność bardzo silna.
16 Współczynnik determinacji liniowejR2=rxy2 podaje, jaka część zmienności cechy zależnej jest wyjaśniona zmiennością cechy niezależnej. Dwie cechy mierzalne
17 3. Współczynnik korelacji kolejnościowej (rang) Spearmana Rxymiara korelacji, wygodna i użyteczna dla niezbyt długich szeregów szczegółowych z dwoma cechami mierzalnymi (lub przynajmniej posiadającymi pewien naturalny porządek pozwalający na ustawienie wartości rosnąco lub malejąco) . Wartość Rxy należy do przedziału <-1,1> i mówi o sile oraz kierunku korelacji. Dwie cechy mierzalne
18 Współczynnik rang Spearmana Rxygdzie di są różnicami między kolejnymi numerami (rangami) nadawanymi w kolejności niemalejącej (lub nierosnącej) osobno dla każdej cechy od 1 do n. Jeżeli kilka elementów w szeregu ma taką samą wartość jednej cechy, to nadaje im się rangi będące średnią arytmetyczną przypadających na te elementy rang.
19 Dwie cechy niemierzalne, dwie cechy mierzalne, cecha niemierzalna i cecha mierzalnaWspółczynnik zbieżności Czuprowa
20 Współczynnik zbieżności CzuprowaWymaga ona danych pogrupowanych w tablicy korelacyjnej