1 Korelacje, regresja liniowaLiniowe współzależności pomiędzy zmiennymi Korelacje, regresja liniowa
2 KORELACJA LINIOWA PEARSONAKorelacja: miara powiązania pomiędzy dwiema lub większą liczbą zmiennych Wartość współczynnika korelacji liniowej Pearsona: z przedziału od -1 do +1 Wartość -1 reprezentuje doskonałą korelację ujemną Wartość +1 reprezentuje doskonałą korelację dodatnią Wartość 0 wyraża brak korelacji.
3 WYMOGI Normalność rozkładów zmiennych Liniowość zależności
4 KORELACJA LINIOWA PEARSONA
5 KORELACJA LINIOWA PEARSONAZależność wprostproporcjonalna Zależność odwrotnie proporcjonalna
6 KORELACJA LINIOWA PEARSONAR2 – współczynnik determinacji: wartość r Pearsona podniesiona do kwadratu Wyraża proporcję wspólnej zmienności dwóch zmiennych (tzn. siłę lub wielkość powiązania).
7 KORELACJA LINIOWA PEARSONAAby ocenić korelację pomiędzy zmiennymi należy znać: wartość r (siła korelacji) znak +/- przy r (zależność wprost/odwrotnie proporcjonalna) poziom istotności p współczynnika r (określa, czy korelacje jest/nie jest statystycznie istotna)
8 KORELACJA LINIOWA PEARSONAMacierze korelacji: tabela współczynników korelacji pomiędzy wieloma zmiennymi jedna lista zmiennych -> kwadratowa macierz korelacji (każdy z każdym) dwie listy zmiennych -> prostokątna macierz korelacji
9 REGRESJA LINIOWA Regresja liniowa jest rozszerzeniem korelacji liniowej i pozwala na: graficzną prezentację linii prostej dopasowanej do wykresu rozrzutu określenie równania opisujące zależność dwóch zmiennych w postaci y = a * x + b zmienna zależna współczynnik kierunkowy prostej zmienna niezależna wyraz wolny
10 REGRESJA LINIOWA Równanie regresji liniowejStatystyki dopasowania liniowego Przedział ufności
11 Równanie regresji liniowejREGRESJA LINIOWA Równanie regresji liniowej O2 ROZP = – 0.11*TEMP y = a*x +b
12 REGRESJA LINIOWA W jaki sposób wyznaczana jest linia regresji liniowej? przez minimalizację sumy kwadratów odchyleń punktów doświadczalnych od linii regresji
13 REGRESJA LINIOWA
14 KORELACJA LINIOWA PEARSONA / REGRESJA LINIOWAZagrożenia wiarygodności wniosków: problem obserwacji odstających inny kształt zależności
15 KORELACJA LINIOWA PEARSONA / REGRESJA LINIOWAObserwacje odstające: wartości nietypowe, występujące rzadko punkty nie pokrywające się z rozkładem pozostałych danych mogą odzwierciedlać rzeczywiste własności badanego zjawiska LUB być tylko anomalią, błędem pomiarowym
16 KORELACJA LINIOWA PEARSONA / REGRESJA LINIOWAObserwacje odstające: mają duży wpływ na współczynnik kierunkowy linii regresji i w konsekwencji na wartość współczynnika korelacji Nawet jedna obserwacja odstająca może poważnie zmienić współczynnik korelacji. - sztucznie zwiększyć lub zmniejszyć jego wartość.
17 KORELACJA LINIOWA PEARSONA / REGRESJA LINIOWAObserwacje odstające- jak z nimi postępować?: wyklucza się obserwację, która wychodzi poza przedział obejmujący ±2 odchylenia standardowe (lub nawet ±1,5 odchylenia standardowego) od wartości średniej Zdefiniowanie tego, co uznajemy za obserwację odstającą, jest sprawą subiektywną i decyzję o identyfikacji odstających obserwacji musi badacz podejmować opierając się na swoim doświadczeniu oraz powszechnie akceptowanej praktyce w danej dziedzinie badań.
18 KORELACJA LINIOWA PEARSONA / REGRESJA LINIOWAObserwacje odstające- jak z nimi postępować?: przekształcenie log(x+1) Ogranicza ono rozrzut zmiennych, eliminuje wpływ wartości dominujących, błędów pomiarowych
19 KORELACJA LINIOWA PEARSONA / REGRESJA LINIOWAKształt zależności: Odstępstwa od liniowości spowodują wzrost sumy kwadratów odchyleń od linii regresji, nawet jeśli reprezentują one prawdziwy i ścisły związek dwóch zmiennych Analizowanie wykresów rozrzutu jest niezbędnym elementem analizy przy obliczaniu korelacji i regresji liniowej
20 KORELACJA LINIOWA PEARSONA / REGRESJA LINIOWA