1 Parametry rozkładów Metodologia badań w naukach behawioralnych II
2 Średnia I K. Szymanek Metodologia badań II2 Średnia arytmetyczna może być zrozumiana lepiej za pomocą analogii ze środkiem ciężkości. Aby układ dwóch ciężarków na powyższym rysunku pozostał w równowadze, powinien być podparty w miejscu wskazanym strzałką. Miejsce to znajduje się w połowie odległości między ciężarkami. Średnia arytmetyczna może być zrozumiana lepiej za pomocą analogii ze środkiem ciężkości. Aby układ dwóch ciężarków na powyższym rysunku pozostał w równowadze, powinien być podparty w miejscu wskazanym strzałką. Miejsce to znajduje się w połowie odległości między ciężarkami.
3 Średnia II K. Szymanek Metodologia badań II3 Analogicznie: średnia arytmetyczna liczb 0 i 50 leży w połowie odległości między tymi liczbami. Podobnie jest z innymi liczbami… Analogicznie: średnia arytmetyczna liczb 0 i 50 leży w połowie odległości między tymi liczbami. Podobnie jest z innymi liczbami… 0 25 50
4 Średnia III K. Szymanek Metodologia badań II4 Średnia arytmetyczna liczb 10 i 16 leży dokładnie w połowie odległości między tymi liczbami. 10 13 16
5 Średnia IV K. Szymanek Metodologia badań II5 Średnia arytmetyczna liczb 1 i 2 leży w połowie odległości między tymi liczbami. Średnia arytmetyczna liczb 1 i 2 leży w połowie odległości między tymi liczbami. 1 1,5 2
6 Średnia V K. Szymanek Metodologia badań II6 Dołożenie ciężarka w punkcie równowagi nie zmienia położenia punktu równowagi. Analogicznie, dołączenie do zbioru liczb liczby równej średniej nie zmienia średniej całości. Przykład: średnia z 4 i 6 wynosi 5. Obliczmy średnią z 4, 5, 6: (4 +5 +6)/3 = 5. Średnia z 4, 5, 5, 6 też równa jest 5. Dołożenie ciężarka w punkcie równowagi nie zmienia położenia punktu równowagi. Analogicznie, dołączenie do zbioru liczb liczby równej średniej nie zmienia średniej całości. Przykład: średnia z 4 i 6 wynosi 5. Obliczmy średnią z 4, 5, 6: (4 +5 +6)/3 = 5. Średnia z 4, 5, 5, 6 też równa jest 5.
7 Średnia VI K. Szymanek Metodologia badań II7 Punkt równowagi znajduje się w 1/3 odległości między ciężarkami d 2 x d
8 Średnia VI K. Szymanek Metodologia badań II8 Średnia z 0, 0, 90 wynosi 30. 0 30 90 0
9 Średnia VI K. Szymanek Metodologia badań II9 Średnia z 100, 100, 130 wynosi 110. 100 110 130 100
10 K. Szymanek Metodologia badań II10 ABCDABCD Gdzie jest punkt równowagi – na rysunku A, B, C czy D?
11 K. Szymanek Metodologia badań II11 Suma odległości od średniej do wyników mniejszych od niej równa jest sumie odległości do wyników większych
12 K. Szymanek Metodologia badań II12 Suma odległości od średniej do wyników mniejszych od niej równa jest sumie odległości do wyników większych
13 Zadanie domowe (a) Obliczyć średnią m zespołu liczb: 8, 12, 12, 12, 13, 16, 17, 18, 18 (b) Obliczyć sumę X wszystkich odległości od liczb mniejszych od m do m (c) Obliczyć sumę Y wszystkich odległości od liczb większych od m do m (d) Zauważyć, że X = Y (a) Obliczyć średnią m zespołu liczb: 8, 12, 12, 12, 13, 16, 17, 18, 18 (b) Obliczyć sumę X wszystkich odległości od liczb mniejszych od m do m (c) Obliczyć sumę Y wszystkich odległości od liczb większych od m do m (d) Zauważyć, że X = Y K. Szymanek Metodologia badań II13
14 Mediana I 14K. Szymanek Metodologia badań II
15 Mediana II 15K. Szymanek Metodologia badań II
16 Mediana III 16K. Szymanek Metodologia badań II
17 Mediana III 17K. Szymanek Metodologia badań II
18 Mediana IV 18K. Szymanek Metodologia badań II
19 Mediana V Wielkość mediany zależy tylko od tego, ile wyników leży poniżej i powyżej jej wartości. Ich oddalenie nie wpływa na medianę: nie ma znaczenia, czy dany wynik jest tylko nieznacznie większy (mniejszy), czy też bardzo odbiega od mediany. Mówimy, że mediana nie jest czuła na obecność wyników ekstremalnych. Wielkość mediany zależy tylko od tego, ile wyników leży poniżej i powyżej jej wartości. Ich oddalenie nie wpływa na medianę: nie ma znaczenia, czy dany wynik jest tylko nieznacznie większy (mniejszy), czy też bardzo odbiega od mediany. Mówimy, że mediana nie jest czuła na obecność wyników ekstremalnych. 19K. Szymanek Metodologia badań II
20 Mediana i średnia 20K. Szymanek Metodologia badań II
21 Mediana i średnia 21K. Szymanek Metodologia badań II
22 Mediana i średnia 22K. Szymanek Metodologia badań II
23 Mediana i średnia 23K. Szymanek Metodologia badań II
24 Mediana i średnia Średnia, w odróżnieniu od mediany, jest wrażliwa na lokalizację każdego wyniku. Nowy wynik zmienia ją tym bardziej, im bardziej jest od niej odległy. Ponieważ średnia odzwierciedla wszystkie wyniki, więc mają na nią wpływ wyniki ekstremalne, przez co czasami obraz rzeczywistości może być przez średnią zniekształcony. K. Szymanek Metodologia badań II24
25 Przykład W pewnym zakładzie pracy zatrudnionych jest 7 pracowników. Ich zarobki miesięczne (w tys. zł) są następujące: K. Szymanek Metodologia badań II25 1,0 1,5 1,8 2,0 2,2 50,0 m = 9,6 me = 2,0 Który parametr lepiej opisuje wielkość zarobków?
26 Przykład W Polsce średni zarobek w 2012 wynosił 3,7 tys. zł | mediana 2,9 tys. zł Niewielka grupa Polaków zarabia bardzo dużo, co podwyższa średnią, ale nie wywiera wyraźnego wpływu na medianę. Rozkład liczebności zarobków w Polsce jest prawostronnie skośny (dodatnio skośny). Pojęcie skośności będzie omówione dalej. K. Szymanek Metodologia badań II26
27 Mediana czy średnia? (a)Czas na 100 m osiągany przez zawodników biorących udział w sztafecie (b)Umiejętność udzielania pierwszej pomocy ofiarom wypadków przez kierowców (c)Wiedza o świecie nabywana przez uczniów w szkołach (d)Wielkość szkód powodowanych przez ubezpieczonych (z punktu widzenia firmy ubezpieczeniowej) K. Szymanek Metodologia badań II27
28 Mediana czy średnia? W praktyce badań społecznych średnia pojawia się dużo częściej niż mediana. Powody tego są następujące: (a)średnia odzwierciedla dokładniej zbiór wyników, co skutkuje większą precyzją np. wniosków (b)średnia jest bardziej od mediany podatna na operacje matematyczne (c)za pomocą średniej formułuje się prawa statystyki, których z użyciem mediany w ogóle nie dałoby się wyrazić, albo też stałyby się dużo słabsze Mediana natomiast znajduje szerokie zastosowanie w opisie zmiennych rangowych, gdy średniej liczyć nie można. K. Szymanek Metodologia badań II28
29 Wyznaczanie mediany na podstawie rozkładów liczebności Jeśli liczba wszystkich elementów wynosi N, to (a) Jeśli N jest nieparzyste, to mediana jest wartością przyjmowaną przez element „środkowy”, o numerze (N/2)+0,5. Przykład: 2, 3, 7, 11, 13, 14, 20 (N = 7, N/2 = 3,5) me = 11 (b) Jeśli N jest parzyste, to mediana jest wartością wyznaczoną przez elementy o numerach N/2 oraz N/2 + 1. Bierzemy średnią wartości obu tych elementów. Przykład: 3, 5, 6, 8, 13, 15 (N = 6, N/2 = 3) me = (6 + 8)/2 = 7 K. Szymanek Metodologia badań II29 1 2 3 4 5 6
30 Wyznaczanie mediany na podstawie rozkładów liczebności Przypadek rozkładu dokładnego (bez grupowania). K. Szymanek Metodologia badań II30 WynikiLiczebność 56 413 315 219 13 03 RAZEM 59 59/2 = 29,5 Medianę wyznacza wartość przyjmowana przez 30 element, a więc wynik 3. Odp.: me = 3 59/2 = 29,5 Medianę wyznacza wartość przyjmowana przez 30 element, a więc wynik 3. Odp.: me = 3 Dla ilu elementów wynik wynosi 3 lub więcej? Dla 15+13+6 = 34 > 29,5 Dla ilu elementów wynik wynosi 3 lub mniej? Dla 15 + 19 + 3 + 3 = 40 > 29,5 Dla ilu elementów wynik wynosi 3 lub więcej? Dla 15+13+6 = 34 > 29,5 Dla ilu elementów wynik wynosi 3 lub mniej? Dla 15 + 19 + 3 + 3 = 40 > 29,5
31 Wyznaczanie mediany na podstawie rozkładów liczebności Przypadek rozkładu dokładnego (bez grupowania). K. Szymanek Metodologia badań II31 WynikiLiczebnośćLiczebność skumulowana 5658 41352 31539 21924 135 032 RAZEM 59xxxxxxxxx 59/2 = 29,5 Medianę wyznacza wartość przyjmowana przez 30 element, a więc wynik 3. Odp.: me = 3 59/2 = 29,5 Medianę wyznacza wartość przyjmowana przez 30 element, a więc wynik 3. Odp.: me = 3 Rubryka z liczebnością skumulowaną może ułatwić znalezienie mediany. Rubryka z liczebnością skumulowaną może ułatwić znalezienie mediany. 30
32 Wyznaczyć medianę I K. Szymanek Metodologia badań II32 WynikiLiczebność 541 432 323 225 112 05 RAZEM 138 138/2 = 69 Medianę wyznaczają wartości przyjmowane przez 69 i 70 element, a więc 4. Odp.: me = 4 138/2 = 69 Medianę wyznaczają wartości przyjmowane przez 69 i 70 element, a więc 4. Odp.: me = 4 Dla ilu elementów wynik wynosi 4 lub więcej? Dla 32+41 = 73 > 69 Dla ilu elementów wynik wynosi 4 lub mniej? Dla 32 + 23 + 25 + 12 +5 = 97 > 69 Dla ilu elementów wynik wynosi 4 lub więcej? Dla 32+41 = 73 > 69 Dla ilu elementów wynik wynosi 4 lub mniej? Dla 32 + 23 + 25 + 12 +5 = 97 > 69
33 Wyznaczyć medianę II K. Szymanek Metodologia badań II33 WynikiLiczebność 1015 920 830 725 610 523 410 RAZEM 133 133/2 = 66,5 Odp.: me = 7 133/2 = 66,5 Odp.: me = 7
34 Wyznaczyć medianę III K. Szymanek Metodologia badań II34 WynikiLiczebność 108 9 820 715 613 59 41 RAZEM 77 76/2 = 38 Medianę wyznacza 38 i 39 element, ale wartości dla tych elementów są różne: dla jednego 8, dla drugiego 7 Dlatego me = 7,5 76/2 = 38 Medianę wyznacza 38 i 39 element, ale wartości dla tych elementów są różne: dla jednego 8, dla drugiego 7 Dlatego me = 7,5 38
35 Wyznaczanie mediany na podstawie rozkładów liczebności Przypadek rozkładu z grupowaniem. K. Szymanek Metodologia badań II35 WynikiLiczebność [24, 32)8 [16, 24)4 [8, 16)5 [0, 8)3 RAZEM 20 20/2 = 10 Medianę wyznaczają wartości przyjmowane przez 10 i 11 element, a więc jakąś wartość z przedziału [16, 24). 20/2 = 10 Medianę wyznaczają wartości przyjmowane przez 10 i 11 element, a więc jakąś wartość z przedziału [16, 24).
36 Wyznaczanie mediany na podstawie rozkładów liczebności Przypadek rozkładu z grupowaniem. K. Szymanek Metodologia badań II36 WynikiLiczebność [24, 32)8 [16, 24)4 [8, 16)5 [0, 8)3 RAZEM 20 20/2 = 10 Medianę wyznacza wynik przyjmowany przez 10 i 11 element, a więc jakąś wartość z przedziału [16, 24). 20/2 = 10 Medianę wyznacza wynik przyjmowany przez 10 i 11 element, a więc jakąś wartość z przedziału [16, 24).
37 Wyznaczanie mediany na podstawie rozkładów liczebności Przypadek rozkładu z grupowaniem. K. Szymanek Metodologia badań II37 WynikiLiczebność [24, 32)8 [16, 24)4 [8, 16)5 [0, 8)3 RAZEM 20 20/2 = 10 Medianę wyznacza wynik przyjmowany przez 10 element, a więc jakiś wynik z przedziału [16, 24). 20/2 = 10 Medianę wyznacza wynik przyjmowany przez 10 element, a więc jakiś wynik z przedziału [16, 24). Ten przedział ma szerokość 24 – 16 = 8 i zawiera 4 elementy. Na każdy z nich przypada 8/4 = 2 jednostki. Medianę wyznacza 2. od dołu element, zatem me = 16 + 2 2 = 20 20/2 = 10 Medianę wyznaczają wartości przyjmowane przez 10 i 11 element, a więc jest to wartość z przedziału [16, 24) 20/2 = 10 Medianę wyznaczają wartości przyjmowane przez 10 i 11 element, a więc jest to wartość z przedziału [16, 24) Taki sam rezultat osiągniemy licząc od góry Medianę wyznacza 2. od góry element, zatem me = 24 – 2 2 = 20
38 Mediana na histogramie liczebności K. Szymanek Metodologia badań II38 WynikiLiczebności [24, 32)8 [16, 24)4 [8, 16)5 [0, 8)3 0 8 16 24 32
39 Mediana na histogramie częstości K. Szymanek Metodologia badań II39 WynikiCzęstości [24, 32)0,40 [16, 24)0,20 [8, 16)0,25 [0, 8)0,15 0 8 16 24 32 me = 20
40 Mediana na histogramie częstości K. Szymanek Metodologia badań II40 WynikiCzęstości [24, 32)0,40 [16, 24)0,20 [8, 16)0,25 [0, 8)0,15 0 8 16 24 32 50% me = 20
41 Wyznaczanie mediany na podstawie rozkładów liczebności Przypadek rozkładu z grupowaniem. K. Szymanek Metodologia badań II41 WynikiLiczebność [30, 40)2 [20, 30)4 [10, 20)7 [0, 10)3 RAZEM 16 16/2 = 8 Medianę wyznacza wynik przyjmowany przez 8 i 9 element, a więc jest to wartość z przedziału [10, 20) 16/2 = 8 Medianę wyznacza wynik przyjmowany przez 8 i 9 element, a więc jest to wartość z przedziału [10, 20)
42 Wyznaczanie mediany na podstawie rozkładów liczebności Przypadek rozkładu z grupowaniem. K. Szymanek Metodologia badań II42 WynikiLiczebność [30, 40)2 [20, 30)4 [10, 20)7 [0, 10)3 RAZEM 16 16/2 = 8 Medianę wyznacza wartość przyjmowana przez 8 i 9 element, a więc jest to wartość z przedziału [10, 20) 16/2 = 8 Medianę wyznacza wartość przyjmowana przez 8 i 9 element, a więc jest to wartość z przedziału [10, 20) Ten przedział ma szerokość 20 – 10 = 10 i zawiera 7 elementów. Na każdy z nich przypada 10/7 = 1,43 jednostki. Medianę wyznacza 5. element od dołu, zatem me = 10 + 5 1,43 = 17,15 Alternatywnie można obliczyć medianę biorąc 2. element od góry (niebieski): me = 20 – 2 1,43 = 17,14 (różnica bierze się z zaokrągleń)
43 Mediana na histogramie liczebności K. Szymanek Metodologia badań II43 0 10 20 30 40 50% WynikiLiczebność [30, 40)2 [20, 30)4 [10, 20)7 [0, 10)3 RAZEM 16 me =17,15
44 Mediana na histogramie częstości K. Szymanek Metodologia badań II44 0 10 20 30 40 50% WynikiLiczebność [30, 40)2 [20, 30)4 [10, 20)7 [0, 10)3 RAZEM 16 me =17,15
45 Wyznaczanie średniej z rozkładu liczebności Przypadek rozkładu dokładnego: (a) najpierw liczymy 6 5 + 13 4 + 15 3 + 19 2 + 3 1 + 2 0 = 168 (b) następnie dzielimy wynik przez N = 58 168/58 = 2,90 K. Szymanek Metodologia badań II45 WynikiLiczebność 56 413 315 219 13 02 RAZEM 58
46 Wyznaczanie średniej z rozkładu liczebności Przypadek liczebności pogrupowanych K. Szymanek Metodologia badań II46 WynikiLiczebność [24, 32)8 [16, 24)4 [8, 16)5 [0, 8)3 RAZEM 20 (a)Zastępujemy przedziały klasowe liczbami środkowymi, czyli średnimi granic klas. Zamiast [24,32) bierzemy więc (24+32)/2=28 Zamiast [16, 24) bierzemy (16+24)/2 = 20 itd.
47 Wyznaczanie średniej z rozkładu liczebności Przypadek liczebności pogrupowanych K. Szymanek Metodologia badań II47 WynikiŚrodkiLiczebność [24, 32)288 [16, 24)204 [8, 16)85 [0, 8)43 RAZEM 20 (a)Zastępujemy przedziały klasowe liczbami środkowymi, czyli średnimi granic klas. Zamiast [24,32) bierzemy więc (24+32)/2=28 Zamiast [16, 24) bierzemy (16+24)/2 = 20 itd.
48 Wyznaczanie średniej z rozkładu liczebności Przypadek liczebności pogrupowanych K. Szymanek Metodologia badań II48 WynikiŚrodkiLiczebność [24, 32)288 [16, 24)204 [8, 16)85 [0, 8)43 RAZEM 20 (a)Zastępujemy przedziały klasowe liczbami środkowymi, czyli średnimi granic klas. Zamiast [24,32) bierzemy więc (24+32)/2=28 Zamiast [16, 24) bierzemy (16+24)/2 = 20 itd. (b) Teraz liczymy tak, jak w przypadku rozkładu dokładnego: (8 28 + 4 20 + 5 8 + 3 4)/20 = 17,80
49 Moda (dominanta, modalna) Moda (dominanta, modalna) to wartość przyjmowana najczęściej. Przykład: 2, 3, 4, 5, 5, 7, 10, 10, 10, 14, 15, 15 moda = 10 K. Szymanek Metodologia badań II49
50 Moda K. Szymanek Metodologia badań II50 WynikiLiczebność 56 413 315 219 13 02 RAZEM 58 moda = 2
51 Obliczanie mody dla rozkładów pogrupowanych K. Szymanek Metodologia badań II51 d1d1 d2d2 X s
52 Przykład WynikiLiczebności [24, 32)25 [16, 24)30 [8, 16)20 [0, 8)10 K. Szymanek Metodologia badań II52 X = 16, s = 8 d 1 = 30 – 20 = 10 d 2 = 30 – 25 = 5 d 1 + d 2 = 15 moda = 16 + 8 0,67 = 21,36
53 Moda często nie jest określona (a)3, 5, 8, 13, 20, 33 (moda = ) (b) 2, 2, 4, 5, 6, 7, 7, 12, 13 (moda = ) (c) (moda = ) K. Szymanek Metodologia badań II53