1 Metodologia badań społecznychKrzysztof Konarzewski Wszechnica Świętokrzyska Wszystkie prawa zastrzeżone
2 Ankieta Ankieta, zgodnie ze źródłosłowem (enquête), to metoda zbierania danych polegająca na planowym wypytywaniu badanego o fakty i poglądy. Podstawą ankiety jest kwestionariusz, czyli ustalona lista pytań i mniej lub bardziej zamknięte zbiory możliwych odpowiedzi. Podane możliwości odpowiedzi nazywa się opcjami (nie „kafeterią”), a pytanie wraz z instrukcją i opcjami – pozycją kwestionariusza (nie „itemem”).
3 Jak budować kwestionariusz ankiety?Krok 1. Decydujemy o adresacie i formie ankiety: KOMU i JAK? Ankieta ustna (PAPI lub CAPI) – ankieter spotyka się z respondentem, czyta pytania, klasyfikuje i rejestruje odpowiedzi. Ankieta telefoniczna (TI lub CATI) – ankieter rozmawia z respondentem przez telefon. Ankieta pisemna – ankieter daje badanemu kwestionariusz, który ten wypełnia samodzielnie i zwraca ankieterowi. Ankieta internetowa (CAWI) – kwestionariusz ankiety jest udostępniony w Internecie. Ankieta audytoryjna – ankieter rozdaje kwestionariusze respondentom zgromadzonym w jednym miejscu (np. uczniom w klasie szkolnej) i zbiera po wypełnieniu. Ankieta pocztowa – kwestionariusz przesyła się i zwraca pocztą.
4 Krok 2. Określamy, czego chcemy się dowiedzieć, tznKrok 2. Określamy, czego chcemy się dowiedzieć, tzn. sporządzamy rozwiniętą i uporządkowaną listę potrzebnych informacji. Można ją nazwać makietą kwestionariusza. Krok 3. Budujemy pierwszą wersję kwestionariusza. Krok 4. Przeprowadzamy badanie pilotażowe na małej próbce osób pochodzących z populacji, do której jest zaadresowany kwestionariusz. Krok 5. Po wprowadzeniu niezbędnych poprawek przystępujemy do opracowania typograficznego.
5 Pozycja kwestionariuszaNa typową pozycję składają się trzy elementy: pytanie instrukcja opcje odpowiedzi.
6 Rodzaje pozycji Pytania z wyborem:Jakie wykształcenie zamierzasz zdobyć w życiu? [Zaznacz jedną odpowiedź] Zasadnicze zawodowe Średnie ogólnokształcące Średnie zawodowe Wyższe zawodowe (inżynierskie lub licencjackie) Wyższe magisterskie Nie zamierzam dalej się uczyć. Jeszcze o tym nie myślałem.
7 Pytania ze skalowaniem: Pogrom to inaczej napaść. Kto był napastnikiem w pogromie kieleckim? [Możesz zaznaczyć więcej niż jedną odpowiedź] Cyganie Niemcy Polacy Rosjanie Ukraińcy Żydzi Nie wiem. Pytania ze skalowaniem: W ciągu tego roku szkolnego jak często widziałeś, że uczeń bije, przewraca, kopie innego ucznia? [Zaznacz jedną odpowiedź] Codziennie lub prawie codziennie. Raz lub kilka razy w miesiącu. Raz lub kilka razy w ciągu tego roku. Nigdy.
8 Pytania ze skalowaniem w wersji Likerta: Większość nauczycieli szczerze troszczy się o moją przyszłość. [Zaznacz jedną odpowiedź] Zdecydowanie się zgadzam Raczej się zgadzam Raczej się nie zgadzam Zdecydowanie się nie zgadzam Trudno powiedzieć
9 Pytania z rangowaniem: Od czego Pani/Pana zdaniem zależą osiągnięcia szkolne dziecka? [Proszę postawić 1 przy najważniejszej przyczynie, 2 przy nieco mniej ważnej i tak dalej aż do najmniej ważnej] Dobre zdrowie Wykształcenie rodziców Kompetencje nauczyciela Zdolności ucznia Zamożność rodziców Ambicja ucznia Wyposażenie szkoły Inna przyczyna [proszę wpisać] ____________________________
10 Pytania z niejawnymi opcjami:Ile Pani/Pan ma dzieci? [Proszę wpisać] Pozycje otwarte: Co Pani/Pana zdaniem najbardziej utrudnia uczniom rozwiązywanie zadań z treścią? [Proszę wpisać]
11 Zasady budowania pozycji kwestionariuszaBuduj pytania krótkie, proste składniowo i uprzejme. Dostosuj słownictwo do słownictwa respondentów. Nie stawiaj pytań wymagających wiedzy, której potencjalni respondenci nie mają. Buduj jednoznaczne pytania. Unikaj podwójnych pytań. Unikaj pytań z przeczeniem. Unikaj pytań z niejawną przesłanką. Pytania warunkowe rozpoczynaj od warunku. Zadbaj o to, by podane opcje były rozłączne i pokrywały całe pole odpowiedzi. Unikaj pytań mogących wprawić respondenta w zakłopotanie. Unikaj pytań, które mogą budzić stereotypowe skojarzenia. Pamiętaj, że sposób sformułowania pytania może wpłynąć na odpowiedzi.
12 Układ kwestionariuszaInformacja o nadawcy. W nagłówku ankiety umieść nazwę organizacji, która prowadzi badania (np. „Wszechnica Świętokrzyska”), Wyjaśnienie celu badania. Prowadzimy badania nad przyczynami złego samopoczucia u dzieci rozpoczynających naukę. Wyniki tych badań pozwolą doradzić władzom oświatowym, co zmienić w praktyce szkolnej. Ponieważ dziecko Państwa zostało wylosowane do badań, prosimy o kilka informacji na jego temat. Gwarantujemy pełną poufność odpowiedzi. Pytania ułożone w bloki. Zazwyczaj kwestionariusz otwiera blok najbardziej interesujących pytań, żeby przykuć uwagę respondenta. Zaczynanie od bloku danych demograficznych („metryczki”) jest najczęściej błędne. Blok danych demograficznych. Podziękowanie.
13 Trafność kwestionariuszaKwestionariusz jest trafny, jeśli dostarcza odpowiedzi, które pokrywają się z rzeczywistymi opiniami badanych. Są przynajmniej trzy źródła nietrafności: pytania, które wydają się respondentowi niezrozumiałe albo niejednoznaczne, lub wadliwe opcje odpowiadania (nierozłączne, niewyczerpujące). pytania, które odwołują się do wiedzy, zainteresowań lub doświadczeń niedostępnych respondentowi. pytania, które budzą poczucie zagrożenia: respondent nie udziela szczerej odpowiedzi ze strachu przed konsekwencjami, które mogą dotknąć jego samego lub jego grupę zawodową, etniczną, wyznaniową itp.
14 Ćwiczenie Zbudować i przeprowadzić ankietę ustną do badania „Postawy wobec imigrantów”.
15 Analiza danych ankietowychZakładanie bazy danych w Excel Ankietę wypełniło 20 osób, więc dane zajmują 20 wierszy, od 2 do 21. Ankieta ma 44 kolumny, od A do AR. Razem dane zajmują obszar A2:AR21.
16 Typy zmiennych W ankiecie występują zmienne trzech rodzajów:1. Nominalne, np. Płeć Dziewczyna = „1” Chłopiec = „2” 2. Porządkowe, np. Jak często podróżuje Pani/Pan pociągiem? Codziennie lub prawie codziennie = „1” Kilka razy w miesiącu = „2” Kilka razy w roku = „3” Raz w roku lub rzadziej = „4” 3. Absolutne, np. Pani/Pana zdaniem, ile osób ginie rocznie w wypadkach kolejowych w Polsce? [Proszę wpisać przypuszczalną liczbę ofiar]
17 Obliczanie rozkładów liczebnościRozkład liczebności to liczby badanych, którzy wybrali poszczególne opcje odpowiedzi. W celu obliczenia rozkładu należy: w dowolnym miejscu arkusza, np. $T$2:$T$4, wypisać wartości zmiennej jedną pod drugą w rosnącej kolejności wywołać komendę Histogram (Dane → Analiza danych) określić zakres komórek (najłatwiej zaznaczyć wszystkie wiersze kolumny, czyli zmiennej, której rozkład chcemy obliczyć) określić zakres zbioru wartości (zaznaczyć wypisane wartości) określić zakres wyjściowy (podać adres pierwszej komórki, od której ma się zaczynać tabela wyniku).
18 Obliczymy rozkład zmiennej P3a. Wpisujemy: Zakres komórek: $T$2:$T$21 Zakres zbioru: $AX$2:$AX$3 Zakres wyjściowy: $AX$13 Komenda zwraca taką tabelę: Zbiór danych (koszyk) Częstość 13 1 7 Więcej
19 Pytanie Liczba Procent Cudzoziemcy będą zabierać pracę Polakom. 12 60 Zasiłki dla cudzoziemców zrujnują budżet państwa. 9 45 Będzie więcej chętnych do prac, których nie chcą wykonywać Polacy. 7 35 Cudzoziemcy będą organizować w Polsce zamachy terrorystyczne. Cudzoziemcy stworzą w Polsce grupy przestępcze, np. handlujące narkotykami. 6 30 Cudzoziemcy wzbogacą polską kulturę i naukę. 4 20 Cudzoziemcy zawloką do Polski nieznane choroby. Obyczaje cudzoziemców doprowadzą do upadku moralność Polaków. 2 10 Cudzoziemcy zhańbią białą rasę. 1 5 Polska będzie szanowana w Unii Europejskiej. Religia cudzoziemców odciągnie Polaków od Kościoła. Inny skutek 19
20 Obliczanie wskaźników złożonychWskaźniki złożone są zbudowane z kilku zmiennych. Budowanie takich wskaźników jest podporządkowane hipotezie. Załóżmy, że postawiono hipotezę: Osoby, które miały kontakt z cudzoziemcami mieszkającymi w Polsce, mają bardziej negatywną postawę wobec imigrantów. Żeby sprawdzić tę hipotezę, trzeba obliczyć wskaźnik postawy wobec imigrantów. Ponieważ zmienne ankietowe są nominalne lub porządkowe, nie możemy budować wskaźników za pomocą działań arytmetycznych. Pozostają operacje logiczne ORAZ i LUB.
21 Wskaźnikiem postawy może być liczba twierdzących odpowiedzi na osiem pytań o negatywne skutki przyjmowania cudzoziemców w Polsce. Wystarczy zsumować jedynki w kolumnach U, V, W, Y, Z, AA, AC, AD. Umieszczamy kursor w komórce AS2 i piszemy: =SUMA(U2;V2;W2;Y2;Z2;AA2;AC2;AD2). Formułę przeciągamy aż do wiersza 21. Kolumnę tytułujemy Postawa.
22 Zobaczmy, jaki jest rozkład zmiennej postawaZobaczmy, jaki jest rozkład zmiennej postawa. Ponieważ może ona przyjmować wartości od 0 do 8, musimy je wypisać jedna pod drugą np. w komórkach AX2:AX10. Wstawiamy zakresy w komendzie Histogram: $AS$2:$AS$21 $AX$2:$AX$10 $AX$12 i otrzymujemy poniższą tabelę. Można ją przedstawić w formie wykresu (histogramu). Zbiór danych Częstość 3 1 5 2 8 4 6 7 Więcej
23 Ponieważ mamy mało obserwacji, zmienną postawy sprowadzimy do dwóch wartości: pozytywna (0–2) i negatywna (3–6). Zrobimy to za pomocą formuły JEŻELI. Składnia: =JEŻELI(warunek;wartość_jeśli prawda;wartość_jeśli fałsz) W zwykłym języku: jeśli warunek jest spełniony, to wpisz wartość 1, w przeciwnym razie wpisz wartość 2. Warunek może zawierać operatory ORAZ i LUB. Te operatory poprzedzają wartości: ORAZ(x;y) znaczy „x ORAZ y” LUB (x;y) znaczy „x LUB y” Obliczamy zmienną postawa2. Wstawiamy kursor w komórce AT2 i piszemy: =JEŻELI(LUB(AS2=0;AS2=1;AS2=2);1;2) – co znaczy: jeżeli postawa = 0 lub 1, lub 2, to postawa2=1, w przeciwnym razie postawa2=2.
24 Obliczanie rozkładów warunkowychHipoteza wymaga, żeby obliczyć rozkłady warunkowe postawy2 dla respondentów, którzy mieli kontakt z cudzoziemcami mieszkającymi w Polsce i którzy go nie mieli. Pytanie P4 jest więc zmienną niezależną, a postawa2 – zmienną zależną. Weryfikacja hipotezy wymaga sporządzenia tabeli krzyżowej: Pozytywna Negatywna Mieli kontakt Nie mieli kontaktu
25 Liczby w komórkach obliczymy za pomocą formuły LICZ. WARUNKILiczby w komórkach obliczymy za pomocą formuły LICZ.WARUNKI. Uwaga: starsze wersje Excela nie mają tej formuły. Składnia formuły: =LICZ.WARUNKI(zakres;wartość;zakres;wartość…) Formuła zlicza przypadki, które mają dane wartości w obu zakresach. Umieszczamy kursor w komórce AV2 (to będzie pierwsza komórka tabeli) i piszemy: =LICZ.WARUNKI($AF$2:$AF$21;1;$AT$2:$AT$21;1) Formuła zwraca liczbę 8 – ośmiu respondentów ma jedynki zarówno w zmiennej P4, jak i w zmiennej postawa2.
26 Kopiujemy formułę do komórek AX2, AV3 i AX3 (zostawiamy miejsce na obliczenie procentów) Na razie wszędzie mamy 8. Trzeba dostosować formuły w poszczególnych komórkach. Umieszczamy kursor w AX2 i w okienku formuły zmieniamy drugą jedynkę na 2. Umieszczamy kursor w AV3 i w okienku formuły zmieniamy pierwszą jedynkę na 2. Umieszczamy kursor w AX2 i w okienku formuły zmieniamy obie jedynki na dwójki. Otrzymujemy tabelę: Pozytywna Negatywna Mieli kontakt 8 7 Nie mieli kontaktu 3 2
27 Ostatecznie otrzymujemy:Ponieważ chcemy porównać oba wiersze tabeli, musimy przekształcić liczby w procenty. Najpierw obliczamy sumy brzegowe w wierszach, pisząc w komórce AZ2 =SUMA(AV2;AX2) i kopiując do komórki AZ3. Potem obliczamy procenty, pisząc: w komórce AW2 =AV2/AZ2*100 w komórce AY2 =AX2/AZ2*100 w komórce AW3 =AV3/AZ3*100 w komórce AY3 =AX3/AZ3*100 Ostatecznie otrzymujemy: Pozytywna Negatywna Razem Liczba Procent Mieli kontakt 8 53 7 47 15 100 Nie mieli kontaktu 3 60 2 40 5 11 55 9 45 20
28 Rozkłady procentowe są niemal identyczne. Hipotezę należy odrzucić. A co należałoby zrobić, gdyby dane ułożyły się inaczej, np. tak: Pozytywna Negatywna Mieli kontakt 11 (73%) 4 (27%) Nie mieli kontaktu 1 (20%) 4 (80%) Zanim zaczęlibyśmy się cieszyć, musielibyśmy sprawdzić, czy taki układ liczb nie może powstać wskutek przypadku w fazie doboru próbki respondentów. Chcemy wiedzieć, jakie jest prawdopodobieństwo uzyskania takiego układu liczb wskutek przypadku, np. w wyniku rzucania dwiema kostkami do gry.
29 W Excelu służy do tego test chi-kwadratW Excelu służy do tego test chi-kwadrat. Niestety, nie jest wygodny w zastosowaniu. Trzeba najpierw „na piechotę” obliczyć tabelę liczebności oczekiwanych, przy założeniu, że obie zmienne są niezwiązane ze sobą, a następnie porównać ją z tabelą liczebności. Otwórzmy nowy arkusz i wpiszmy nową tabelę (bez procentów), zaczynając od A1. A B C D E F G H 1 11 4 15 9 6 0,035 2 5 3 12 8 20 Liczebność oczekiwaną w komórce w i-tym wierszu i j-tej kolumnie oblicza się według wzoru: liczebność oczekiwana = suma w wierszu i × suma w kolumnie j suma
30 Umieszczamy kursor w komórce E1 i piszemy: =A3*C1/C3 w komórce F1 i piszemy: =B3*C1/C3 w komórce E2 i piszemy: =A3*C2/C3 w komórce F2 i piszemy: =B3*C2/C3 Teraz możemy użyć formuły chi-kwadrat. Ma ona składnię: =TEST.CHI(zakres_tabeli_liczebności;zakres_tabeli_liczebności_oczekiwanych) W komórce H1 piszemy: =TEST.CHI(A1:B2;E1:F2) Pojawia się mała liczba: 0,035. Znaczy to, że przypadek mógłby wytworzyć taki układ 35 razy na 1000 prób. Mamy prawo twierdzić, że nasz wynik nie jest przypadkowy, czyli że jest statystycznie istotny. Ogólnie, jeśli wartość prawdopodobieństwa jest mniejsza niż 0,10, uznajemy, że związek obu zmiennych jest istotny statystycznie i uwzględniamy go w interpretacji wyników.
31 Praca domowa Sprowadzić zmienną wieku do dwóch wartości:młodsi (1 lub 2 lub 3) starsi (4 lub 5 lub 6) zbudować tabelę krzyżową ze zmienną postawa2: Pozytywna Negatywna Razem Liczba Procent Młodsi 100 Starsi i obliczyć prawdopodobieństwo uzyskania takiego układu liczb wskutek przypadku.