1 Wykład 6 Standardowy błąd średniej a odchylenie standardowe z próbyOdchylenie standardowe z próby s: Służy do oceny zmienności w zbiorze danych Gdy n wzrasta s zbliża się do odchylenia standardowego w populacji Używane do przewidywań dotyczących poszczególnych obserwacji
2 Błąd standardowy średniej SE = :Służy do oceny niepewności związanej z estymacją średniej w populacji Maleje wraz ze wzrostem n Używane do przewidywań dotyczących średniej
3 Jak duża powinna być próba?Poprzez wybór odpowiedniego n możemy uzyskać PU o odpowiedniej (dowolnie małej) szerokości Możemy estymować z zadaną precyzją Przykład: ustal rozmiar próby tak aby 95% PU dla średniej miał szerokość 5.
4 Załóżmy, że =10. Wtedy Na ogół nie znamy . Możemy wykonać badanie wstępne (mała próba) aby oszacować .
5 Założenia (jeszcze raz)Próba musi być losowa Każdy element w populacji ma jednakową szansę na wybór Poszczególne wybory są od siebie niezależne Jeżeli te założenia nie są spełnione to wzrost n może nie gwarantować zmniejszenia SE.
6 Przedział ufności dla frakcji w populacjiEstymujemy p za pomocą Chcemy skonstruować przedział ufności dla p Moglibyśmy skorzystać z rozkładu Bernoulliego ale wymagałoby to uciążliwych rachunków. Korzystamy z przybliżenia rozkładu Bernoulliego rozkładem normalnym Gdy Y ma rozkład Bernoulliego (n, p) i n jest duże, wtedy Y ma w przybliżeniu rozkład nornmalny
7 = Y/n ma średnią i = Zatem ma w przybliżeniu rozkład
8 Przedział ufności dla pKlasyczny przedział ufności uzyskuje się zastępując p przez (we wzorze na ). Klasyczne przedziały ufności zachowują się źle gdy y jest bliskie 0 – wtedy PU często zawiera ujemne wartości. My będziemy korzystali z następującej poprawki: Centrum przedziału będzie (zamiast ). Przypomnijmy, że Z/2 jest taką liczbą, że Pr(Z < - Z/2) = Pr(Z > Z/2) = /2 Dla 95% PU, = 0.05 i Z/2 = 1.96.
9 Definiujemy SE dla wynosi Dla 95% PU Wstawiamy Z0.025 = 1.96 i dostajemy
10 Przedział ufności dla pSkonstruujemy przybliżony przedział ufności dla p, z centrum w Użyjemy kwantyli z rozkładu normalnego Z/2 Dla 95% PU użyjemy Z0.025 =1.96 Dla 90% PU użyjemy Z0.05 =1.65; dla 99% PU użyjemy Z0.005=2.58. przybliżony 95% PU dla p wynosi
11 Przykład: Złapano 125 myszy i 6 z nich ma nakrapiane na biało brzuszkip = frakcja myszek w całej populacji, które mają nakrapiane na biało brzuszki 95% PU dla p:
12 90% PU dla p
13 Mamy 90% pewności że frakcja myszek w całej populacji, które mają brzuszki nakrapiane na biało zawiera się w przedziale między a Zauważmy, że 90% PU jest niż 95% PU i że przedziały te mają różne środki.
14 Jak duża powinna być próba ?Chcemy aby 95% PU miał zadaną długość. Jak ustalić rozmiar próby ? Uwaga – długość przedziału zależy od , którego nie znamy Jeżeli mniej więcej wiemy jakie jest p, to możemy tą przybliżoną wartość użyć w równaniu na długość przedziału. Jeżeli nie mamy żadnych wstępnych informacji to używamy p = 0.5. Ten wybór jest bezpieczny i gwarantuje, że przedział ufności skonstruowany w oparciu o próbę o wyliczonym rozmiarze będzie nie szerszy od założonego.
15 Przykład Chcemy aby SE było równe .005 (odpowiedni przedział ufności ma długość około 0.02). Przypuszczamy, że prawdziwe p jest bliskie .05. Potrzebujemy myszy.
16 Nie wiemy nic o p. Potrzebujemy myszy.
17 Dwie niezależne próby Czasami chcemy porównać wartości pewnej zmiennej w dwóch populacjach. Przykłady Grupa zabiegowa i kontrolna Lekarstwo a placebo Pacjenci biorący dwa podobne lekarstwa Mężczyźni a kobiety Dwie różne linie genetyczne
18 Rozkład cechy Y w populacji 1 jestN(1, 1): bierzemy próbę o rozmiarze n1, y1, s1, SE1 = Rozkład cechy Y w populacji 2 jest N(2, 2) : bierzemy próbę o rozmiarze n2,,, y2,s2, SE2 =
19 Jaka jest różnica między średnimi w obu populacjach, 1-2 ?Chcemy wyestymować 1 - 2 i otrzymać przedział ufności y1-y2 jest estymatorem 1-2 Aby skonstruować przedział ufności musimy wyznaczyć SE
20 Standardowy błąd dla różnicy dwóch średnichJak policzyć SE dla y1-y2? Dwa sposoby: ``nieuśrednianie’’ i ``uśrednianie’’. gdy n1 = n2 obie metody dają te same wyniki Na ogół będziemy używać ``nieuśrednionego’’ SE. Metodę ``uśredniania’’ zastosujemy gdy będzie można założyć, że 1=2 (albo gdy o to poprosi wykładowca). W obu przypadkach SE liczone jest jako pewna kombinacja s1 and s2
21 Metoda zwykła (``nieuśrednianie’’)Liczymy SE1 = i SE2 = osobno w obu próbach.
22 Liczymy standardowy błąd różnicy średnich:
23 Metoda ``uśredniania’’W obu próbach liczymy SS : SS1 and SS2, i obliczamy „uśrednioną wariancję": sc2 =
24 ``Uśredniony’’ błąd standardowy wynosi
25 Podsumowanie obu metodMetoda ``nieuśredniania’’ (N)SEy1-y2 = =
26 Metoda ``uśredniania’’SS1 = (n1–1)s12 = (y-y1)2 w próbie 1 SS2 = (n2–1)s22 = (y-y2)2 w próbie 2 ``uśredniona’’ wariancja sc2 = (U)SEy1-y2 =
27 Przykład: próba 1: n1 = 15, y1 = 75, SS1 = 600
28 Wyniki z obu metod nie są takie same ale są dość podobne.Zauważmy, że s1 = 6.55 i s2 = 5.77 (dość podobne).