1 Statystyka w doświadczalnictwieWydział Technologii Drewna SGGW Studia II stopnia
2 Wykład 5 Rozkłady statystyczne Rozkłady empiryczne Po co rozkłady?Typy zmiennych Przykładowe rozkłady Rozkład normalny Rozkład dwumianowy
3 Rozkłady empiryczne Graficzna reprezentacja danych w formie rozkłady liczebnosci, wieloboku liczebności, histogramu, itp.
4 Graficzna prezentacja danych
5 Graficzna prezentacja danych
6 Po co rozkłady? Niekiedy konieczne jest założenie, że badana cecha posiada określony rozkład np. możemy założyć, że rozkład cechy „gęstość drewna” jest zgodny z rozkładem normalnym i wykorzystać później tę informację do estymacji, testowania hipotez lub modelowania
7 Po co rozkłady? Stwierdzenie zgodności cechy z danym rozkładem pozwala na zrozumienie zależności istniejących w zbiorze danych W takiej sytuacji zwykle buduje się rozkład teoretyczny na bazie danych pomiarowych i porównuje otrzymane rozkłady
8 Po co rozkłady? Do dopasowania rozkładów stosuje się zwykle metodę momentów lub metodę największej wiarygodności Rozkłady teoretyczne są podstawą wielu metod statystycznych (estymacji, testów, ...), stąd konieczne jest sprawdzenie, czy dane mają rozkład zgodny np. z rozkładem normalnym
9 Typy zmiennych Jakościowe (określające przynależność do określonej grupy lub kategorii, np. płeć, kolor, gatunek drewna, ...0 Ilościowe (możliwe do pomierzenia z wykorzystaniem skali pomiarowych, dla których możliwe jest dodawania czy uśrednianie, np. miąższość kłody, gęstość drewna, ...)
10 Zmienna a typ rozkładu Jeżeli zmienna ma postać skończonego zbioru - jest to zmienna skokowa (np. wiek, klasa grubości, ...) możliwa do opisania rozkładem prawdopodobieństwa
11 Zmienna a typ rozkładu Jeżeli zmienna może przyjąć dowolna wartość (lub dowolną wartość z określonego przedziału) - mówimy o zmiennej ciągłej (np. długość, grubość, ...) możliwej do opisania gęstością prawdopodobieństwa
12 Zmienna a typ rozkładu W wielu przypadkach (z powodu technicznych ograniczeń pomiarów lub z powodów praktycznych) zmienne ciągłe traktowane są ja dyskretne (np. kiedy grubość mierzona jest z zaokrągleniem do 1mm czy długość do 1cm)
13 Przykładowe rozkłady Rozkład Beta używany jest do modelowania rozkładów wielkości uporządkowanych, mających naturalny limit dolny i górny Rozkład dwumianowy używany jest do opisu takich zjawisk, jak np. liczba K/M czy liczba elementów wadliwych w próbie złożonej z n elementów pobranych z populacji
14 Przykładowe rozkłady Rozkład chi-kwadrat używany jest do modelowania zmiennych reprezentujących częstości Rozkład wykładniczy używany jest często do modelowania czasu między zdarzeniami Rozkład Poisson’a używany jest do modelowania zjawisk rzadkich
15 Przykładowe rozkłady Rozkład normalny jest najczęściej stosowany w estymacji statystycznej Rozkład Weibull’a stosuje się często do modelowania czasu, który mija do momentu wystąpienia awarii ...
16 Rozkład normalny Najczęściej stosowany rozkład w statystycePodstawa wielu metod statystycznych: estymacji, testów, regresji, korelacji, analizy wariancji, ...
17 Rozkład normalny Opisuje zmienne, które mogą przybierać postać nieskończonej liczby niezależnych zdarzeń losowych Przykład rozkładu zmiennej ciągłej Jego funkcję gęstości prawdopodobieństwa można opisać następująco:
18 Rozkład normalny gdzie: x - zmienna µ - średnia arytmetycznaσ - odchylenie standardowe
19 Rozkład normalny
20 Własności (r-d normalny)Wartość funkcji gęstości rośnie dla x<µ i maleje dla x>µ Funkcja gęstości ma maksimum w punkcie x = µ Wartość oczekiwana zmiennej X wynosi E(X)=µ Wariancja zmiennej X równa jest D2X = σ2
21 Własności (r-d normalny)dla x = µ funkcja gęstości ma wartość rozkład ma 2 punkty przegięcia dla x=µ - σ i x = µ + σ rozkład normalny jest symetryczny, a oś symetrii zdefiniowana jest jako x = µ
22 Własności (r-d normalny)Im wariancja / odchylenie standardowe jest mniejsze, tym funkcja gęstości jest węższa funkcja prawdopodobieństwa jest całką z funkcji gęstości prawdopodobieństwa
23 Własności (r-d normalny)
24 Standaryzowany r.n. Każdy rozkład normalny może być znormalizowany, tj. doprowadzony do postaci rozkładu o średniej 0 i odchyleniu standardowym 1: N(0,1). Wartość oczekiwana standaryzowanego r-du normalnego równa jest zero (EZ = 0) a odchylenie standardowe równe jest 1 (D2Z = 1).
25 Standaryzowany r.n. Standaryzacja to zamiana zmiennej x na z, gdzie:Funkcja gęstości prawdopodobieństwa tej funkcji:
26 Standaryzowany r.n.
27 Własności (r-d normalny)Pomiędzy µ - σ i µ + σ znajduje się około 68% wszystkich wartości zmiennej W przedziale od μ - 2*σ do μ + 2*σ jest około 95% wszystkich wartości zmiennej W przedziale od μ - 3*σ do μ + 3*σ mamy około 99,7% wszystkich obserwacji
28
29 Rozkład skumulowany
30 Rozkład skumulowany
31 Rozkład skumulowany
32 Rozkład skumulowany
33 Rozkład skumulowany
34 Rozkład dwumianowy Przykład funkcji rozkładu prawdopodobieństwaOpisuje prawdopodobieństwo uzyskania k sukcesów w n niezależnych próbach, gdzie prawdopodobieństwo sukcesu w jednej próbie wynosi p
35 Rozkład dwumianowy
36 Rozkład dwumianowy
37 Własności (r-d dwum.) Wykres funkcji rozkładu jest symetryczny dla p = 0.5 dla p < 0.5 rozkład jest skośny dodatnio dla p > 0.5 rozkład jest skośny ujemnie
38 Własności (r-d dwum.) Wartość oczekiwana E(X) = n * pWariancja D2X = n p q Odchylenie standardowe
39 Dziekuje za uwagę!