Ilustracja związku dystrybuanty teoretycznej z empiryczną

1 Ilustracja związku dystrybuanty teoretycznej z empirycz...
Author: Przemysław Mateusiak
0 downloads 2 Views

1 Ilustracja związku dystrybuanty teoretycznej z empiryczną

2 Opis zadania Dla dystrybuanty F(x), która ma dobrze określoną funkcję odwrotną: losujemy niezależnie liczby u1, u2, , un z rozkładu jednostajnego U [0, 1]; przekształcamy xk = F−1(uk) dla k = 1, 2, , n; przez Sn(x) oznaczamy ilość tych elementów ciągu x1, x2,..., xn, których wartość jest mniejsza niż x. nazywamy dystrybuantą empiryczną. Dla kilku konkretnych przykładów dystrybuant F oraz dla kilku rzędów parametru n porównać (m.in. graficznie) otrzymaną dystrybuantę empiryczną Fn(x) z dystrybuantą teoretyczną F(x).

3 Dystrybuanta empiryczna a PWLZauważamy, że Sn oznacza ilość sukcesów w n próbach Bernoulliego, gdzie sukces w i-tej próbie to zdarzenie {Xi < x} , a p=F(x) Zatem Sn ma rozkład Bernoulliego z parametrami n i p=F(x) Możemy zastosować tw. Borela, z którego wynika: Co oznacza, że dla odpowiednio dużego n Fn(x)≈F(x), czyli dystrybuanta empiryczna jest przybliżeniem dystrybuanty teoretycznej

4 Rozkład wykładniczy n=5 Błąd średniokwadratowy: 0,0210044Największe odchylenie: 0,324

5 Rozkład wykładniczy n=20 Błąd średniokwadratowy: 0,00193983Największe odchylenie: 0,1799

6 Rozkład wykładniczy n=100 Błąd średniokwadratowy: 0,000781755Największe odchylenie: 0,0281

7 Rozkład wykładniczy n=1000 Błąd średniokwadratowy: 1,6035 · 10-7Największe odchylenie: 0,

8 Rozkład Cauchy’ego n=5 Błąd średniokwadratowy: 0,00684262Największe odchylenie: 0,0965

9 Rozkład Cauchy’ego n=20 Błąd średniokwadratowy: 7,5326 · 10-5Największe odchylenie: 0,0381

10 Rozkład Cauchy’ego n=50 Błąd średniokwadratowy: 0,000646874Największe odchylenie: 0,0256

11 Rozkład Cauchy’ego n=100 Błąd średniokwadratowy: 1,43857 · 10-5Największe odchylenie: 0,0038

12 Rozkład Cauchy’ego n=1000 Błąd średniokwadratowy: 1,59877 · 10-7Największe odchylenie: 0,

13 Rozkład arcsin n=5 Błąd średniokwadratowy: 0,00706723Największe odchylenie: 0,1878

14 Rozkład arcsin n=20 Błąd średniokwadratowy: 0,000405924Największe odchylenie: 0,

15 Rozkład arcsin n=100 Błąd średniokwadratowy: 0,000122224Największe odchylenie: 0,

16 Rozkład arcsin n=500 Błąd średniokwadratowy: 2,54179 · 10-7Największe odchylenie: 0,

17 Rozkład arcsin n=2000 Błąd średniokwadratowy: 8,76349 · 10-8Największe odchylenie: 0,

18 Rozkład Pareto z param. 2 n=5 Błąd średniokwadratowy: 0,0285624Największe odchylenie: 0,1733

19 Rozkład Pareto z param. 2 n=20 Błąd średniokwadratowy: 0,00223757Największe odchylenie: 0,0477

20 Rozkład Pareto z param. 2 n=100 Błąd średniokwadratowy: 0,000619006Największe odchylenie: 0,

21 Rozkład Pareto z param. 2 n=500 Błąd średniokwadratowy: 4,75187 · 10-5Największe odchylenie: 0,

22 Rozkład Pareto z param. 2 n=2000Błąd średniokwadratowy: 4,00494 · 10-8 Największe odchylenie: 0,

23 Rozkład kwadratowy n=5 Błąd średniokwadratowy: 0,0262666Największe odchylenie: 0,183

24 Rozkład kwadratowy n=20 Błąd średniokwadratowy: 0,00031811Największe odchylenie: 0,0185

25 Rozkład kwadratowy n=100 Błąd średniokwadratowy: 2,99292 · 10-6Największe odchylenie: 0,

26 Rozkład kwadratowy n=1000 Błąd średniokwadratowy: 4,57001 · 10-9Największe odchylenie: 0,0021

27 Wnioski: Gdy liczba prób o rozkładzie, którego dystrybuanta wynosi F(x), dąży do nieskończoności to dystrybuanta empiryczna tych prób dąży do dystrybuanty teoretycznej Niektóre dystrybuanty empiryczne dążą szybciej do odpowiadającym im dystrybuant teoretycznych. Przy odpowiedniej liczbie prób możemy rozpoznać jakiego typu jest przybliżana dystrybuanta

28 Dziękujemy za uwagę!