1 Ilustracja związku dystrybuanty teoretycznej z empiryczną
2 Opis zadania Dla dystrybuanty F(x), która ma dobrze określoną funkcję odwrotną: losujemy niezależnie liczby u1, u2, , un z rozkładu jednostajnego U [0, 1]; przekształcamy xk = F−1(uk) dla k = 1, 2, , n; przez Sn(x) oznaczamy ilość tych elementów ciągu x1, x2,..., xn, których wartość jest mniejsza niż x. nazywamy dystrybuantą empiryczną. Dla kilku konkretnych przykładów dystrybuant F oraz dla kilku rzędów parametru n porównać (m.in. graficznie) otrzymaną dystrybuantę empiryczną Fn(x) z dystrybuantą teoretyczną F(x).
3 Dystrybuanta empiryczna a PWLZauważamy, że Sn oznacza ilość sukcesów w n próbach Bernoulliego, gdzie sukces w i-tej próbie to zdarzenie {Xi < x} , a p=F(x) Zatem Sn ma rozkład Bernoulliego z parametrami n i p=F(x) Możemy zastosować tw. Borela, z którego wynika: Co oznacza, że dla odpowiednio dużego n Fn(x)≈F(x), czyli dystrybuanta empiryczna jest przybliżeniem dystrybuanty teoretycznej
4 Rozkład wykładniczy n=5 Błąd średniokwadratowy: 0,0210044Największe odchylenie: 0,324
5 Rozkład wykładniczy n=20 Błąd średniokwadratowy: 0,00193983Największe odchylenie: 0,1799
6 Rozkład wykładniczy n=100 Błąd średniokwadratowy: 0,000781755Największe odchylenie: 0,0281
7 Rozkład wykładniczy n=1000 Błąd średniokwadratowy: 1,6035 · 10-7Największe odchylenie: 0,
8 Rozkład Cauchy’ego n=5 Błąd średniokwadratowy: 0,00684262Największe odchylenie: 0,0965
9 Rozkład Cauchy’ego n=20 Błąd średniokwadratowy: 7,5326 · 10-5Największe odchylenie: 0,0381
10 Rozkład Cauchy’ego n=50 Błąd średniokwadratowy: 0,000646874Największe odchylenie: 0,0256
11 Rozkład Cauchy’ego n=100 Błąd średniokwadratowy: 1,43857 · 10-5Największe odchylenie: 0,0038
12 Rozkład Cauchy’ego n=1000 Błąd średniokwadratowy: 1,59877 · 10-7Największe odchylenie: 0,
13 Rozkład arcsin n=5 Błąd średniokwadratowy: 0,00706723Największe odchylenie: 0,1878
14 Rozkład arcsin n=20 Błąd średniokwadratowy: 0,000405924Największe odchylenie: 0,
15 Rozkład arcsin n=100 Błąd średniokwadratowy: 0,000122224Największe odchylenie: 0,
16 Rozkład arcsin n=500 Błąd średniokwadratowy: 2,54179 · 10-7Największe odchylenie: 0,
17 Rozkład arcsin n=2000 Błąd średniokwadratowy: 8,76349 · 10-8Największe odchylenie: 0,
18 Rozkład Pareto z param. 2 n=5 Błąd średniokwadratowy: 0,0285624Największe odchylenie: 0,1733
19 Rozkład Pareto z param. 2 n=20 Błąd średniokwadratowy: 0,00223757Największe odchylenie: 0,0477
20 Rozkład Pareto z param. 2 n=100 Błąd średniokwadratowy: 0,000619006Największe odchylenie: 0,
21 Rozkład Pareto z param. 2 n=500 Błąd średniokwadratowy: 4,75187 · 10-5Największe odchylenie: 0,
22 Rozkład Pareto z param. 2 n=2000Błąd średniokwadratowy: 4,00494 · 10-8 Największe odchylenie: 0,
23 Rozkład kwadratowy n=5 Błąd średniokwadratowy: 0,0262666Największe odchylenie: 0,183
24 Rozkład kwadratowy n=20 Błąd średniokwadratowy: 0,00031811Największe odchylenie: 0,0185
25 Rozkład kwadratowy n=100 Błąd średniokwadratowy: 2,99292 · 10-6Największe odchylenie: 0,
26 Rozkład kwadratowy n=1000 Błąd średniokwadratowy: 4,57001 · 10-9Największe odchylenie: 0,0021
27 Wnioski: Gdy liczba prób o rozkładzie, którego dystrybuanta wynosi F(x), dąży do nieskończoności to dystrybuanta empiryczna tych prób dąży do dystrybuanty teoretycznej Niektóre dystrybuanty empiryczne dążą szybciej do odpowiadającym im dystrybuant teoretycznych. Przy odpowiedniej liczbie prób możemy rozpoznać jakiego typu jest przybliżana dystrybuanta
28 Dziękujemy za uwagę!