1 STATYSTYCZNA ANALIZA DANYCHIV semestr studiów inżynierskich w PJWSTK Prowadząca: dr hab. Elżbieta Ferenstein, profesor PJWSTK Cel wykładu - poznanie podstaw analizy danych statystyka opisowa modelowanie probabilistyczne wnioskowanie statystyczne
2 STATYSTYKA OPISOWA Techniki wstępnej analizy danych i ich prezentacji:gromadzenie, przechowywanie danych, analiza danych surowych prezentacja danych: tabele, wykresy, parametry liczbowe obliczane dla danych. Cel: charakteryzacja danych - w zwięzłej formie odzwierciedlająca pewne ich cechy, np. średni dochód, średnie zużycie paliwa, .. odnalezienie różnego rodzaju regularności ( nieregularności ) ukrytych w danych, zależności między podzbiorami danych.
3
4
5
6 Diagram liczebności Liczba oczek
7 Wykres kołowy
8 Metody opisu danych jakościowychwykres słupkowy, wykres kołowy Grupa Rok 1990/1991 Rok 1997/1998 kierunków liczba procent liczba procent Pedagogiczne 99552 18,3 91100 14 Humanistyczne 69088 12,7 110565 8,1
9 Grupa rok 1990/ rok 1997/98 kierunków liczba % liczba % pedagogiczne , ,0 humanistyczne , ,1 prawne i nauki , ,5 społeczne nauki ścisłe i , ,4 przyrodnicze medyczne , ,0 pozostałe , ,0 ogółem
10 Wstępna analiza danychOpis danych surowych: 2 próbki o liczebnościach n = oraz m = cecha jakościowa: grupa kierunków studiów 6 kategorii ( klas, atrybutów ) cechy atrybuty: grupa kierunków pedagogicznych, humanistycznych, medycznych, .... Najliczniejsze grupy kierunków: nauki ścisłe i przyrodnicze w 1990/91 roku prawo i nauki społeczne w 1997/98 roku Procentowy udział klasy = ( liczność klasy/ liczebność próbki ) x 100% = częstość x 100%
11 Wykres słupkowy procentowego udziału grup kierunków studióww r. ak. 1990/91
12 Wykres słupkowy procentowego udziału grup kierunków studióww r. ak. 1997/98
13 Wykresy słupkowe Rok 1997/98 Rok 1990/91
14 Połączony wykres słupkowypedag. prawne,społ. med.. ścisłe,przyr. inne human.
15 Połączony wykres słupkowypedag. 1990/91 1997/98 human. prawne,spol scisle,przyr. med. inne 1 2 3 4 5 6 (X )
16 1990/91 pedag. human. 18,30% prawne,spol scisle,przyr. med. inne 2,80%15,00% scisle,przyr. med. inne 12,70% 26,60% 24,60%
17
18 1997/98
19
20
21
22
23
24 28+16+12+4=60% pracowników ma co najmniej 33 lata
25
26
27
28 WSKAŹNIKI SUMARYCZNE
29 Niech
30 2000, 2000, 2000, 2000, 2500, 2500, 2500, 2500, 3500, 3500, 19000 Mediana = 2500
31
32
33 Średnia winsorowska ( z parametrem k )
34
35
36
37 Obserwacja odstająca 0,4 0,8 1,2 1,6