1 MEDIA ARITMETICA Sean n datos de una variable…El promedio de la muestra se denomina Dicho promedio es un estimador de la media de la población. La media de la población es un parámetro y se denomina
2 MEDIA ARITMETICA Frecuencia absoluta Frecuencia relativa
3 MEDIA ARITMETICA PONDERADASupongamos que medimos una distancia con 3 instrumentos: cinta métrica, nivel y regla, y estación total. Consideramos que la estación total es 10 veces más exacta que la cinta y que la cinta es 4 veces más exacta que el nivel y regla. Cómo se calcularía la distancia promedio?
4 MEDIA ARITMETICA Siempre es razonable calcular directamente el promedio sin analizar los datos? Si una distancia es medida 5 veces y los valores en metros son: 10.65 10.62 10.63 12.63 Se aplican directamente las fórmulas?????
5 Más adelante, cuando se vean los distintos tipos de errores, se verá de que forma detectar los errores groseros u outliers. La idea es detectar esos valores atípicos y eliminarlos para volver poder hacer los cálculos que correspondan
6 Existen otros tipos de medias que se analizarán en otro momentoMedia armónica Media geométrica Media cuadrática
7 Volviendo al promedio…Hay que tener presente que el verdadero valor de una magnitud nunca se puede conocer con exactitud total. Para algunos casos, podemos considerar el promedio como el valor más probable (o el que más se aproxima al verdadero valor). Definimos el concepto de residuo:
8 Qué sucede si quiero conocer el promedio de los desvíos o residuos de todos mis datos respecto del promedio?????
9 Recordemos que:
10 MEDIANA Es un número tal que la mitad de las observaciones sean menores y la otra mitad mayores. Si n es impar M es la observación central Si tengo n datos, se ordenan de forma ascendente Si n es par M es la media de las observaciones centrales
11
12
13 Mediana y media de una curva de densidadLA MEDIANA DE UNA CURVA DE DENSIDAD ES EL PUNTO QUE DIVIDE AL AREA POR DEBAJO DE LA CURVA EN DOS PARTES IGUALES LA MEDIANA Y LA MEDIASON IGUALES EN EL CASO DE CURVAS DE DENSIDAD SIMÉTRICA.
14 LA MEDIA DE UNA CURVA DE DENSIDAD ES EL PUNTO DE EQUILIBRIO EN EL CUAL LA CURVA SE EQUILIBRARÍA SI ESTUVIERA HECHA DE UN MATERIAL SÓLIDO
15
16 También es conocido con el nombre de RECORRIDOEl RANGO podría tener el inconveniente de estar afectado fuertemente por observaciones atípicas
17
18 Cuartiles Ordenar las observaciones de forma crecienteEl primer cuartil se sitúa en el primer 25% de las observaciones El tercer cuartil se sitúa en el primer 75% de las observaciones El segundo cuartil sería la mediana
19 Cuartiles Ordenar datosEl primer cuartil Q1 es la mediana de las observaciones a la izquierda de la mediana de la totalidad El tercer cuartil Q3 es la mediana de las observaciones situadas a la derecha de la mediana de la totalidad
20
21
22
23 Grados de libertad La suma de las desviaciones es siempre 0La última desviación se puede hallar cuando se conocen las otras n-1. Por tanto sólo n-1 observaciones son independientes Al número n-1 se le llama grados de libertad de la varianza o desviación estándard Lo correcto es calcular dividiendo por n-1, para valores de n muy grandes no habrán diferencias apreciables
24
25
26
27 Curvas de densidad NINGUN CONJUNTO DE DATOS REALES ES DESCRITO EXACTAMENTE POR UNA CURVA DE DENSIDAD. LA CURVA ES UNA IDEALIZACIÓN DE LA DISTRIBUCIÓN DE DATOS La curva es más sencilla para trabajar que el histograma El área por debajo de la curva vale 1 Las áreas por debajo de la curva representan proporciones de observaciones
28 Mediana y media de una curva de densidadLA MEDIANA DE UNA CURVA DE DENSIDAD ES EL PUNTO QUE DIVIDE AL AREA POR DEBAJO DE LA CURVA EN DOS PARTES IGUALES LA MEDIA DE UNA CURVA DE DENSIDAD ES EL PUNTO DE EQUILIBRIO EN EL CUAL LA CURVA SE EQUILIBRARÍA SI ESTUVIERA HECHA DE UN MATERIAL SÓLIDO LA MEDIANA Y LA MEDIASON IGUALES EN EL CASO DE CURVAS DE DENSIDAD SIMÉTRICA.
29 LA MEDIA DE UNA CURVA DE DENSIDAD ES EL PUNTO DE EQUILIBRIO EN EL CUAL LA CURVA SE EQUILIBRARÍA SI ESTUVIERA HECHA DE UN MATERIAL SÓLIDO
30 Notación importante Dado que la curva de densidad es una descripción idealizada de una distribución de datos, se debe distinguir entre la media y desviación típica de una curva de densidad, y la media y la desviación estándar s calculadas a partir de observaciones reales La notación habitual de una media de una distribución idealizada es m La notación habitual de la desviación estandar de una distribución idealizada es s
31 Distribución normal Sin duda, la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución normal, gaussiana o de Laplace-Gauss. Fue descubierta y publicada por primera vez en 1733 por De Moivre. A la misma llegaron, de forma independiente, Laplace (1812) y Gauss (1809), en relación con la teoría de los errores de observación astronómica y física . 31
32 Porque son tan importantes las distribuciones normales en estadística?Las distribuciones normales dan buenas descripciones de algunas distribuciones de datos reales Las distribuciones normales son buenas aproximaciones a los resultados de muchos fenómenos aleatorios Muchos procedimientos de inferencia estadística dan buenos resultados cuando se aplican a distribuciones aproximadamente simétricas
33 Características de la distribución NormalTiene forma de campana, es asintótica al eje de las abscisas (para x = ) Simétrica con respecto a la media () donde coinciden la mediana (Mn) y la moda (Mo). Los puntos de inflexión tienen como abscisas los valores . Puntos de inflexión + - + , Mo, Mn 33 33
34 N(μ, σ): Interpretación probabilistaEntre la media y una desviación típica tenemos siempre la misma probabilidad: aproximadamente el 68%. Entre la media y dos desviaciones típicas aprox. 95% Si tomamos intervalos centrados en μ, y cuyos extremos están… a distancia σ, tenemos probabilidad 68% a distancia 2 σ, tenemos probabilidad 95% a distancia 2’5 σ tenemos probabilidad 99% 34 34
35 Problema… Un estudiante A obtuvo 680 puntos en la prueba P1 de matemáticas. La distribución de las notas de P1 es normal con media 500 y desviación estandar 100. Un estudiante B obtuvo 27 puntos en la prueba P2 de matemáticas. La distribución de notas es normal con media 18 y desviación estándar 6. Si las pruebas son similares, ¿cuál estudiante obtuvo mejor nota?
36 Es una traslación , y un cambio de escala de la variable original.¿Cómo calcular probabilidades asociadas a una curva normal específica? Dado que tanto como pueden asumir infinitos valores, es impracticable tabular las probabilidades para todas las posibles distribuciones normales. Para solucionarlo, se utiliza la distribución normal reducida o tipificada. x - Se define una variable z = Es una traslación , y un cambio de escala de la variable original. 36 36
37 La nueva variable z se distribuye como una NORMAL con media = 0 y desviación típica = 1Recordemos de nuevo que en cualquier distribución normal las probabilidades delimitadas entre : 68 % 2 95 % 3 99 % 68% 95% 99% z 37 37
38 Ejemplo La distribución de alturas de mujeres es aproximadamente normal con Cual es la altura estandarizada?
39 Ejemplo La altura estandarizada de una mujer es el número de desviaciones estándar que su altura difiere de la media de la altura de todas las mujeres Cual es la altura estandarizada de una mujer que mide 1.72 m? Cual es la altura estandarizada de una mujer que mide 1.56 m?