1 REPÚBLICA BOLIVARIANA DE VENEZUELA LA UNIVERSIDAD DEL ZULIA FACULTAD DE CIENCIAS Económicas Y SOCIALES División de estudios para Graduados Inferencia estadística Mgs. Anais Álvarez Correo electrónico: [email protected]@yahoo.com [email protected] MARACAIBO,abril de 2008
2 OBJETIVO GENERAL Plantear una hipótesis científica en términos estadísticos Evaluar una situación soportado con el contraste hipotético adecuado.
3 CONTENIDOPROGRAMATICO INFERENCIA ESTADÍSTICA 1.-INFERENCIA. 1.1. Definición 1.2..TEOREMA DEL LIMITE CENTRAL 1.3DISTRIBUCION DE MUESTREO 1.4. TIPOS : Estimación y pruebas de hipótesis 2.- ESTIMACIÓN DE PARÁMETROS 2.1. Clasificación de la estimación: puntual y intervalo de cnfianza 2.1. Clasificación de la estimación: puntual y intervalo de cnfianza 2.2. Para la media Poblacional 2.2. Para la media Poblacional *Cuando se conoce la desviación estándar *Cuando se conoce la desviación estándar *Cuando no se conoce la desviación estándar *Cuando no se conoce la desviación estándar 3.- PRUEBA DE HIPÓTESIS. 3.1.DEFINICION DE HIPOTESIS 3.1.DEFINICION DE HIPOTESIS 3..2.PROCEDIMIENTO 3..2.PROCEDIMIENTO 4.- PRUEBA PARA UNA POBLACIÓN 5.- PRUEBA PARA DOS POBLACIONES Anais alvarez 2008
4 Actividad Reunirse en grupos de 5 o 6 Realizar un resumen del punto tratado Elaborar el resumen en papel bond Exponer el punto tratado Grupo 1 parte inferencia distribucion y teorema.
5 La inferencia estadística es un proceso que consiste en utilizar los resultados de una muestra para llegar a conclusiones acerca de las características de la población. (Stevenson, William) La teoría de Inferencia Estadística consiste en aquellos métodos con los cuales se puede inferir o generalizar acerca de la población. La inferencia estadística es un tipo de razonamiento que produce de lo concreto a lo general: intenta extraer conclusiones sobre los parámetros de una población a través de información contenida en los estadísticos de una muestra procedente de esa población. Actividad: a.Define con tus propias palabras INFERENCIA ESTADISTICA. ___________________________________________________________ ___________________________________________________________ _________________________________________________________ 1.INFERENCIA ESTADÍSTICA. 1.1.DEFINICIÓN
6 1.2.Clasificación de la inferencia La Inferencia puede dividirse en dos principales áreas: Estimación Prueba de Hipótesis Cuál ? 1.Depende del tipo de Variable y su distribución 2.El numero de variables 3.De la finalidad de la investigación o estudio estimación, correlación,`predicción pone el énfasis en intentar detectar la presencia de un afecto significativo ( grupos que difieren, variables que correlacionan, etc.), pone énfasis en intentar cuantificar el tamaño del efecto detectado ( valor del parámetro) (cuando difieren dos grupos, como de intensa es a relación entre dos variables.
7 1.2.Clasificación de la inferencia Paramètrica Analiza datos de variables cualitativas o categóricas No requiere o no cumple con los supuestos de distribución normal Distribución libre Permite contrastar hipótesis referidas a algún parámetro Exigen el cumplimiento de determinados supuestos sobre las poblaciones originales, de las que se extraen los datos (generalmente normalidad y homocedasticidad). Analizan datos obtenidos con una escala de medida de intervalo o razón. Cuál ? No paramètrica Para una muestra Para dos muestra Para n muestras
8 Cómo se puede detectar si una variable tiene una distribución Normal? 1.Haciendo la prueba de normalidad de 2.Explorando los datos recopilados de la variable a través de una representación gráfica, en un histograma. Se debe tener en cuenta las características de la distribución normal, la forma, de modo que se sabe que alrededor de 68% de los valores estadísticos de la muestra están comprendidos dentro de la una desviación estándar de la media de la distribución del muestreo que es igual a la media de la población, y que casi el 95% de los valores medios de la muestra estarán dentro de 1.96 desviaciones estándar de la media. Con lo cual se mide la distancia de la media poblacional a partir de la desviación estándar de la población. En consecuencia, si se establece la proposición de que la media de una muestra esta dentro de 1.96 desviaciones estándar de la media verdadera, es posible esperar estar en lo cierto un 95% de las veces, y estar equivocado el 5% restantes.
9 Anais Alvarez ABRIL 2008 Consultar http://www.xtec.es/~jcorder1/super/curva.htm http://www.fisterra.com/mbe/investiga/distr_normal/distr_normal.htm 1.2.Clasificación de la inferencia
10 1.3.TEOREMA DEL LIMITE CENTRAL 2. Si se cumple el teorema de limite central, a continuación se exponen algunos definiciones de diferentes autores Se cumple, cuando independientemente de la población de origen, la distribución de la medias aleatorias se aproxima a una distribución normal a medida que el tamaño de la muestra crece.( Bencardino,321:2.000) Al hacerse lo bastante grande el tamaño de la muestra la distribución de muestreo de la media puede aproximarse mediante la distribución normal. Esto es cierto no importa la forma de la distribución de los valores individuales de la población. Para la mayoría de distribuciones de la población, sin importar la forma, la distribución de muestreo de la media tendrá una distribución aproximadamente normal si se seleccionan muestras de al menos 30 observaciones.(Berenson y Levine: 1996:329) Anais Alvarez ABRIL 2008
11 28/05/2016 1.3.- TEOREMA DEL LIMITE CENTRAL Para introducir el logotipo de su organización en esta diapositiva En el menú Insertar Seleccione “Imagen” Ubique el archivo del logotipo Haga clic en Aceptar Para cambiar el tamaño del logotipo Haga clic en cualquier parte dentro del logotipo. Los cuadros que aparecen fuera del logotipo se denominan “controladores de tamaño”. Úselos para cambiar el tamaño del objeto. Para mantener las proporciones del objeto al que desea cambiar el tamaño, mantenga presionada la tecla Mayús mientras usa los controladores de tamaño. Sea cual sea la forma de la distribución de la población (sea normal o no ), ! las medias de todas las muestras seleccionadas de la población tendrán una distribución normal ! La claves del éxito para aplicar el teorema es que el tamaño de la muestra sea mayor que treinta (n> 30) Anais Alvarez ABRIL 2008
12 UNA MUESTRA ALEATORIA DE TAMAÑO n DE UNA POBLACIÓN ƒ(x), ES UNA COLECCIÓN DE n VARIABLES ALEATORIAS INDEPENDIENTES X1, X2,….,Xn TENIENDO CADA UNA LA MISMA DISTRIBUCIÓN POBLACIONAL ƒ(x). 1.4.DISTIBUCION DE MUESTREO El termino distribución muestral se refiere a la función de probabilidad (o de densidad de probabilidad) de un estadístico. Por tanto, una distribución muestral puede quedar definida como una distribución teórica que asigna una probabilidad concreta a cada uno de los valores que puede tomar un estadístico en todas las muestras del mismo tamaño que es posible extraer de una determinada población. (Pardo Merino 2002) Anais Alvarez ABRIL 2008
13 PARAMETRO ES UNA PROPIEDAD DESCRIPTIVA DE LA POBLACIÓN. ESTADÍSTICO ES UNA PROPIEDAD DESCRIPTIVA DE LA MUESTRA. ES UNA FUNCIÓN DE LAS OBSERVACIONES MUESTRALES. TODO ESTADÍSTICO ES EN SI, UNA VARIABLE ALEATORIA. 1 1.4.DISTIBUCION DE MUESTREO Una Distribución de muestreo es una función de probabilidad de un estadístico Una Distribución de muestreo es una función de probabilidad de un estadístico Anais Alvarez ABRIL 2008
14 ESTADÍSTICO 1 1.4.DISTIBUCION DE MUESTREO μ μμ σ 2σPμμ σ 2σPμ μμ σ 2σPμμ σ 2σP Anais Alvarez ABRIL 2008 X S S 2 S pX S S 2 S p Media Varianza Desviación Estándar Proporción PARAMETRO
15 E (x) = μ σ 2= Varianza / Desviación estándar se usa el termino error Típico σ X =σ / Desviación estándar se usa el termino error Típico . 1 1.4.DISTIBUCION DE MUESTREO Una Distribución de muestreo queda caracterizada porque tiene un valor esperado y una varianza Una Distribución de muestreo queda caracterizada porque tiene un valor esperado y una varianza LA DISTRIBUCIÓN DE LA MEDIA MUESTRAL X BASADA SOBRE UNA MUESTRA ALEATORIA DE TAMAÑO n TIENE COMO: E(X)=μ y V(X) = E(X)=μ y V(X) = n Anais Alvarez ABRIL 2008
16 2.Estimación. Definición La estimación es un proceso de utilizar datos muéstrales para estimar los valores de parámetros desconocidos de una población. Esencialmente, cualquier características de la población se pueden estimar a partir de una muestra al azar. Debemos hacer la distinción entre estimador y estimaciones. Cualquier estadística de muestra que se utiliza para estimar un parámetro de la población se conoce como estimador, es decir, un estimador es una estadística de muestra utilizada para estimar un parámetro de la población. La media de la muestra x puede ser un estimador de la media de la población. Una estimación es un valor especifico observado de una estadística. Hacemos una estimación si tomamos una muestra y calculamos el valor que toma el estimador en esa muestra. Por ejemplo, se toma la lectura media en kilometraje a partir de una muestra de taxis en servicio, el valor obtenido es de 160.000 kilómetros. Estimador: lectura media del recorrido en kilometraje Estimación: 160.000 kilómetros recorridos en promedio por taxis Actividad: Indique la(s) diferencia(s) entre el estimador y la estimación
17 2.Estimación. Criterios para Seleccionar un Buen Estimador Podemos evaluar la calidad de una estadística como un buen estimador mediante el uso de cuatro criterios: a. Imparcialidad. El termino Imparcialidad se refiere al hecho de que una media de muestra es un estimador no sesgado de la media de la población porque la media de la distribución de muestreo de las medias de muestra tomadas de una población es igual a la media de la población misma. b. Eficiencia. Se refiere al tamaño del error estándar de la estadística. Si comparamos dos estadísticas de una muestra del mismo tamaño y tratamos de decidir cual de ellas es un mejor estimador más eficiente, escogeríamos la que tuviera el menor error estándar o la menor desviación estándar de la distribución de muestreo. c. Coherencia. Una estadística es un estimador coherente de un parámetro de la población si al aumentar el tamaño de la muestra, se tiene la certeza de que el valor de la estadística se aproxima bastante al valor del parámetro de la población. d. Suficiente. Un estimador es suficiente si utiliza una cantidad de la información contenida en la muestra que ningún otro estimador podría extraer información adicional de la muestra sobre el parámetro de la población que se está estimando. Anais Alvarez ABRIL 2008
18 2.1. Tipos de Estimación Podemos hacer dos tipos de estimaciones concernientes a una población: Estimación Puntual Estimación por intervalos Anais Alvarez ABRIL 2008
19 2.1. Tipos de Estimación a. Estimación Puntual La estimación puntual es un solo número que se utiliza para estimar un parámetro de la población desconocido. Los valores estadísticos muéstrales se utilizan como estimadores de los parámetros de la población. Así, la media de la muestra se utiliza como estimación del valor de la media de la población; la desviaron Estándar de la muestra se emplea como una estimación de la desviación estándar de la población., la cual se expresa: Anais Alvarez ABRIL 2008
20 2. 1.Tipos de Estimación b. Estimación de intervalos Una estimación de intervalo es un conjunto de valores entre dos extremos dados que se utiliza para estimar un parámetro. Esta estimación indica el error de dos maneras por la extensión del intervalo y por la probabilidad de obtener el verdadero valor de la población que se encuentra dentro del intervalo. Es decir, estas estimaciones proporcionan un intervalo de los valores posibles para el parámetro de la población. La estimación por intervalo de un parámetro poblacional( ) es un intervalo de la forma inferior superior, donde inferior y superior depende del valor del estadístico para una muestra particular y también de la distribución muestral El intervalo de estimación indica, por su longitud, la precisión de la estimación puntual. Anais Alvarez ABRIL 2008
21 2.1. Tipos de Estimación A partir de la distribución muestral de la estimación de cualquier parámetro ( será posible determinar valores inferior y superior tales que la P ( inferior ≤ ≤ superior ) = 1 - Donde 1 - se denomina intervalo de confianza o grado de confianza, el cual proporciona unos intervalos de valores, centrado en el valor estadístico de la muestra, en el cual supuestamente se ubica el parámetro de la población, con un riesgo de error. , se denomina nivel de significación, indica la porción que se encuentra en los extremos de la distribución que están fuera del intervalo de confianza, el nivel de riesgo. Los valores van comprendido 0 < < 1. inferior ≤ ≤ superior, son los puntos extremos o limites de confianza inferior y superior. De tal manera que cuando = 0.05, se tiene un intervalo de confianza del 95% y cuando = 0.01, se tiene una seguridad de que 99% en el intervalo dado que contiene el parámetro desconocido. Anais Alvarez ABRIL 2008
22 3. Tipos de Estimación La estimación de intervalo es un método que nos permite no sólo encontrar la mejor estimación del valor de un parámetro, sino también el probable grado de error en la estimación. Lo que implica que nos proporciona en rango de valores posibles de un parámetro. Cada intervalo de confianza incluye o no al verdadero valor del parámetro que se estima, el nivel de confianza (1- ), nos indica que en el limite, el (1- ) de los intervalos así construidos incluyen el valor poblacional. Por ejemplo, la interpretación del intervalo de confianza, sería: Una estimación de intervalo de confianza de 95%, nos indica como si se tomaran todas las muestras posibles del mismo tamaño, n, 95% de ellas incluirían el valor de la media real en alguna parte del intervalo alrededor de sus medias de muestras, y solamente el 5% de ellas no están incluidas.(Berenson y Levine,1996:346) Anais Alvarez ABRIL 2008
23 2.3. Estimación De La Media De La Población. La estimación de intervalo de la media poblacional se basa en el supuesto de que la distribución del muestreo sea normal. Del conocimiento de la distribución de la población, podemos determinar el porcentaje de medias de muestra que caen dentro de ciertas distancias de la media de la población. El método empleado para estimar la media de la población depende de sí se conoce la desviación estándar de la misma o si ésta se debe estimar a partir de los datos muéstrales: Estimación De Intervalo De Confianza De La Media, Conociendo La Desviación Estándar Poblacional ( Estimación De Intervalo De Confianza De La Media, Desconociendo La Desviación Estándar Poblacional ( Actividad: definir Desviación estándar e indicar para que sirve. _________________________________________________________________________ _______________________________________________________________________________
24 2.3. Estimación De La Media De La Población. De acuerdo al teorema de limite central, es de esperarse que la distribución muestral de tenga una distribución aproximadamente normal con una media x y desviación estándar x .(Ver figura Nº 1) Figura Nº 1 El intervalo de confianza esta centrado respecto al valor medio de la muestra intervalo intervalo de confianza de confianza X – Z x X X + Z x X – Z x X X + Z x0
25 2.3 Estimación intervalo de confianza De La Media De La Población cuando se conoce la Desviación Estándar poblacional. Cuando se conoce la desviación estándar de la población, la estimación del intervalo de la media se calcula de la siguiente manera: X Z x Sustituyendo, queda Limite inferior Limite superior Donde : es la media muestral Z 1- : Es el valor de Z a la derecha de la cual se tiene el área de , representa la confianza deseada, se conoce como el valor critico de la distribución. : Es el error de una estimación de intervalo que se refiere a la desviación o diferencia entre el valor medio de la media muestral y la media real de la población.
26 2.3. Estimación De La Media De La Población cuando no se conoce la Desviación Estándar poblacional. Por lo general se desconoce la desviación estándar real de la población, por lo tanto los cálculos de los intervalos de confianza se deben basar en la Distribución T de Student, su origen se remonta a principios del siglo XX, fue William S. Gosset el que planteo esta distribución, empleado de una cervecería en Irlanda, puesto que no se les permitía publicar investigaciones con los nombres propios adopta un seudónimo de Student. Si la variable X esta distribuida en forma normal, entonces el estadístico es
27 2.3. Estimación De La Media De La Población cuando no se conoce la Desviación Estándar poblacional. Propiedades de la distribución t de Student Tiene forma de campana y es simétrica, al igual que la distribución normal. Sin embargo, la distribución t tiene mas área en las colas y menos en el centro. Debido a que se usa S en vez de . (Ver la Figura Nº 3) La distribución t es bastante sensible con respecto al tamaño de la muestra, sin embargo esta sensibilidad disminuye en el caso de tamaños muéstrales grandes. La distribución t presenta un área ( probabilidad) mayor en los extremos que la distribución normal. Esto significa, para un nivel de confianza dado, el valor t será un poco mayor que el correspondiente a Z. El aspecto interesante de la distribución t es que no es una de tipo estandarizado, en caso de cada tamaño de la muestra existe una distribución t diferente, Hay una tabla para los valores t al igual que para los valores z, para utilizarla debemos conocer el nivel de confianza y los grados de libertad. Figura N° 3 Distribución t’student t’student Normal
28 2.3. Estimación De La Media De La Población cuando no se conoce la Desviación Estándar poblacional. gl Valores distribución t’student.001.01.025..05.......10.001.01.025..05.......1012.24.29 2.064 2.064 Figua N°4
29 La finalidad de la prueba de significación es decidir si una afirmación acerca de un parámetro es verdadera El Propósito de una prueba de Hipótesis es determinar si el valor supuesto (Hipotético) de un parámetro poblacional, como la media de la población debe aceptar como verosímil con base a evidencia muéstrales..(Kazmier, Leonard. 1.996) El tiempo promedio de un examen es de 80 minutos. 3.PRUEBAS DE HIPÓTESIS. 3.1.DEFINICIÓN de Hipótesis Hipótesis científica Hipótesis científica es una afirmación verificable sobre un problema o Fenómeno, es decir empíricamente contrastable donde se establece la forma operativa las variables (Pardo Merino.2002 ) El contraste de hipótesis Puede ser entendido como un método de toma de decisiones: un contraste de hipótesis, también llamado prueba de significación o prueba estadística, es un procedimiento que permite decidir si una proporción acerca de una población puede ser mantenida o debe ser rechazada (Pardo Merino.2002)
30 3.1.DEFINICIÓN de Hipótesis Las hipótesis estadísticas Las hipótesis estadísticas. Es una afirmación sobre una o mas distribuciones de probabilidad; mas concretamente; sobre la forma de una o mas distribuciones. Las hipótesis estadísticas se suelen representar por la letra H seguida de una afirmación que da contenido a la hipótesis (Pardo Merino.2002) Las hipótesis estadísticas son la transformación de la hipótesis de investigación, nula y alternativas en símbolos estadísticos. Se pueden formular sólo cuando los datos del estudio que se van a recolectar y analizar para probar o rechazar las hipótesis son cuantitativas (números, porcentajes, promedios). (HERNÁNDEZ, 1998:90)
31 3.1.DEFINICIÓN de Hipótesis EJEMPLO: Hipótesis científica: El nivel de colesterol en sangre de los hombres no difiere del de las mujeres Hipótesis estadística: el promedio de la variable Nivel de colesterol En sangre de la población de Hombres es igual al promedio de esa misma Distribución en la población de mujeres H: hombres = mujeres
32 Procesamientos para la verificación de la hipótesis científica (Pardo Merino) de la hipótesis científica (Pardo Merino) Procesamientos para la verificación de la hipótesis científica (Pardo Merino) de la hipótesis científica (Pardo Merino) Anais Alvarez abril 2008 1. Formular la hipótesis científica en H. estadística 2.Buscar evidencia empírica **Seleccionar una muestra aleatoria 3. Regla de Decisión, términos de probabilidad Un contraste de hipótesis es un proceso de decisión en el que una hipótesis formulada en términos estadísticos es puesta en relación con los datos empíricos para determinar si es o no compatible con ellos Matriz de Datos
33 3.2.Hipótesis. Términos Hipótesis Nula: La hipótesis de que el parámetro de la población es igual a las especificaciones investigadas se conoce como hipótesis nula. Es un enunciado que expresa que el parámetro de la población es como se especifica, es decir la proposición es verdadera. (Berenson y Levine,1996:385) Simbología HoSimbología Ho Hipótesis Alternativa, es un enunciado que ofrece lo opuesto o una alternativa a la proposición de la hipótesis nula. Representa la conclusión a la que se llegaría si hubiera suficiente evidencia de la información de la muestra para decidir que es improbable que la hipótesis nula sea verdadera (Berenson y Levine,1996:385) Simbología H1, Hi o Ha Nivel de significación, es la probabilidad de rechazar una hipótesis nula que sea verdadera. Se simboliza con la letra griega . Valor estadístico de prueba, mide que tan cerca de la hipótesis nula se encuentra el valor de la muestra. Su formulas dependerá de la distribución de probabilidad que se desee aplicar y de la situación si se conoce o no la desviación estándar de la población.
34 28/05/2016 HIPOTESIS NULAS. EJEMPLOS Para introducir el logotipo de su organización en esta diapositiva En el menú Insertar Seleccione “Imagen” Ubique el archivo del logotipo Haga clic en Aceptar Para cambiar el tamaño del logotipo Haga clic en cualquier parte dentro del logotipo. Los cuadros que aparecen fuera del logotipo se denominan “controladores de tamaño”. Úselos para cambiar el tamaño del objeto. Para mantener las proporciones del objeto al que desea cambiar el tamaño, mantenga presionada la tecla Mayús mientras usa los controladores de tamaño. Ho: “ La expectativa de ingreso mensual de los trabajadores petroleros NO oscila entre 800 y 1000 dólares”. Ho: “ NO hay relación entre autoestima y el temor de logro”. Ho: “El tiempo en que tardan en desarrollar el SIDA las personas contagiadas por transfusiones sanguíneas NO es menor que las que adquieren el VIH por transmisión sexual”. Ho: “ La desintegración familiar de los padres NO provoca baja autoestima en los hijos”. Profesor edison Jiménez
35 28/05/2016 HIPOTESIS ALTERNATIVAS EJEMPLOS Para introducir el logotipo de su organización en esta diapositiva En el menú Insertar Seleccione “Imagen” Ubique el archivo del logotipo Haga clic en Aceptar Para cambiar el tamaño del logotipo Haga clic en cualquier parte dentro del logotipo. Los cuadros que aparecen fuera del logotipo se denominan “controladores de tamaño”. Úselos para cambiar el tamaño del objeto. Para mantener las proporciones del objeto al que desea cambiar el tamaño, mantenga presionada la tecla Mayús mientras usa los controladores de tamaño. Hi: “ El candidato A obtendrá en la elección para la presidencia del consejo escolar entre el 50 y 60 % de la votación total ”. Ho:“El candidato A no obtendrá en la elección para la presidencia del consejo escolar entre el 50 y 60 % de la votación total ”. Ha:“El candidato A obtendrá en la elección para la presidencia del consejo escolar más del 50 % de la votación total ”. Ha:“El candidato A obtendrá en la elección para la presidencia del consejo escolar menos del 60 % de la votación total ”. Ha:“El candidato A obtendrá en la elección para la presidencia del consejo escolar menos del 60 % de la votación total ”. Profesor edison Jiménez
36 3.2.Hipótesis. Términos Tipos de hipótesis según el objetivo o finalidad de la investigación Estimación Estimación Correlacional o relación entre variables Correlacional o relación entre variables Diferencia entre Grupo Diferencia entre Grupo Relación de causalidad Relación de causalidad
37 3.2. Errores De Tipo I Y II Pueden ocurrir dos tipos de problemas al aplicar el enfoque de la prueba de hipótesis a la toma de decisiones relacionados con los parámetros de la población. (ver Figura Nº6) ¨ Error Tipo I se da cuando se rechaza la hipótesis nula cuando en realidad es cierta, se conoce como α. También denominado nivel de significación. ¨ El error tipo II ocurre cuando no se rechaza la Ho nula siendo falsa y se debería rechazar, se le conoce con la llamada β. El complemento de la probabilidad de un error tipo II se conoce como potencia de una prueba estadística. Es la probabilidad de rechazar la hipótesis nula cuando es falsa.Decisión Estadística HoVerdaderaHoFalsa Aceptar Ho 1-α Conclusión Correcta Error tipo II probabilidad β Rechazar Ho Error Tipo I Conclusión correcta Figura Nº 5 Pruebas de Hipótesis
38 3.2procedimiento de la prueba de hipótesis 1. E l primer paso constituye en formular la hipótesis nula, en el ámbito general las hipótesis son explicaciones potenciales que intenta información acerca de hechos observados en situaciones que existen algunos factores desconocidos. Esta se puede establecer como: Ho: = o Ho: o Ho: o 2. E stablecer la Hipótesis Alternativa, se utiliza para indicar que aspecto de variación no aleatoria resulta de interés. Existen tres tipos posibles: concentrarse en ambas direcciones; concentrarse en desviaciones por debajo del valor esperado; concentrarse en desviaciones por encima del valor esperado. Simbólicamente, se expresaría los tres casos de la siguiente manera: Hi : = o (demasiado o muy pocas, prueba bilateral o de dos colas) Hi : < o ( Desviaciones por debajo, prueba de una sola cola o Unilateral ) Hi : > o Hi : > o (Desviaciones por arriba, prueba de una sola cola o Unilateral ).
39 3.2.Procedimiento Para Realizar Pruebas De Hipótesis de la media poblacional 3. El tercer paso, la distribución de muestreo o utilizar y seleccionar un nivel de significación que sea aceptable que es la probabilidad de rechazar una hipótesis nula que sea verdadera, también es conocido como error tipo I. Esto, a su vez, indicara el valor critico correspondiente que servirá como un estándar de comparación respecto al cual juzgar un valor critico de prueba. 4. El siguiente paso es establecer los valores critico que divide la región de rechazo y de no rechazo, el trazado dependerá de cómo este formulada la hipótesis alternativa, si es mayo, menor o diferente., quedando dividida en dos regiones. Si por ejemplo la Hipótesis alternativa tiene el signo de menor, el valor critico se trazará en el extremo inferior de la distribución( Ver figura Nº 6) Rho : Región de rechazo o región critica, se considera compuesta por los valores de la prueba estadística que es poco probable que ocurran si la hipótesis nula es cierta. No Rho:Región de no rechazo, si la prueba cae en esta región no se puede rechazar la hipótesis nula Figura N 6 Regiones de rechazo y no rechazo en una prueba de hipótesis
40 4.1.Procedimiento de las Prueba De Hipótesis Para La Media, 5. Seleccionar y calcular El Valor Estadístico de Prueba, que dependerá de la distribución de probabilidad que se desee aplicar y de la situación si se conoce o no la desviación estándar de la población. Calcular el valor del estadístico de prueba con los datos muéstrales. Si se supone que se conoce la desviación estándar, entonces la distribución muestral de la media seguirá la distribución normal,en esta formula el numerador mide que tan lejos esta la media hipotética x de la media observada X. El denominador es el error estándar, por lo que Z representa los valores estándar de x. V.E.P cuando se conoce V.E.P cuando se no conoce
41 3.2.Procedimiento Para Realizar Pruebas De Hipótesis 6.Regla de Decisión 6.Regla de Decisión Determinar si la prueba estadística ha caído en la región de rechazo o en la de no rechazo y tomar una decisión. Expresar la decisión estadística en términos del problema o investigación. Si [Valor estadístico de prueba > valor critico] Rho Si [Valor estadístico de prueba valor critico ] Rho
42 Población Tamaño de Muestra conocida desconocida Con Distribución Normal Grande(n 30) o Pequeña(n
43 .6 Pruebas de Hipótesis medias poblacionales para dos o mas muestras independientes, con SPSS muestras independientes, con SPSS Pasos para realizar la prueba mediante ANOVA (Berenson 2001; Perez 2002; Downie y otros, 1973). Fuente Grados de libertadSuma de Cuadrados Media cuadratica (varianza) Fc Regresión (Entre) p: numero de variables explicativas SCRMCR= SCR /p F=MCR MCE Error (Dentro) n-p-1SCEMCE=SCE/ n-p-1 Total n-1SCT Tabla de Análisis de varianza ANOVA Análisis de varianza (ANOVA) Es un método para comparar dos ó más medias. La importancia estriba en lo siguiente: Si los grupos son muestras aleatorias que proceden de la misma población, las dos varianzas, dentro y entre, sin estimaciones insesgadas de la varianza de la misma población. Es posible contrastar la significación de las dos varianzas, mediante F. Como en la tabla está en función de las medidas de variación.
44 .6 Pruebas de Hipótesis medias poblacionales para dos o mas muestras independientes, con SPSS muestras independientes, con SPSS Pasos para realizar la prueba de hipótesis con mas de dos muestras mediante Distribución F mediante Distribución F Análisis de varianza (ANOVA ) Supuestos Los elementos de los diversos subgrupos se suponen elegidos por muestreo aleatorio de poblaciones de distribución normal. La varianza de los subgrupos ha de ser homogéneas ( Ho: σ 2 = σ 2.....=σ 2 ). La muestra que constituye los subgrupos han de ser independientes. (Downie y otros, 1973:273) Consultar el la pagina del grupos sobres distribución F, aparece como marcadores http://html.rincondelvago.com/distribuciones-de-probabilidad_1.html
45 Prueba de hipótesis para la media, dos o mas muestras independientes Pasos para realizar la prueba de hipótesis mediante Distribución F (Berenson 2001; Perez 2002) Fc F=MCR MCE 1.H 0 : 1 = 2 =... P = 0 2.H 1 : al menos un 0 4. R.R. Para Distribución F p y n-p-1 y un error tipo I Si Fc > Fsuperior /2 RHo 3. Valor estadístico de prueba Repasemos Distribición F:_________ ____________________ ______________________
46 4.1. procedimiento de las pruebas con SPSS Sig, valor P o valor de Probabilidad, es el nivel de significación según lo observado por la muestra. Es la probabilidad exacta o nivel observado de cometer el error Tipo l, es decir el nivel más bajo de rechazar la hipótesis nula siendo verdadera Es arrojado en la salida de SPSS en la última columna. 1. Ho: = o Ho: o Ho: o Ho: o Ho: o Hi : = o 2. Hi : = o Hi : < o Hi : < o Hi : > o Hi : > o 3. Regla de decisión < SIG o valor P < RHO = Nivel de Significación, Error Tipo I rechazar la Ho siendo verdadera. Es fijada por el investigador Practica Nro 1
47 4.1. procedimiento de las pruebas con SPSS prueba de normalidad Sig, valor P o valor de Probabilidad, es el nivel de significación según lo observado por la muestra. Es la probabilidad exacta o nivel observado de cometer el error Tipo l, es decir el nivel más bajo de rechazar la hipótesis nula siendo verdadera Es arrojado en la salida de SPSS en la última columna. 1, Ho: Normal = o 2. Hi : No normalidad 2. Hi : No normalidad 3. Regla de decisión < SIG o valor P < RHO Prueba de Kolmogorov-Smirnov Practica Nro 1
48 5. Pruebas de Hipótesis para dos medias poblacionales muestras independientes muestras independientes La pruebas de hipótesis para dos medias poblacionales, es una extensión del procedimiento explicado para una muestra, donde se tienen que cumplir los supuestos expresados en la diferencias de dos medias poblaciones muestra independientes. Es decir la misma variable diferentes grupos.. Los supuestos que se deben cumplir para realizar inferencia de dos poblaciones, con muestras independientes: Normalidad. Las dos poblaciones tiene que tener una distribución normal HOMOGENEIDAD DE VARIANZAS. Las varianzas de las poblaciones son iguales: se puede verificar con la prueba de LEVENE para igualdad de varianzas La variable es cuantitativa escala razón, se
49 5. Pruebas de Hipótesis para dos medias poblacionales La pruebas de hipótesis para dos medias poblacionales, es una extensión del procedimiento explicado para una muestra cuando no se conoce la desviaciones estandar poblacionales. El procedimiento es igual al planteado en la sección anterior, lo que diverge es que se realizara en base a la desviación estándar muestral, por lo tanto se empleará la Distribución t student, cumpliéndose todos los supuestos para la aplicación de la formula. El valor Estadístico de prueba :
50 15. Pruebas de Hipótesis para dos medias poblacionales muestras independientes, con SPSS muestras independientes, con SPSS 15. Pruebas de Hipótesis para dos medias poblacionales muestras independientes, con SPSS muestras independientes, con SPSS SE DEBE REALIZAR LA PRUEBA DE homogeneidad DE LA VARIANZA 1.Establecer la Hipótesis Nula Ho: 2 1 = 2 2 2. E stablecer la Hipótesis Alternativa, : Hi : 2 1 2 2 ( prueba bilateral o de dos colas) 3 3. Regla de decisión < SIG o valor P < Practica Nro 4
51 15. Pruebas de Hipótesis para dos medias poblacionales muestras independientes, con SPSS muestras independientes, con SPSS 1.Establecer la Hipótesis Nula Ho: 1 = 2 Ho: 1 2 Ho: 1 2 2. E stablecer la Hipótesis Alternativa, : Hi : 1 = 2 ( prueba bilateral o de dos colas) Hi : 1 < 2 ( prueba de una sola cola o Unilateral ) Hi : 1 > 2 ( prueba de una sola cola o Unilateral ). 3 3. Regla de decisión < SIG o valor P < Practica Nro 1
52 5. Pruebas de Hipótesis para dos medias poblacionales muestras relacionadas muestras relacionadas La pruebas de hipótesis para dos medias poblacionales relacionadas o apareadas, el contrate es idéntico al de T para muestras independientes pero ahora se trabajará con una sola muestra de diferencias restando ambas muestras por pares. Este tipo de muestras relacionadas se dan en las siguientes situaciones: Un mismo grupo con dos variables diferentes La misma variables medida en dos momentos diferentes ( antes y después) ejemplo el nivel de concentración del colesterol en hombre y mujeres agrupados según la edad Los supuestos que se deben cumplir para realizar inferencia de dos poblaciones, con muestras independientes: Normalidad. Las dos poblaciones tiene que tener una distribución normal HOMOGENEIDAD DE VARIANZAS. Las varianzas de las poblaciones son iguales: se puede verificar con la prueba de LEVENE para igualdad de varianzas La variable es cuantitativa escala razón, se
53 5. Pruebas de Hipótesis para dos medias poblacionales la variable que se contrasta se convierte en la diferencia entre los valores o pares de las observaciones en lugar de los valores de las observaciones en si. El valor estadístico de prueba para T nuestras relacionadas
54 5. Pruebas de Hipótesis para dos medias poblacionales muestras relacionadas, con SPSS muestras relacionadas, con SPSS 1.Establecer la Hipótesis Nula donde 1 - 2 = D Ho: D =0 Ho: D 0 Ho: D 0 2. E stablecer la Hipótesis Alternativa, : Hi : 1D = 0 ( prueba bilateral o de dos colas) Hi : D < 0 ( prueba de una sola cola o Unilateral ) Hi : D > 0 2 ( prueba de una sola cola o Unilateral ). 3 3. Regla de decisión < SIG o valor P < Practica Nro 4
55 .6 Pruebas de Hipótesis medias poblacionalespara dos o mas muestras independientes, con SPSS muestras independientes, con SPSS 1.Establecer la Hipótesis Nula donde 1 - 2 = D Ho: 1 = 2= = 3 =….. K 2. E stablecer la Hipótesis Alternativa, : Hi : al menos una es diferente K 0 3. Regla de decisión < SIG o valor P < Practica Nro 4
56 BIBLIOGRAFÍA Pardo Perino,Antonio y Ruiz Diaz Miguel Angel.(2002). SPSS 11 Guia para el analisis de Datos. ANDERSON, David; Sweeney, Dennis y otros. (1.990) Estadistica para Adiministación y Económia. International Thomson Editores BERENSON, M. y LEVINE, D. (1996). Estadística básica en administración. México. Prentice Hall. ELSTON, ROBERT C. Y JHONSON, WILLIAM. (1987). Principios de bioestadística. México.Editorial el Manual Moderno, S.A.. DOWNI, N.M. (1973). Métodos estadísticos aplicados.México. Editorial Harla. KAZMIER, L. (1998). Estadística aplicada a la administración y economía. México. Mc Graw Hill. LEVIN,RICHAR. y RUBIN DAVID(1.996). Estadística para administradores. Prentice Hall editorial. STEVENSON, WILLIAM. Estadística para administracion y economía. Ediciones Karla.
57 .Autoevaluación 1.Indique la diferencia entre las Pruebas de Hipótesis unilaterales y Pruebas de Hipótesis Bilaterales. _________________________________________________________________________________________ _________________________________________________________________________________________ _________________________________________________________________________________________ 2.Dada la bibliografía recomendada, defina con sus propias palabras los siguientes términos: a. Error tipo I:_____________________________________________________________________________ ________________________________________________________________________________________. b. Nivel de confianza en la pruebas de hipótesis: ________________________________________________ ________________________________________________________________________________________. c. Hipótesis Nula:___________________________________________________________________________ _________________________________________________________________________________________. d. Valor Estadístico de Prueba:_______________________________________________________________ _________________________________________________________________________________________
58 Autoevaluación. a. De las siguientes nomenclaturas, especificar el significado de cada una µ:____________________ S:____________________ :____________________ :____________________ t:_____________________ :____________________ :____________________ 1- :__________________ X:___________________
59 BIBLIOGRAFÍA Algo más sobre Estadistica HILDEBRAND, David y Ott, R. Lyman.(1997).Estadística Aplicada a la Administración y a la Economía. Editorial Addiscon-Wesley Iberoamericana. Delaware, Estados Unidos. 943 pp. Landero Rene y otros: Estadística con SPSS y metodología de la Investigación- TRILLAS Hurtado Jacqueline.Metodología de Investigación Holística RITCHEY. Ferris J.(2002).Estadística para las Ciencias Sociales. Editorial Mc Graw-Hill. Mexico. 606 pp. MERINO Pardo Antconio y Ruiz Díaz Miguel Angel.(2002). SPSS 11 Guía para el análisis de datos. Editorial.Graw-Hill. España. 715pp. MORLES VICTOR. Planeamiento y Análisis de Investigacicones. (1992).Edicicones Eldorado. Wayne Daniel(2002) BIOESTADISTICA.l LIMUSA WILEY EDITORIAL. 4ta ediciòn http://www.spss.com/es/corpinfo/http:/e-stadistica.bio.ucm.es/web_spss.html www.tecnun.es/Asignaturas/Estad_it/SPSS.ppt - Páginas similares con el paquete spss Páginas similares
60 BIBLIOGRAFÍA Algo más sobre Estadistica DISTRIBUCIconES DE FRECUENCIA DISTRIBUCIconES DE FRECUENCIA http://cosmech.tripod.com/estadistica/distribu.htm http://www.pntic.mec.es/descartes/estadisticas/variables_continuas/histogramas.htm EDUC 6580: Introducción a las técnicas cuantitativas en la... rrpac.upr.clu.edu:9090/~amenend/tabdistrfrec.htmEDUC 6580: Introducción a las técnicas cuantitativas en la... - 50k - En caché - Páginas similares En caché Páginas similares wwwacnchile/products/ reports/consumer/cl_DistribFrec.htm - 15k - En caché - Páginas similares En caché Páginas similares Aquí puedes ver la distribución de frecuencia coqui.lce.org/mdejesus/5130IntroducciconSPSS/ tsld018.htm - 2k –Aquí puedes ver la distribución de frecuencia Ejemplo de una distribución de frecuencia coqui.lce.org/cadiaz/CEDU5130V/ Estadisticas/tsld003.htm - 2k – Ejemplo de una distribución de frecuencia DISTRIBUCIcon www.medal.org.ar/stadhelp/Std00004.htm - 8k - En caché - Páginas similaresDISTRIBUCIcon En caché Páginas similares http://www.spss.com/es/corpinfo/http:/e-stadistica.bio.ucm.es/web_spss.html Ojo http://campusvirtual.uma.es/est_fisio/apuntes/http://campusvirtual.uma.es/est_fisio/apuntes/ pagina completa de curso de internet