1 Curso de Bioestadística DEO/CICS.Pruebas de hipótesis MGA/DEO
2 Pruebas de hipótesis Contenidos Introducción EjemploCurso de Bioestadística. Pruebas de hipótesis Contenidos Introducción Ejemplo Etapas de una prueba estadística Formulación de supuestos y sistema de hipótesis Definición de la distribución de muestreo Nivel de significación estadística y región crítica Cálculo de los estadísticos de la prueba Toma de decisiones y conclusiones
3 Pruebas de hipótesis IntroducciónCurso de Bioestadística. Pruebas de hipótesis Introducción El propósito esencial de los métodos estadísticos es legitimar generalizaciones sobre poblaciones usando datos de muestras. La estadística inferencial ayuda a hacer juicios acerca de una población partiendo de muestras, tal como ocurre en encuestas de opinión, control de calidad en la industria, comparaciones entre medicamentos, diseño de experimentos y otros muchos ejemplos.
4 estadístico versus parámetroCurso de Bioestadística. Pruebas de hipótesis Introducción Típicamente, tomamos una muestra y calculamos de ella un valor llamado estadístico para estimar alguna característica llamada parámetro de una población específica. estadístico versus parámetro
5 parámetro - estadístico = errorCurso de Bioestadística. Pruebas de hipótesis Introducción Una cosa es segura desde antes de hacer el estudio: el estadístico no será igual al parámetro. Siempre habrá una diferencia llamada error. ¡Y, además, ese error no lo conoceremos nunca! parámetro - estadístico = error
6 Pruebas de hipótesis IntroducciónCurso de Bioestadística. Pruebas de hipótesis Introducción La prueba de hipótesis, tal como se aplica en el enfoque estadístico, es un recurso muy valioso y de uso generalizado en la investigación científica. La prueba de hipótesis utiliza conceptos similares a los que se usan en la estimación de intervalos con los cuales se complementa.
7 Pruebas de hipótesis IntroducciónCurso de Bioestadística. Pruebas de hipótesis Introducción La selección de la prueba que será utilizada depende de la naturaleza de los datos básicos y la hipótesis, pero la lógica general es la misma.
8 Pruebas de hipótesis IntroducciónCurso de Bioestadística. Pruebas de hipótesis Introducción En la prueba de hipótesis, al igual que en la estadística descriptiva, la pregunta básica está relacionada con qué podemos decir acerca de los parámetros de la población y cuál es el nivel de confianza.
9 Pruebas de hipótesis IntroducciónCurso de Bioestadística. Pruebas de hipótesis Introducción El investigador muy a menudo toma decisiones sobre poblaciones, a partir de información obtenida de muestras. Las pruebas estadísticas que realiza para ese efecto tienen algunos pasos específicos previos a la inspección de los datos.
10 Pruebas de hipótesis EjemploCurso de Bioestadística. Pruebas de hipótesis Ejemplo Un cierto microorganismo se encuentra en la saliva en la mitad de las personas. Tomamos una muestra de 17 personas. De las personas de esta muestra, 14 no tienen el microorganismo. Sólo 3 sí lo tienen. Pregunta: ¿Pudo esa muestra venir de una población que tiene una proporción de 1:1 en cuanto a la presencia del microbio?
11 Pruebas de hipótesis Una solución.Curso de Bioestadística. Pruebas de hipótesis Una solución. Supongamos que podemos crear una población infinitamente grande de elementos, la mitad de cuyos miembros tiene el microorganismo. Obtenemos repetidas muestras aleatorias de 17 elementos cada una. Esto podría hacerse de una población finita de elementos de la que obtenemos muestras con reemplazo. Luego, observamos cuántas tienen 14 negativos.
12 Pruebas de hipótesis Otra solución.Curso de Bioestadística. Pruebas de hipótesis Otra solución. Nos apoyamos en lo que sabemos de teoría de probabilidades. Seleccionamos la distribución binomial y determinamos la probabilidad de obtener una muestra de 14 - y 3 +. Podemos considerar también, como es convencional, las muestras de 14 o más negativos.
13 Curso de Bioestadística.Pruebas de hipótesis Etapas de las pruebas estadísticas: formulación de supuestos y sistema de hipótesis
14 Pruebas de hipótesis Si p = q, P(x=14) = 0.0051880 yCurso de Bioestadística. Pruebas de hipótesis Si p = q, P(x=14) = y P(x=>14) = En ambos casos, la probabilidad es muy baja.
15 Curso de Bioestadística.Pruebas de hipótesis Lo que hemos realizado es una prueba de una cola porque nos interesó saber acerca de 14 o más personas sin el microorganismo. Pero, si no tenemos mayor información, podemos interesarnos en saber la probabilidad de encontrar 14 o más personas con y sin el microorganismo. En ese caso, hacemos una prueba de dos colas.
16 Curso de Bioestadística.Pruebas de hipótesis Etapas de las pruebas estadísticas: formulación de supuestos y sistema de hipótesis
17 Curso de Bioestadística.Pruebas de hipótesis Para efectuar la prueba de dos colas, es decir, para buscar la probabilidad de que p q (todos los valores iguales a 14 y 3 o más extremos en cualquier sentido), simplemente duplicamos la probabilidad y obtenemos ¿Qué significa esta probabilidad y para qué nos sirve?
18 Etapas de las pruebas estadísticasCurso de Bioestadística. Pruebas de hipótesis Etapas de las pruebas estadísticas Las pruebas estadísticas incluyen algunos pasos específicos previos a la inspección de los datos: 1. Formulación de supuestos y sistema de hipótesis 2. Definición de la distribución de muestreo 3. Selección del nivel de significación estadística y la región crítica 4. Cálculo de los estadísticos de la prueba 5. Toma de decisiones y conclusiones
19 Etapas de las pruebas estadísticasCurso de Bioestadística. Pruebas de hipótesis Etapas de las pruebas estadísticas 1) formulación de supuestos y sistema de hipótesis El investigador: Formula los supuestos relacionados con la población y los procedimientos de muestreo. Establece el modelo de la prueba. Define la hipótesis estadística que someterá a prueba y la o las hipótesis alternativas en caso la primera no se sostenga con la evidencia empírica.
20 Etapas de las pruebas estadísticas:Curso de Bioestadística. Pruebas de hipótesis Etapas de las pruebas estadísticas: 1) formulación de supuestos y sistema de hipótesis En el ejemplo presentado, la hipótesis p = q = 0.5 es la hipótesis nula (H0 ), en contraste con la hipótesis de investigación o alternativa (H1 ). La hipótesis nula se llama así porque (usualmente) expresa que no hay una real diferencia o relación entre el valor paramétrico y aquél sobre el cual se hace la hipótesis.
21 Etapas de las pruebas estadísticas:Curso de Bioestadística. Pruebas de hipótesis Etapas de las pruebas estadísticas: 1) formulación de supuestos y sistema de hipótesis Convencionalmente, la hipótesis nula se escribe así: H0 : p = q = 0.5 Una hipótesis alternativa puede ser H1 : p > q, o ésta otra: H1 : p q
22 Etapas de las pruebas estadísticas:Curso de Bioestadística. Pruebas de hipótesis Etapas de las pruebas estadísticas: 1) formulación de supuestos y sistema de hipótesis Otros ejemplos de hipótesis nulas son: H0 : = 14.0 H0 : 2 = 15 H0 : 1 - 2 = 0 o también H0 : 1 = 2 H0 : 1 = 2 = 3 H0 : = 0 H0 : = 0.75
23 Etapas de las pruebas estadísticas:Curso de Bioestadística. Pruebas de hipótesis Etapas de las pruebas estadísticas: 1) formulación de supuestos y sistema de hipótesis Por lo regular, la hipótesis nula enuncia que no hay diferencia o relación entre variables. La mayoría de las veces, el investigador espera que la hipótesis nula sea errónea y se deje descartar a favor de la hipótesis alternativa.
24 Etapas de las pruebas estadísticas:Curso de Bioestadística. Pruebas de hipótesis Etapas de las pruebas estadísticas: 1) formulación de supuestos y sistema de hipótesis Al aislar el supuesto que es la hipótesis nula, afirmamos nuestra confianza en otros supuestos: que la muestra es aleatoria, que los datos siguen una determinada distribución, que nuestra técnica tiene validez, que nuestros indicadores con confiables ... Algunos llaman modelo al conjunto de estos supuestos relativamente confiables. Si estos fallan, podemos estar en medio de un grave error.
25 Etapas de las pruebas estadísticas:Curso de Bioestadística. Pruebas de hipótesis Etapas de las pruebas estadísticas: 2) definición de la distribución de muestreo Una vez definidos los supuestos, podemos obtener una distribución de muestreo para asociar las probabilidades con los resultados. En el ejemplo dado seleccionamos la distribución binomial. En otro caso, podría ser normal, Poisson, t, F, 2, ...
26 Etapas de las pruebas estadísticas:Curso de Bioestadística. Pruebas de hipótesis Etapas de las pruebas estadísticas: 2) definición de la distribución de muestreo Seleccionamos una determinada distribución teórica de frecuencias con base en nuestros supuestos. Las razones por las que seleccionamos dicha distribución deben ser explícitas.
27 Etapas de las pruebas estadísticas:Curso de Bioestadística. Pruebas de hipótesis Etapas de las pruebas estadísticas: 2) definición de la distribución de muestreo El conocimiento de la probabilidad de un resultado particular nos permite tomar una decisión racional sobre si se acepta o no la hipótesis planteada. Cuando los datos observados no se ajustan a la expectativa teórica, debemos buscar lo que causa la desviación de dicha expectativa.
28 Etapas de las pruebas estadísticas:Curso de Bioestadística. Pruebas de hipótesis Etapas de las pruebas estadísticas: 3) selección del nivel de la significación estadística y la región crítica Cuando obtenemos una muestra muy improbable como en ejemplo (14- y 3+) podemos tomar dos decisiones: aceptar o rechazar la hipótesis nula. Ya sea que se acepte o rechace la hipótesis nula, la decisión puede ser correcta o incorrecta.
29 Etapas de las pruebas estadísticas:Curso de Bioestadística. Pruebas de hipótesis Etapas de las pruebas estadísticas: 3) selección del nivel de la significación estadística y la región crítica
30 Etapas de las pruebas estadísticas:Curso de Bioestadística. Pruebas de hipótesis Etapas de las pruebas estadísticas: 3) selección del nivel de la significación estadística y la región crítica Antes de efectuar una prueba, debemos decidir qué magnitud permitiremos de errores tipo I y II, sabiendo que siempre podrá haber muestras muy desviadas y la posibilidad de obtener muestras engañosas. Pregunta: En la tabla siguiente ¿a partir de qué combinación de muestras rechazamos la hipotesis nula si hubiéramos fijado nuestro error tipo I en 5% ? ¿Y en 1% ? (De 1 y 2 colas).
31 Curso de Bioestadística.Pruebas de hipótesis Etapas de las pruebas estadísticas: formulación de supuestos y sistema de hipótesis
32 Etapas de las pruebas estadísticas:Curso de Bioestadística. Pruebas de hipótesis Etapas de las pruebas estadísticas: 3) selección del nivel de la significación estadística y la región crítica El error tipo I se expresa comúnmente como probabilidad y se simboliza por la letra griega (Ej.: = 0.05). Si este valor se expresa como porcentaje, se conoce usualmente como nivel de significación (Ej.: 5 %).
33 Etapas de las pruebas estadísticas:Curso de Bioestadística. Pruebas de hipótesis Etapas de las pruebas estadísticas: 3) selección del nivel de la significación estadística y la región crítica Cuando especificamos el área más extrema a partir de , nos referimos a la región crítica o área de rechazo (es un criterio para rechazar la hipótesis nula). La que conduce a aceptar la hipótesis nula es llamada región de no rechazo (mal referida a veces como de aceptación de la hipótesis nula).
34 Etapas de las pruebas estadísticas:Curso de Bioestadística. Pruebas de hipótesis Etapas de las pruebas estadísticas: 3) selección del nivel de la significación estadística y la región crítica Si especificamos un = 0.01, aceptamos la H0 para todas las muestras que tienen 13 o menos elementos del mismo tipo. Cerca de 99 % de las muestras son así. Pero, ¿qué tal si la H0 es falsa y la H1 es correcta? Observemos las distribuciones.
35 Pruebas de hipótesis Curso de Bioestadística. / 2 1 - / 2 / / 2
36 Etapas de las pruebas estadísticas:Curso de Bioestadística. Pruebas de hipótesis Etapas de las pruebas estadísticas: 3) selección del nivel de la significación estadística y la región crítica Se hace evidente que al reducir el error aumentamos simultánea y necesariamente el error que consiste en no rechazar la hipótesis nula siendo falsa, el error tipo II. El error tipo II expresado como porcentaje es . En el ejemplo que hemos visto, la muestra de 17 elementos es insuficiente para distinguir entre las dos hipótesis.