1 UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, DECANA DE AMERICA) FACULTAD DE MEDICINA - UNIDAD DE POST GRADO Maestría en Neurociencias Tema Clase 8 Mg. Violeta Nolberto Sifuentes Departamento Académico de Estadística Sem. 2009-I
2 1.INTRODUCCION Ejem. 1: Estudios previos consideran que los residentes de anestesiología de todo el país, tiene en promedio 58,3 de nivel de conocimientos para evitar la contaminación con patógenos vehiculizados y con desviación estándar igual 43,3. A fin de verificar si el nivel de conocimientos se ha incrementado, debido a las campañas de sensibilización se realizó una encuesta por muestreo entre 115 residentes de anestesiología de todo el país y fueron evaluados acerca del nivel de conocimientos, de interés, obteniéndose en pro- medio 64,9. (El nivel de conocimientos tiene distribución Normal de probabilidad)
3 A partir de este ejemplo el investigador puede plantearse las siguientes preguntas: 1.-¿La campaña de sensibilización incrementa el nivel promedio conocimientos para evitar la contaminación con patógenos vehiculizados de esta población? (INCERTIDUMBRE) 2.- ¿Para futuros anestesiólogos se obtendrá resultados similares? (TOMA DE DECISION) INCERTIDUMBRE: Respecto al nivel promedio pobla- cional de conocimientos para evitar la contaminación con patógenos vehiculizados. TOMA DE DECISION: Para casos nuevos.
4 2.PARAMETRO Y ESTADISTICO Parámetro, etimológicamente deriva del griego parámetreo (medir una cosa con otra), en Estadística, son los valores o medidas que caracterizan a una población, por ejemplo el promedio. Son cantidades indeterminadas, constantes o fijas respecto a una condición o situación, Sierra Bravo, Restituto (1991). Es representado generalmente mediante letras griegas: : Media o promedio poblacional. : Varianza poblacional. : Proporción poblacional.
5 Estadístico es una variable aleatoria cuyos valores pueden ser determinados a partir de una muestra aleatoria, general- mente se representa mediante letras latinas. : Media o promedio muestral. : Varianza muestral. :Proporción muestral
6 Ejemplo 2: Considere el ejemplo 1 para identificar: Variable aleatoria Parámetro Estadístico
7 3. ENFOQUES DE LA INFERENCIA ESTADISTICA En el ejemplo 1, el parámetro de interés es el nivel promedio poblacional de conocimientos para evitar la contaminación con patógenos vehiculizados, que se construye a partir de una variable aleatoria y será estudiada en base a una m.a. Para efectuar generalizaciones para la población bajo estu- dio a partir de los resultados de ésta, a este proceso se le llama INFERENCIA ESTADISTICA (IE) La PROBABILIDAD permite calibrar el poder de nuestras conclusiones
8 3.1 ESTIMACION Proceso mediante el cual, a partir de los valores de una variable obtenidos de una muestra aleatoria se obtiene un valor (estimación puntual) o un conjunto de valores (estimación por intervalos) para aproximarse al valor del parámetro o parámetros de la población o poblacio- nes bajo estudio, con cierto nivel de probabilidad de confianza.
9 3.2 PRUEBA DE HIPOTESIS (PRUEBAS ESTADISTICAS) El investigador plantea supuesto para el parámetro bajo estudio, que es sometido a prueba o verificación estadística, a partir de los valores de una m.a. para decidir si se rechaza o no el supuesto planteado, con cierta probabilidad de error (riesgo) por tomar una decisión.
10 Ejem. 3: Considerando el ejemplo 1, para cada objetivo, identifique el enfoque de la IE a emplearse: a)Determinar el nivel promedio poblacional de conoci- mientos para evitar la contaminación con patógenos vehiculizados, en la población de residentes de anes- tesiología b) Determinar si la campaña de sensibilización incremen- ta el nivel promedio poblacional de conocimientos para evitar la contaminación con patógenos vehiculizados, en la población de residentes de anestesiología. Ejem. 3: Considerando el ejemplo 1, para cada objetivo, identifique el enfoque de la IE a emplearse: a)Determinar el nivel promedio poblacional de conoci- mientos para evitar la contaminación con patógenos vehiculizados, en la población de residentes de anes- tesiología b) Determinar si la campaña de sensibilización incremen- ta el nivel promedio poblacional de conocimientos para evitar la contaminación con patógenos vehiculizados, en la población de residentes de anestesiología.
11 4.ESTIMACION La ESTIMACIÓN de un parámetro es el proceso del uso de la información muestral para extraer conclusiones acerca del valor del parámetro de la población. Para es- timar al parámetro se usa el estadístico, que ahora se le llamará estimador y el valor que se obtiene usando el estimador se le llama estimación. La estimación puede ser:
12 4.1 ESTIMACION PUNTUAL: Dar un valor para el parámetro a partir de valores muestrales. 4.2 ESTIMACION POR INTERVALOS: Dar un con- junto de valores estimados para el parámetro, para obte- ner el intervalo de confianza (IC) se usa una probabilidad relacionada, llamada nivel o probabilidad de confianza. iene la ventaja que permite indicar la variabilidad que la estimación podría tener en otras muestras. Un IC es un intervalo estimador de un parámetro, cuyos extremos, límite inferior (LI) y límite superior (LS), son estadísticos e incluye al parámetro con cierto grado de incertidumbre establecido llamado nivel de confianza. La construcción del IC es equivalente a plantearse lo siguiente:
13 PARAMETRO PROBABILIDAD DE CONFIANZA
14 5.- PRUEBA DE HIPOTESIS POBLACION HIPOTESIS: SUPUESTO PARA EL PARAMETRO MUESTREO INFERENCIA ESTADISTICA MUESTRA PARA VERIFICAR HIPOTESIS Una prueba de hipótesis es un procedimiento que permite Contrastar lo empírico con el supuesto para el parámetro
15 5.1 CONCEPTOS BASICOS 1. Hipótesis Estadísticas: Conjetura o supuesto que el in- vestigador plantea para el parámetro(s) que puede o no ser verdaderas, relativa a una o más poblaciones. Puede ser hipótesis nula o hipótesis alternativa. 2. Hipótesis Nula: Supuesto que indica que el valor del parámetro(s), es constante que no ha sufrido cambios, en la población bajo estudio, es nula. Se plantea general- mente con la intención de rechazarla. Se representa me- diante 3. Hipótesis Alternativa: Supuesto que se relaciona con la teoría a demostrarse, enunciado alternativo a la hipótesis nula. Se representa mediante
16 Ejemplo 4: Anote las hipótesis estadísticas (ejemplo1) 4. Pruebas Unilateral y Bilateral: Cuando la hipótesis alter- nativa indica cambio en una sola dirección, con respecto a la hipótesis nula (> o
17 5. Errores de Tipo I y de Tipo II: A partir del siguiente cuadro se explican estos errores: RechazarNo rechazar DECISIONESTADO REAL es verdaderaes falsa Rechazar Error de tipo IOK No RechazarOKError de tipo II
18 6. Nivel de Significación de la Prueba es el nivel de significación de la prueba; y es posible controlarlo, es la confiabilidad de la decisión de rechazar o no rechazar la hipótesis nula. Los más usados son: 0.01, 0.05 y 0.10. Cuando no se rechaza la hipótesis nula significa que “no existe suficiente información como para rechazarla”. 7. Estadístico de Prueba y Región de Rechazo Para rechazar o no la hipótesis nula se toma una m.a. de la población bajo estudio y los resultados contenida en ella se usa en expresiones llamadas estadísticos de prueba e indican el grado de discrepancia entre la hipótesis nula y los datos muestrales.
19 Ejem. 6: Asumiendo, para el ejemplo 1, que el nivel de conocimientos para evitar la contaminación con patóge- nos vehiculizados se distribuye como normal de proba- bilidad. La estadística de prueba es:
20 Región Crítica o de Rechazo de tamaño Para las hipótesis estadísticas del ejemplo 1
21 Cuando la discrepancia es “grande” se rechaza la hipótesis nula, en caso contrario no se rechaza. Al conjunto de valo- res de la estadística de prueba para los que la hipótesis nula se rechaza se llama región de rechazo o región crítica. El punto de corte que divide a la región crítica de la no crítica, se llama valor crítico, se determina de acuerdo a la distribución de probabilidad de la estadística de prueba, Para esta prueba unilateral, la región de rechazo está dada por:
22 8. Nivel crítico de una prueba de hipótesis (p-value) Es la probabilidad que mide el riesgo que tiene el investigador cuando, al obtener un cierto valor de la estadística, se rechaza la hipótesis nula. (SPSS le llama Sig.)
23 Ejemplo 7: Obtenga el intervalo de confianza y realizar La prueba de hipótesis correspondiente.
24 Antes de aplicar la inferencia estadística es necesario identificar la distribución de probabilidad de la variable aleatoria que se pretende analizar. Algunos instrumentos para ello son: Gráfico de caja Pruebas de ajuste a una distribución (Normal: Test de Kolmogorov-Smirnoff- Test de Sapiro-Wilk, Grafico Q-Q o P-P ). 5.2.PRELIMINARES PARA APLICAR INFERENCIA ESTADÍSTICA PARAMÉTRICA
25 Caso 1: Se ha realizado un estudio para identificar los aspec- tos críticos relacionados con la lactancia materna en mujeres en edad fértil en muestras de dos poblacio- nes: costa urbana (1) y costa rural (2). Se aplico una prueba para medir conocImientos so- bre lactancia materna ( a menor puntaje, menor prac- tica materna), en muestras obtenidas de cada pobla- ción: 5.3 INTERVALO DE CONFIANZA Y PRUEBA DE HIPÓTESIS PARA DIFERENCIA DE MEDIAS POBLACIONES, EMPLEANDO MUESTRAS ALEATORIAS INDEPENDIENTES Y RELACIONADAS.
26 1.1 Estimar mediante intervalo de confianza la diferen- cia entre los promedios poblacionales de los punta- jes que obtienen en esta prueba las poblaciones ba- jo estudio. Interpretar. 1.2 Verificar si en promedio las mujeres de la costa ur- bana tienen mayor practica sobre lactancia materna que las de la costa rural.
27 Caso 2: Un estudio sobre trastornos de la conducta alimentaria en estudiantes de sexo femenino del 4º del nivel secundario de Lima Metropolitana, aplica el Test de Actitudes Alimen- tarias (Eating Attitudes Test) (EAT-40) que consta de 40 preguntas que miden: I) Dieta: evitación de alimentos que engordan y preocupación por ser más delgado; II) Bulimia: pensamientos relacionados con los alimentos y conducta bulímica y III) Control oral: control en el comer y presión percibida por parte de los demás para aumentar de peso. Un puntaje total igual o superior a 30 es indicativo de un TCA, ya sea, clínico o subclínico. La prueba se aplico a una muestra de 32 escolares de esta población que han partici- pado en un programa para prevenir la anorexia y después de un año de haber concluido.
28 2.1 Estimar mediante IC, el cambio producido por este programa. 2.2 Verificar si el programa resulto eficaz.
29 Caso 3: Considere las poblaciones del caso 1: Se desea verificar si la proporción poblacional de mujeres de la costa urbana que consideran a la leche de vaca como mejor opción respecto a la leche materna es mayor que las de la costa rural. Basándose en una m.a. de 500, de la costa urbana 380 consi- deran a la leche de vaca como mejor opción respecto a la leche materna; mientras en la costa rural de una m.a. de 400 250 indican lo mismo. 3.1 Estimar mediante intervalo de confianza la diferencia de los parámetros bajo estudio. Interprete. 3.2 Verificar el supuesto propuesto. 5.3 INTERVALO DE CONFIANZA Y PRUEBA DE HIPÓTESIS PARA DIFERENCIA DE PROPORCIONES POBLACIONES, EMPLEANDO MUESTRAS ALEATORIAS INDEPENDIENTES
30 Intervalo de confianza para Es un intervalo de confianza del 100%,
31 se emplea la estadística: Siendo la proporción poblacional estimada de éxitos (resultado de interés para el onvestigador) con respecto a la Muestra. Para someter a prueba las hipótesis: (I) (II)(III)
32 Cuya región de rechazo está dada por: