1 SEMINARIO DE INVESTIGACIONTECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia y Coeficientes de Asociación
2 SEMINARIO DE INVESTIGACIONDE LAS TABLAS DE CONTINGENCIA AL ANÁLISIS DE ASOCIACIÓN
3 SEMINARIO DE INVESTIGACION¿CÓMO ANALIZAR Y EVALUAR HIPÓTESIS CAUSALES O DE COVARIACIÓN ENTRE VARIABLES CUANDO LAS MISMAS ESTÁN MEDIDAS EN ESCALA ORDINAL O NOMINAL? ANÁLISIS DE TABLAS DE CONTINGENCIA TEST DE SIGNIFICANCIA NO PARAMÉTRICOS MEDIDAS DE ASOCIACIÓN
4 ANÁLISIS DE RELACIONES ENTRE VARIABLESUNA TABLA DE CONTINGENCIA ES UNA DISTRIBUCIÓN EN FILAS Y COLUMNAS EN LA QUE LOS INDIVIDUOS DE UNA POBLACIÓN SE CLASIFICAN EN FUNCIÓN DE OTRA VARIABLE. La tabla de contingencia es un método de representar simultáneamente dos caracteres observados en una misma población, si son discretos o continuos reagrupados en clases. Los dos caracteres son x e y, el tamaño de la muestra es n. Las modalidades o clases de x se escribirán c1.. cr, y las de y, d1... ds. Estos valores en una tabla de doble entrada:
5 ANÁLISIS DE TABLAS DE CONTINGENCIACOMPONENTES DE UNA TABLA DE CONTINGENCIA DISTRIBUCIONES MARGINALES DISTRIBUCIONES CONDICIONALES UN TOTAL POBLACIONAL O MUESTRAL TIPO DE ANÁLISIS QUE PERMITE UNA TABLA DE CONTINGENCIA ANÁLISIS DE PERFILES O CARACTERÍSTICAS POBLACIONALES ANÁLISIS DESCRIPTIVO DE GRUPOS O SEGMENTOS DE POBLACIÓN ANÁLISIS DE ASOCIACIÓN EN TÉRMINOS PROBABILÍSTICO / DEPENDENCIA VERSUS INDEPENDENCIA DE PROBABILIDADES
6 ASOCIACIÓN ESTADÍSTICALa idea de asociación / relación entre variables se define por lo general en oposición al de independencia estadística y se evalúa examinando el sentido y la fuerza de las regularidades empíricas “Las variables X e Y (sexo y condición de actividad) son estadísticamente independientes si el porcentaje de observaciones que poseen el atributo Y1 (activo) es el mismo entre X1 (hombres) que entre X2 (mujeres)”.
7 UN PROBLEMA DE ASOCIACIÓN ESTADÍSTICA A MODO DE EJEMPLOlunes, 17 de abril de 2017 UN PROBLEMA DE ASOCIACIÓN ESTADÍSTICA A MODO DE EJEMPLO “La participación en el mercado de trabajo está condicionada por diversos factores económicos, sociales y culturales. […] La definición de los roles masculinos y femeninos ubica a los varones como principales responsables del sostén económico de los hogares y […] directamente asociados al mundo laboral […] Las mujeres […] como principales responsables de las tareas de reproducción social en el ámbito doméstico”1. 1.- Drake, I y Philipp, E. (1997)
8 UN PROBLEMA DE ASOCIACIÓN ESTADÍSTICA A MODO DE EJEMPLOlunes, 17 de abril de 2017 UN PROBLEMA DE ASOCIACIÓN ESTADÍSTICA A MODO DE EJEMPLO Hipótesis de Trabajo: “Dentro de la población de 25 a 45 años los varones tendrán una tasa de actividad significativamente más alta que las mujeres” Sexo: Varón (V) – Mujer (M) Condición de Actividad: Activo (A) – Inactivo (I) V A M I o A
9 UN PROBLEMA DE ASOCIACIÓN ESTADÍSTICA A MODO DE EJEMPLOlunes, 17 de abril de 2017 UN PROBLEMA DE ASOCIACIÓN ESTADÍSTICA A MODO DE EJEMPLO Hipótesis Nula de Independencia Estadística “Dentro de la población de 25 a 45 años la tasa de actividad no presentará diferencias por sexo” Sexo: Varón (V) – Mujer (M) Condición de Actividad: Activo (A) – Inactivo (I) V I o A M I o A
10 ESTANDARIZACIÓN POR MEDIO DE PORCENTAJESlunes, 17 de abril de 2017 ESTADÍSTICOS DE UNA TABLA DE CONTINGENCIA A MODO DE EJEMPLO ESTANDARIZACIÓN POR MEDIO DE PORCENTAJES Sintaxis: TEMPORARY . SELECT IF (h12>25 AND h12<45) . CROSSTABS /TABLES=cdea BY h13 /FORMAT= AVALUE TABLES /CELLS= COUNT COLUMN ROW TOTAL . Valores absolutos Porcentaje fila Porcentaje columna Porcentaje total
11 ANÁLISIS COMPARATIVO DE DEPORCENTAJESlunes, 17 de abril de 2017 ESTADÍSTICOS DE UNA TABLA DE CONTINGENCIA A MODO DE EJEMPLO ANÁLISIS COMPARATIVO DE DEPORCENTAJES Diferencia porcentual: 29,6 p.p. Intervalo: máximo asociación positiva de 100 independencia estadística 0 máxima asociación negativa -100 Pero sólo se llega a los máximos en las hipótesis diagonales
12 ANÁLISIS DE FRECUENCIAS ESPERADAS VERSUS FRECUENCIAS OBSERVADASlunes, 17 de abril de 2017 ESTADÍSTICOS DE UNA TABLA DE CONTINGENCIA A MODO DE EJEMPLO ANÁLISIS DE FRECUENCIAS ESPERADAS VERSUS FRECUENCIAS OBSERVADAS Frecuencias esperadas bajo el supuesto de independencia estadística: PROBABILIDAD CONJUNTA DE QUE OCURRA a y b Sintaxis: CROSSTABS /TABLES=cdea BY h13 /FORMAT= AVALUE TABLES /CELLS= EXPECTED .
13 PRUEBA NO PARAMÉTRICA DE INDEPENDENCIA ESTADÍSTICALAS PRUEBAS JI-CUADRADO PARA TABLAS DE CONTINGENCIA DE DOBLE ENTRADA EVALÚA SI EXISTE ALGÚN TIPO DE DEPENDENCIA ENTRE LOS VALORES DE DOS O MÁS VARIABLES OBSERVADAS: SI LOS VALORES DE UNA CUALQUIERA DE LAS VARIABLES APORTAN INFORMACIÓN SOBRE LOS VALORES DE LA/S OTRA/S. SUPUESTO QUE ASÍ FUERA RESULTARÁ DE INTERÉS MEDIR EL GRADO Y TIPO DE DEPENDENCIA O ASOCIACIÓN.
14 PRUEBA DE HIPÓTESIS JI-CUADRADA
15 PRUEBA DE HIPÓTESIS JI-CUADRADAA MODO DE EJEMPLO
16 SEMINARIO DE INVESTIGACIONANALISIS MULTIVARIADO DE ASOCIACIÓN PARA VARIABLES CATEGÓRICAS
17 MEDIDAS DE ASOCIACIÓN Medida de asociación Tabla Escala de MedidaObservaciones Phi V de Cramer 2 x 2 f x c Nominales Medidas basadas en chi cuadrado. Toman valores comprendidos entre 0 y 1. Evalúa hipótesis lineales (diagonal principal). Son útiles para estimar grados de asociación entre pares de variables, sobre un mismo conjunto de individuos para n filas y columnas. Lambda Toma valores entre 0 y 1. Disponen versión asimétrica. Es fácil de interpretar en términos de la proporción que se reduce le error de predicción del valor de una variable a partir de los valores de la otra (pero puede tomar valores muy bajos en tablas con asociación). Gamma Tau b / c de Kendall Ordinales Toma valores entre -1 y 1, pasando por 0. Gamma es más fácil de interpretar. Asume relaciones curvilineales. Tau b sólo alcanza valores extremos cuando hay asociación total y f y c son iguales. Tau c tiende a subestimar la relación.
18 ESTADÍSTICOS DE ANÁLISIS BIVARIADOA MODO DE EJEMPLO Distribuciones para Tablas de Contingencia y Prueba de Hipótesis Ji cuadrado
19 ESTADÍSTICOS DE ANÁLISIS BIVARIADO A MODO DE EJEMPLOCoeficientes de Asociación Tablas 2 X 2
20 Coeficientes para Variables Ordinales o CombinadasASOCIACIÓN ESTADÍSTICA MULTIVARIADA A MODO DE EJEMPLO Coeficientes para Variables Ordinales o Combinadas
21 DOS TIPOS DE PROBLEMAS ENFRENTA EL ANÁLISIS MULTIVARIADOlunes, 17 de abril de 2017 ASOCIACIÓN ESTADÍSTICA MULTIVARIADA EL PAPEL MÁS IMPORTANTE DEL ANÁLISIS MULTIVARIABLE ES PROPORCIONAR LOS SUSTITUTOS LÓGICOS DEL CONTROL EXPERIMENTAL Y PONER A PRUEBA HIPÓTESIS MÁS COMPLEJAS SOBRE EL ORDEN O EL CAMBIO SOCIAL. DOS TIPOS DE PROBLEMAS ENFRENTA EL ANÁLISIS MULTIVARIADO Análisis de los datos: ¿cómo manipular la información, resumirla, identificar y evaluar las diferentes relaciones? Interpretación de los datos: ¿cómo diferenciar los efectos particulares de los de interacción y cómo evaluar de manera racional el sentido de las regularidades empíricas?
22 NECESIDAD DE UN MÉTODO QUE PERMITAlunes, 17 de abril de 2017 ASOCIACIÓN ESTADÍSTICA MULTIVARIADA NECESIDAD DE UN MÉTODO QUE PERMITA Explicar una relación descubriendo las conexiones causales existente entre las variables. Identificar condiciones bajo las cuales una relación tiene lugar. Identificar factores o condiciones independientes que operan sobre una misma variable. Evaluar la existencia de relaciones espurias entre variables.
23 Hipótesis Multivariadalunes, 17 de abril de 2017 ASOCIACIÓN ESTADÍSTICA MULTIVARIADA A MANERA DE EJEMPLO Hipótesis Multivariada “Entre las personas en edad de alta participación económica (de 25 a 45 años), la tasa de actividad significativamente más elevada entre los varones que entre las mujeres, se explica por la intervención de condiciones familiares”
24 (condición / especificación)lunes, 17 de abril de 2017 ASOCIACIÓN ESTADÍSTICA MULTIVARIADA EL MODELO LAZARSFELD Forma estadística Por parciales Por marginales Temporalidad Antecedente Interviniente Antecedente Interviniente Parcial PA PI Marginal MA MI Parcial anterior: (condición / especificación) Parcial interviniente: (contingencia) T X Y X Y T Marginal anterior: (Espuriedad) Marginal interviniente: (interpretación) T X T Y X Y
25 Ecuación de Covarianzas de Lazarsfeldlunes, 17 de abril de 2017 ASOCIACIÓN ESTADÍSTICA MULTIVARIADA EL MODELO LAZARSFELD Ecuación de Covarianzas de Lazarsfeld Siempre debe usarse el mismo coeficiente (XY) = (XY,t1) ⊕ (XY,t2) ⊕ (XT) ⊗ (YT) Relación Original Relaciones Parciales Relaciones Marginales “Existe relación causal entre dos variables si, para cualquier factor de prueba antecedente, la relación entre esas variables no desaparece”
26 Presencia de menores en el hogarlunes, 17 de abril de 2017 ASOCIACIÓN ESTADÍSTICA MULTIVARIADA A MODO DE EJEMPLO INCORPORACIÓN DE UNA VARIABLE TEST O DE CONTROL Presencia de menores en el hogar Diferencia porcentual 37,5 p.p. Diferencia porcentual 14,2 p.p. Doble Diferencia 23,3 p.p.
27 Explicación por ParcialesASOCIACIÓN ESTADÍSTICA MULTIVARIADA A MODO DE EJEMPLO Explicación por Parciales
28 Explicación por ParcialesASOCIACIÓN ESTADÍSTICA MULTIVARIADA A MODO DE EJEMPLO Explicación por Parciales
29 ASOCIACIÓN ESTADÍSTICA MULTIVARIADA A MODO DE EJEMPLOlunes, 17 de abril de 2017 ASOCIACIÓN ESTADÍSTICA MULTIVARIADA A MODO DE EJEMPLO Explicación por Marginales Población Activa por Presencia de menores en el hogar
30 ASOCIACIÓN ESTADÍSTICA MULTIVARIADA A MODO DE EJEMPLOlunes, 17 de abril de 2017 ASOCIACIÓN ESTADÍSTICA MULTIVARIADA A MODO DE EJEMPLO Explicación por Marginales Población Activa por Presencia de menores en el hogar
31 Explicación por Marginales Presencia de menores en el hogar por Sexolunes, 17 de abril de 2017 ASOCIACIÓN ESTADÍSTICA MULTIVARIADA A MODO DE EJEMPLO Explicación por Marginales Presencia de menores en el hogar por Sexo
32 Explicación por Marginales Presencia de menores en el hogar por Sexolunes, 17 de abril de 2017 ASOCIACIÓN ESTADÍSTICA MULTIVARIADA A MODO DE EJEMPLO Explicación por Marginales Presencia de menores en el hogar por Sexo
33 ECUACIÓN DE COVARIANZAS DE LAZARSFELDASOCIACIÓN ESTADÍSTICA MULTIVARIADA A MODO DE EJEMPLO ECUACIÓN DE COVARIANZAS DE LAZARSFELD (XY) = (XYt1) ⊕ (XYt2) ⊕ (XT) ⊗ (YT) Hipótesis diagonal (PHI): (XY) = (XYt1) ⊕ (XYt2) ⊕ (XT) ⊗ (YT) 0,367 = 0,423 ⊕ 0,299 ⊕ -0,086 ⊗ -0,059 Hipótesis rinconal (Gamma): (XY) = (XY,t1) ⊕ (XY,t2) ⊕ (XT) ⊗ (YT) 0,807 = 0,896 ⊕ 0,555 ⊕ -0,161 ⊗ -0,157