1 Ecuaciones estructurales con lavaan
2 Ejemplo Kline (2010)
3 Introducción a SEM Derivado del Path AnalysisFamilia de modelos que integra: Path Analysis (PA) Confirmatory Factorial Analysis (CFA) Structural Regresion (SR) A su vez pertenece a la familia de modelos latentes: (clase latente, transición latente, regresión latente, etc.) Origen en el modelo de JWK (Jöreskog, Wiley and Keesling) que dará lugar a LISREL creado por Jöreskog.
4 Características Las latentes son continuas, y las observadas mejor que también lo sean Filosofía confirmatoria, no exploratoria Deben estar fuertemente guiados por la teoría Se debe partir de buenos datos Similar al modelo lineal general (se puede considerar como un caso especial de SEM) De forma simplista es la fusión de la regresión lineal con el análisis factorial
5 Causación Confirmación no es causaciónMismas condiciones de siempre para la causación: Caeteris Paribus Precedencia temporal de causas y efectos No te lo da el modelo, sólo el diseño y la forma de obtener los datos Todo el mundo lo sabe pero todo el mundo sobre-interpreta en las conclusiones Capítulo de Mulaik
6 Conceptos básicos, Sistema RAM (Reticular Action Model)Variables latentes y observadas Variables endógenas y exógenas Efectos direccionales Varianzas Covarianzas Kline (2010)
7 Tipos de modelos: Se distinguen dos tipos de componentes:Componente de medida Componente de estructura Esto da lugar a los tres tipo de modelos en SEM:
8 Path Analysis Componente de estructura UCLA: SCG (2007)
9 Confirmatory Factorial AnalysisComponente de medida Rosseel (2012)
10 Structural Equation: Componente de medida y de estructuraRosseel (2012)
11 Condiciones para los datosProblemático, condiciones severas Delicado para la estimación Mejor tener el modelo y conseguir buenos datos que tener los datos y “trastear” con el modelo Necesita muestras muy numerosas Se parte de datos raw o matrices de correlaciones/covarianzas + sd + medias (opcional) Matrices Definidas Positivas
12 Condiciones para los datosNormalidad multivariada Linealidad Homocedasticidad Independencia de las observaciones Especial cuidado con: Colinealidad Variables excluidas Outliers Datos missing (sistemas de imputación) Varianzas muy extremas Condiciones para var, covar y cor
13 Condiciones para los datosSe recomienda partir de buenas mediciones con fiabilidad alta y poca varianza error
14 Especificación del modelo:Cada SW usa su sistema Interfaces gráficas (no tan útiles como parecen) Mismas recomendaciones que con el resto de modelos Cuidado con la direccionalidad Cuidado con el significado de las varianzas Cuidado con la saturación del modelo (dfm=0 ajuste perfecto) Cuidado con la complejidad, bucles, recursividad, etc. Mejor guiado por una hipótesis fuerte
15 Identificación del modelo:Determinar si el modelo es estimable o no Hay heurísticos simples para casos sencillos Para casos complejos nunca es fácil saber si es o no identificado Truco: Si no es identificado el modelo no se estima Problema: Puede estimarse pero dando resultado incongruentes
16 Estimación: Básicamente por Máxima Verosimilitud (ML)Estimaciones especiales: WLS WLSMV GLS, ULS etc… Estadísticos de Satorra-Bentler También estimaciones MCMC y Bayes
17 Indicadores de bondad de ajuste:X2 AIC BIC RMSEA CFI Estudio de residuos Hay muchos más prácticamente lavaan tiene todos
18 SW para SEM De pago: Gratuitos:Todos los grandes paquetes estadísticos tienen una versión de SEM: Lisrel, Amos, SAS (CALIS y TCALIS), EQS, Mplus, Ramona (Systat), Sepath (statistica), Matlab Gratuitos: Hay muchos, destacan: Mx OpenMx (extensión para R) R (sem y lavaan)
19 Extensiones de SEM Mucho trabajo en violaciones de las condicionesArmonioso con las tendencias: Multinivel Longitudinal Modelos de crecimiento latente Modelos no lineales Modelos no normales (generalizados) etc.
20 R: Librería Lavaan Creada por Yves Rosseel de Universidad de Gante (Bélgica) Es muy buena, funciona muy bien La que más se usa y se extiende en R Funciones básicas: lavaan() Control total del usuario cfa() Wrapper sobre lavaan para factorial confirmatorio sem() Wrapper sobre lavaan para facilitar path analysis y structural equation
21 Lavaan Básicamente definen la estructura de varianzas y covarianzas de forma automática Recomendable usar lavaan(), especialmente en la construcción del modelo (dfm1-dfm2=0) Opción “mimic” mimic="Mplus“ mimic="EQS“ mimic="LISREL“ mimic="AMOS"
22 Construcción del modelo en lavaanNo tiene interfaz gráfica, pero es bastante intuitivo Sólo usa dos operadores: = ~ Variable latente: =~ Regresión: ~ Var y cov: ~~ Otros comandos para las restricciones: *, :=, ==, < y >
23 Ejemplo con lavaan()
24 Resultados con summary(…)
25 Estimación de parámetrosHeywood
26 Otras utilidades parameterEstimates(m1) modificationIndices(m1)anova(m1,m2) inspect(m1) (matrices de LISREL) Imputación de missing (missing = "fiml“) Datos no normales test = "satorra.bentler“ estimator = "WLS" test = "bootstrap“ estimación errores típicos Contrastes multigrupos
27 Conclusiones sobre LavaanMuy completo Sigue en desarrollo Estima tan bien como permita hacerlo R (Rosseel, 2012) Le faltan ciertas herramientas de ayuda (PRELIS) pero para eso está R No hay visualización final del modelo: librería sem sí tiene pero no es adaptable qgraph.lavaan (Sacha Epskamp) Muy Bueno y muy recomendable
28 Referencias Introduction to SAS. UCLA: Statistical Consulting Group. from (accessed November 24, 2007). Kline, R. B. (2011). Principles and Practice of Structural Equation Modeling. Guilford Press. Mulaik, S. A. (2009). Linear causal modeling with structural equations. Crc Press. Rosseel, Y. (2012). Lavaan: An R Package for Structural Equation Modeling. Journal of Statistical Software, 48, 2.
29 Mypersonality projectInicio en 2007 mypersonality.org Mantenida por la universidad de Cambridge Bases de datos sobre uso de Facebook
30 mypersonality Se recogen datos de actividad en FB y de cuestionarios que contestan los sujetos 7.5m de usuarios únicos 1m de sujetos contestaron el BIG5 25 cuestionarios distintos de personalidad Datos de más de 40 países Acceso a los perfiles de FB (40%)
31 mypersonality Información sobre: User's demographic detailsUser's geo-location details Facebook activity User's religion and political views BIG5 Personality Scores IQ scores Satisfaction With Life Scale muchas más bases de datos
32 mypersonality Se obtienen las bases de datos bajo registroSe firma un contrato legal entre el usuario y la universidad de Cambridge Uso con condiciones Una vez firmado te dan acceso a las bases de datos, en distintos formatos Cuidado con la fusión de bases, los datos perdidos no son aleatorios.