1 Desafíos metodológicos en la ordenación de escuelas Jorge Manzi Profesor Titular UC Director MIDE UC Santiago, Septiembre, 2013
2 Aclaración Inicial ● Mi rol en el proceso de discusión de la propuesta metodológica ● Antecedentes empleados para esta presentación: ● Resumen en sitio web de Agencia de Calidad ● Actas de Agencia de Calidad (en sitio web) ● Antecedentes del SIMCE (en sitio web) ● Publicación en El Mercurio (27 de julio, 2013)
3
4 Aspectos generales de la metodología de ordenación ● Índice de calidad educativa ● Distribución de estudiantes en niveles de aprendizaje (67%) ● Puntaje SIMCE ● Tendencia SIMCE ● Autoestima académica y motivación escolar ● Clima de convivencia escolar ● Participación y formación ciudadana ● Hábitos de vida saludable ● Asistencia escolar ● Equidad de género ● Retención escolar ● Titulación técnico profesional
5 Características de los alumnos (Variables de contexto) ● Nivel de vulnerabilidad ● Escolaridad de la madre ● Ruralidad o aislamiento ● Entrada de alumnos con buen desempeño académico ● Entrada de alumnos con mal desempeño académico ● Alumnos de ascendencia indígena ● Alumnos con necesidades educativas especiales ● Tasas de delitos de violencia intrafamiliar
6 Sistema de Clasificación de Escuelas (incluye distribución según simulación 2011) Características de los alumnos Índice de Calidad sin corregir Alto (15%) Medio 49%) Medio-Bajo (23%) Insuficiente (12%)
7 Consideraciones iniciales ● Concuerdo con la creación de un sistema de aseguramiento de la calidad, que es un gran avance con respecto a lo que hemos tenido. ● Estimo que es un avance muy importante contar con un sistema de ordenación de escuelas que se base en un concepto más integral de calidad educativa que uno centrado en pruebas como el SIMCE. ● También valoro positivamente que la ordenación se construya atendiendo a la diversidad de contextos educativos existentes en nuestro país, controlando aspectos que no pueden ser atribuidos a la escuela (como la condición socioeconómica de los estudiantes y sus familias). ● Con todo, un sistema de esta significación se debe implementar asegurando su legitimidad pública, y protegiendo todo lo ganado por nuestro país en torno al SIMCE.
8 Tema abordados ● Acerca del Índice de calidad educativa ● Acerca del control de variables contextuales ● Acerca de la dinámica de un sistema de responsabilización basado en pruebas
9 Índice de Calidad: el peso otorgado a los tres niveles de aprendizaje ● Pese a que la interpretación de la ley es que se debe emplear dicha distribución para asignar el 67% mínimo del SIMCE, hay severos problemas con ello: ● La prueba no ha sido diseñada primariamente para identificar 3 niveles de logro. Su construcción maximiza la información en toda la escala, sin que exista una especial concentración de itemes en torno a los puntos de corte (de hecho, no sabemos el grado de precisión del SIMCE en esa región de puntaje). ● Los puntos de corte se establecen con procedimientos establecidos, que no obstante el empeño que se haga en emplearlos adecuadamente, agregan error a la clasificación (lo que en la práctica degrada la información contenida en el puntaje SIMCE). ● En la práctica se reduce un recorrido de más de 200 puntos a solo tres niveles (lo que de paso crea una falsa impresión de homogeneidad al interior de cada una de las categorías). ● La asignación de puntajes a las 3 categorías es también debatible. ● Recomendación: Revisar este aspecto, apuntando a una combinación más equilibrada entre los niveles de aprendizaje y los puntajes del SIMCE
10 Ilustración de uso de Niveles de Aprendizaje SIMCE Mat 4º 2011 100 150 200 250 300 350 400 245 295 Insuficiente 39% Elemental 37% Adecuado 25%
11 Índice de calidad: la transformación de todas las variables a una métrica común ● Se ha informado que se empleará una métrica común para todas las variables que entran en la combinación. ● Ello se debe hacer cuidando que las características de la distribución garantice que las ponderaciones nominales coincidan con las ponderaciones reales. ● Se sabe que cuando las distribuciones no son equivalentes (por ejemplo en su desviación estándar), las variables con mayor dispersión tienen un mayor peso nominal. ● Recomendación: Revisar la forma en que se escalarán las variables y asegurar que el método empelado garantice que se cumplan las ponderaciones nominales.
12 Ilustración del efecto de cambios en la desviación estándar en pruebas nacionales de admisión
13 Efecto del cambio de la Desviación Estándar en los puntajes de pruebas de admisión a universidades MatemáticaLenguaje Desv. Est. 1999 132106 2000 120119 2001 130122 2002 138111 2003 140122 2004 (PSU) 109122 2005 y ss 110
14 Efecto del cambio de Desviación Estándar en los puntajes de postulación D.E. 2003D. E. 2004500 / 110 Mat140109110 Len122 110 Caso de postulante con puntajes 1,5 D.E. sobre el promedio Mat710664665 Len683 665 Promedio700673665
15 Índice de calidad ● Estabilidad del significado del Índice de calidad ● La propuesta asume que las puntuaciones del SIMCE y otros indicadores mantendrán su significado en el tiempo. Sin embargo, ello no está garantizado y se abren varias interrogantes: ● ¿Cómo se manejará la necesidad de ajustar la equivalencia de puntajes en el SIMCE cuando se produzcan cambios curriculares? ● ¿Qué plan existe para garantizar la estabilidad de los puntos de corte para establecer los niveles de aprendizaje? ● ¿Cómo se manejarán los previsibles cambios que se produzcan en el significado de diversos indicadores como consecuencia de su uso para fines de responsabilización? ● Recomendación: Asegurar que la metodología incluya un apartado que se haga cargo de las complejidades asociadas a la mantención de escalas y puntos de corte en el tiempo, junto a una agenda de investigación para monitorear posibles cambios en el significado de las escalas en el tiempo.
16 Manejo de Variables de Contexto ● Las variables seleccionadas son razonables y adecuadas al contexto nacional. ● El problema aparece con la decisión acerca de la metodología estadística para identificar el “efecto de escuela”. Se comparan modelos OLS y HLM, y se opta por los primeros. Esta decisión es una decisión debatible, como entiendo será abordado en la siguiente presentación. ● Recomendación: revisar la decisión tomada, preferentemente estableciendo un panel de expertos (con representación de las diversas disciplinas con competencias en el análisis estadístico de datos educacionales) para resolver la mejor metodología para este contexto.
17 La dinámica de un sistema de responsabilización basado en pruebas ● La experiencia internacional indica que los sistemas de responsabilización basados en prueba pueden desencadenar comportamientos estratégicos que afecten la validez de las mediciones (estrechamiento curricular, preparación para las pruebas, exclusión de estudiantes e incluso engaño). Al respecto, surgen las siguientes observaciones: ● Para la primera implementación del sistema se cuenta con información obtenida en un contexto diferente (en que quienes respondían cuestionarios no conocían las consecuencias de los datos que estaban generando). Esto abre tanto dudas acerca de la pertinencia de recurrir a tales datos, como a la muy probable modificación en los datos que se obtengan cuando se haga público el sistema de ordenación de escuelas. ● El empleo de escalas autoadministradas es especialmente sensible a respuestas estratégicas de los examinados. Esta materia no es suficientemente abordada ● Recomendación: establecer una agenda de estudios para monitorear la dinámica del sistema, estudiando especialmente potenciales comportamientos que afecten la validez de las mediciones. Se debe contar además, con un marco legal que permita hacer ajustes en la metodología si se detectan problemas con la calidad de la ordenación.
18 Conclusión ● El sistema de aseguramiento de calidad tiene una orientación adecuada, y debiera representar un avance relevante con respecto a la información hoy disponible. ● Sin embargo, hay aspectos centrales que merecen una revisión antes de su implementación. En particular el peso otorgado a los estándares. ● Sin perjuicio de lo anterior, creo también fundamental que una vez implementada, la metodología sea sometida a un monitoreo sistemático que incluya la posibilidad de introducirle ajustes antes de 4 años. La experiencia internacional con sistemas de responsabilización basados en pruebas hace altamente recomendable esta posibilidad. En consecuencia, es altamente deseable que el sistema opere en “marcha blanca” durante los primeros años de funcionamiento.