1 Estadística Administrativa IIUSAP Estadística Administrativa II 2016-1 Análisis de varianza
2 𝜎 2 ANOVA Análisis de varianza
3 La prueba ANOVA A menudo se necesitan hacer comparaciones para más de dos medias y para ello se utilizan la metodología del análisis de varianza (ANOVA), que recurre a la distribución F.
4 Principio Experimentos en agricultura Variación de tratamientoVariación aleatoria Muestra 1 Muestra 2 Muestra 3 Muestra 4
5 Variación de tratamiento“VARIACIÓN DE TRATAMIENTO: Suma de las diferencias entre la media de cada tratamiento y la media global elevada al cuadrado.” (Lind |Marchal |Wathen, 2008, p.331). Media aritmética global Media aritmética de cada muestra 𝑋 = 𝑋 𝑖 𝑛
6 Variación de tratamiento𝑉𝑇= 𝑛 𝑋 𝑚 1 − 𝑋 𝑔 𝑛 𝑋 𝑚 2 − 𝑋 𝑔 … Calcular la media aritmética de cada muestra Calcular la media aritmética de todos los datos en análisis La diferencia entre la media muestral y la media global; se eleva al cuadrado Se suman todas las diferencias cuadradas
7 Ejemplo . . . (sin demostrar hipótesis)El gerente de un centro financiero regional desea comparar la productividad, medida por el número de clientes atendidos, de 3 de sus empleados. Selecciona 4 días en forma aleatoria y registra el número de clientes que atendió cada empleado. Los resultados obtenidos fueron:
8 . . . Ejemplo 𝑋 𝐿 = =56 𝑋 𝐵 = =70 𝑋 𝐶 = =48 𝑋 𝑔 = =58
9 . . . Ejemplo 𝑋 𝑚 − 𝑋 𝑔 2 𝑉𝑇=992
10 Variación Aleatoria 𝑋 = 𝑋 𝑖 𝑛“VARIACIÓN ALEATORIA: Suma de las diferencias entre cada observación y su media de tratamiento, elevada al cuadrado.” (Lind |Marchal |Wathen, 2008, p.331). Observación ≡Dato de una muestra Media aritmética de cada muestra 𝑋 = 𝑋 𝑖 𝑛
11 Variación Aleatoria Calcular la media aritmética de cada muestra𝑉𝐴= 𝑋 𝑖 − 𝑋 𝑚 𝑋 𝑗 − 𝑋 𝑚 … Calcular la media aritmética de cada muestra La diferencia entre el dato observado y la media de la muestra se eleva al cuadrado Se suman todas las diferencias cuadradas
12 Ejemplo 1 . . . (sin demostrar hipótesis)El gerente de un centro financiero regional desea comparar la productividad, medida por el número de clientes atendidos, de 3 de sus empleados. Selecciona 4 días en forma aleatoria y registra el número de clientes que atendió cada empleado. Los resultados obtenidos fueron:
13 . . . Ejemplo 1 𝑋 𝑖 − 𝑋 𝑚 2 𝑉𝐴=90
14 Distribución F para ANOVA𝐹= 𝑠 𝑠 2 2
15 Distribución F para Anova𝐹= 𝐸𝑠𝑡𝑖𝑚𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝑏𝑎𝑠𝑎𝑑𝑎 𝑒𝑛 𝑙𝑎𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎𝑠 𝑒𝑛𝑡𝑟𝑒 𝑚𝑒𝑑𝑖𝑎𝑠 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙𝑒𝑠 𝐸𝑠𝑡𝑖𝑚𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝑏𝑎𝑠𝑎𝑑𝑎 𝑒𝑛 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒𝑛𝑡𝑟𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑜 𝑒𝑟𝑟𝑜𝑟 𝑚𝑒𝑑𝑖𝑜 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜 (𝑀𝑆𝐸) = 𝑉𝑇 𝑘−1 𝑉𝐴 𝑛−𝑘 𝑘 es el total de muestras en análisis 𝑛 es el total de elementos en análisis
16 Tabla resumen ANOVA Error medio cuadrado MSE
17 Ejemplo El gerente de un centro financiero regional desea comparar la productividad, medida por el número de clientes atendidos, de 3 de sus empleados. Selecciona 4 días en forma aleatoria y registra el número de clientes que atendió cada empleado. Con los datos observados, se obtuvo una variación de tratamiento de 992 y una variación aleatoria de 90. Los resultados se obtuvieron de las siguientes muestras: ¿Existe alguna diferencia entre las medias de la población con nivel de significancia de 0.10?
18 . . . Ejemplo 1 Paso 1: Hipótesis nula y alternativa𝐻 0 : 𝜇 𝑙𝑜𝑏𝑜 = 𝜇 𝑏𝑙𝑎𝑛𝑐𝑜 = 𝜇 𝑐ó𝑟𝑑𝑜𝑏𝑎 𝐻 𝑎 :𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠 Paso 2: Nivel de significancia 𝛼=0.10 Paso 3: Estadístico de prueba 𝐹= 𝑠 𝑠 2 2
19 . . . Ejemplo 1 Paso 4: Regla de decisión 𝐹=4.26𝐻 0 : 𝜇 𝑙𝑜𝑏𝑜 = 𝜇 𝑏𝑙𝑎𝑛𝑐𝑜 = 𝜇 𝑐ó𝑟𝑑𝑜𝑏𝑎 2 𝑐𝑜𝑙𝑎𝑠 𝛼= =0.05 𝑔𝑙 1 =3−1=2 𝑘=3 𝑔𝑙 2 =12−3=9 𝑛=12 𝐹=4.26
20 La hipótesis nula se rechaza𝐹=4.26 . . . Ejemplo 1 Paso 5: Toma de decisión La hipótesis nula se rechaza Existe evidencia fuerte de que no todas las medias de la población son iguales
21 Ejemplo La siguiente información se refiere a dos muestras. Verificar la hipótesis de que las medias de tratamiento son iguales con nivel de significancia de 0.02. Tratamiento 1 Tratamiento 2 Tratamiento 3 8 3 5 2 4 10 9
22 . . . Ejemplo 2 Paso 1: Hipótesis nula e hipótesis alternativa𝐻 0 : 𝜇 1 = 𝜇 2 = 𝜇 3 𝐻 𝑎 :𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠 Paso 2: Nivel de significancia 𝛼=0.02 Paso 3: Estadístico de prueba 𝐹= 𝑠 𝑠 2 2
23 . . . Ejemplo 2 Paso 4: Regla de decisión 𝐹=8.02 𝐻 0 : 𝜇 1 = 𝜇 2 = 𝜇 32 𝑐𝑜𝑙𝑎𝑠 𝛼= =0.01 𝑘=3 𝑔𝑙 1 =3−1=2 𝑔𝑙 2 =12−3=9 𝑛=12 𝐹=8.02
24 . . . Ejemplo 2 𝑃𝑎𝑠𝑜 5:𝑇𝑜𝑚𝑎 𝑑𝑒 𝐷𝑒𝑐𝑖𝑠𝑖ó𝑛 𝑘=3 𝑛=12𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎 de cada muestra 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎 global
25 . . . Ejemplo 2
26 La hipótesis nula se rechaza𝐹=8.02 . . . Ejemplo 2 La hipótesis nula se rechaza Existe evidencia suficiente que indica que no todas las medias de la población son iguales
27 Práctica 1 Las temperaturas promedio de las tres principales ciudades fueron registradas en las siguientes muestras: Tegucigalpa San Pedro Sula Ceiba 18 29 31 22 32 30 24 38 35 19 28 Con un nivel de significancia de probar si las temperaturas son iguales en las 3 ciudades.
28 Desarrollo práctica 1 Paso 1: Hipótesis nula e hipótesis alternativa𝐻 0 : 𝜇 1 = 𝜇 2 = 𝜇 3 𝐻 𝑎 :𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠 Paso 2: Nivel de significancia 𝛼=0.10 Paso 3: Estadístico de prueba 𝐹= 𝑠 𝑠 2 2
29 Desarrollo práctica 1 Paso 4: Regla de decisión 𝐹=3.89𝐻 0 : 𝜇 1 = 𝜇 2 = 𝜇 3 2 𝑐𝑜𝑙𝑎𝑠 𝛼 2 = =0.05 𝑘=3 𝑔𝑙 1 =3−1=2 𝑔𝑙 2 =15−3=12 𝑛=15 𝐹=3.89
30 Desarrollo práctica 1 𝑃𝑎𝑠𝑜 5:𝑇𝑜𝑚𝑎 𝑑𝑒 𝐷𝑒𝑐𝑖𝑠𝑖ó𝑛 𝑘=3 𝑛=15Tegucigalpa San Pedro Sula Ceiba 18 29 31 22 32 30 24 38 35 19 28 𝑘=3 𝑛=15 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎 de cada muestra 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎 global
31 Desarrollo práctica 1
32 Desarrollo práctica 1 𝐹=3.89 Valor críticoLa hipótesis nula se rechaza
33 Hipótesis nula rechazadaLa hipótesis nula rechazada indica que no todas las medias son iguales; sin embargo, se puede identificar un par de muestras para establecer el intervalo de confianza que nos indique que tanto es esa diferencia.
34 De eso se trata el siguiente tema Muchas graciasLind, D.A., Marchal, W.G., Wathen, S.A. (15). (2012). Estadística Aplicada a los Negocios y la Economía. México: McGrawHill David M. Levine, Timothy C. Krehbiel, Mark L. Berenson Estadística para Administración. (4° edición). Naucalpan de Juárez, México.: Pearson Prentice Hall