1 Bioestadística Regresión y Correlación Múltiple:Construcción del modelo multivariado.
2 Registro: datos en hoja RM7.peso sexo h_arter deseado anemia talla ejerci tabaco alcohol 1 3166 50.50 2 2965 50.00 3 3135 51.30 … 498 3217 50.80 499 3573 500 4033 51.90 “Peso” en gramos; “Sexo 1” hombre; “H_arter 1” HA; “N_desea 1” embarazo no deseado; “Anemia 1” anemia; “Talla” en centímetros; “Ejerci 1” ejercicio moderado; “Ejerci 2” ejercicio intenso; “Tabaco 1” tabaquismo pasivo; “Tabaco 2” fumadora; “Alcohol 1” consumió alcohol.
3 1.- Descripción univariada.Variable n % Sexo Intensidad de la actividad física Mujer 235 47.0 Leve 265 53.0 Hombre Moderada 141 28.2 Hipertensión Arterial Intensa 94 18.8 No 406 81.2 Tabaquismo Si 305 61.0 Anemia Pasivo 100 20.0 336 67.2 Activo 95 19.0 164 32.8 Consumo de alcohol Embarazo deseado 262 52.4 86 17.2 238 47.6 414 82.8
4 1.- Descripción univariada.Variable 𝒙 s Talla 50.6 1.88 Peso 3,280.3 544.2
5 1.- Descripción univariada.Variable 𝒙 s Talla 50.6 1.88 Peso 3,280.3 544.2 Variable n % Talla 44.0 a 47.9 39 7.8 48.0 a 51.9 338 67.6 52.0 a 55.9 123 24.6 Peso 1,500 a 2,599 63 12.7 2,600 a 3,699 319 64.1 3,700 a 4,800 116 23.3
6 1.- Descripción univariada.Variable 𝒙 s Talla 50.6 1.88 Peso 3,280.3 544.2 Variable n % Talla 44.0 a 47.9 39 7.8 48.0 a 51.9 338 67.6 52.0 a 55.9 123 24.6 Peso 1,500 a 2,599 63 12.7 2,600 a 3,699 319 64.1 3,700 a 4,800 116 23.3
7 2.- Análisis bivariado: peso al nacer.Variable n 𝒙 s Diferencia p Sexo Mujer 235 3,201.2 541.2 0.0 0.0021 Hombre 265 3,350.4 538.3 149.2 Hipertensión arterial No 406 3,306.9 540.5 0.0229 Si 94 3,165.3 548.4 -141.6 Anemia 336 3,289.3 541.3 0.5955 164 3,261.7 551.4 -27.6 Embarazo deseado 86 3,179.2 566.1 0.0584 414 3,301.3 537.9 122.1
8 2.- Análisis bivariado: peso al nacer.Variable n 𝒙 s Diferencia p Intensidad de la actividad física Leve 265 3,265.8 539.8 0.0 0.7449 Moderada 141 3,309.3 565.2 43.5 Intensa 94 3,277.3 528.6 11.5 Tabaquismo No 305 3,372.8 523.5 < Pasivo 100 3,193.9 518.3 -178.9 Activo 95 3,074.0 569.8 -298.8 Consumo de alcohol 262 3,364.8 524.0 0.0003 Si 238 3,187.1 552.0 -177.7
9 2.- Análisis bivariado: peso al nacer.Variable r p Talla 0.838 <
10 2.- Análisis bivariado: peso al nacer.Matriz de correlaciones bivariadas. Sexo HA Deseado Alcohol Anemia Talla Tabaco 1 Tabaco 2 Ejerci 1 Ejerci 2 Peso 1.0 0.04 -0.05 0.02 0.06 0.15 -0.04 0.08 -0.02 0.14 Hipertensión arterial -0.07 0.13 0.10 -0.06 -0.10 Embarazo deseado 0.05 0.03 0.09 Consumo de alcohol -0.01 -0.00 -0.16 -0.03 0.01 0.00 0.84 Tabaco pasivo -0.08 Tabaco activo -0.18 Ejercicio moderado Ejercicio intenso
11 2.- Análisis bivariado: peso al nacer.Matriz de correlaciones bivariadas. Sexo HA Deseado Alcohol Anemia Talla Tabaco 1 Tabaco 2 Ejerci 1 Ejerci 2 Peso 1.0 0.04 -0.05 0.02 0.06 0.15 -0.04 0.08 -0.02 0.14 Hipertensión arterial -0.07 0.13 0.10 -0.06 -0.10 Embarazo deseado 0.05 0.03 0.09 Consumo de alcohol -0.01 -0.00 -0.16 -0.03 0.01 0.00 0.84 Tabaco pasivo -0.08 Tabaco activo -0.18 Ejercicio moderado Ejercicio intenso
12 2.- Análisis bivariado: peso al nacer.Matriz de correlaciones bivariadas. Sexo HA Deseado Alcohol Anemia Talla Tabaco 1 Tabaco 2 Ejerci 1 Ejerci 2 Peso 1.0 0.04 -0.05 0.02 0.06 0.15 -0.04 0.08 -0.02 0.14 Hipertensión arterial -0.07 0.13 0.10 -0.06 -0.10 Embarazo deseado 0.05 0.03 0.09 Consumo de alcohol -0.01 -0.00 -0.16 -0.03 0.01 0.00 0.84 Tabaco pasivo -0.08 Tabaco activo -0.18 Ejercicio moderado Ejercicio intenso
13 2.- Análisis bivariado: peso al nacer.Variable p |r| Talla < 0.84 Tabaquismo 0.18 Consumo de alcohol 0.0003 0.16 Sexo 0.0021 0.14 Hipertensión arterial 0.0229 0.10 Embarazo deseado 0.0584 0.09 Anemia 0.5955 0.02 Intensidad de la actividad física 0.7449 0.03
14 3.- Estrategias para la selección de variables.Selección de variables hacia adelante (forward selection procedure) Regresión escalonada (stepwise regression procedure) Eliminación de variables hacia atrás (backward elimination procedure) Ajustar todos los modelos posibles (all posible regressions procedure)
15 3a.- Selección de variables hacia adelante.Seleccionar la variable independiente con la mayor asociación con la variable dependiente. Agregar al modelo la siguiente variable con la mayor asociación (con una p cruda ≤ 0.05). Realizar una prueba de F parcial o múltiple parcial cada vez que se agregan variables al modelo. El procedimiento termina cuando la F parcial o múltiple parcial de la última variable agregada no es significativa (p > 0.05).
16 3b.- Regresión escalonada.Seleccionar la variable independiente con la mayor asociación con la variable dependiente. Agregar al modelo la siguiente variable con la mayor asociación (con una p cruda ≤ 0.05). Cada vez que se agrega una variable se evalúan todas las F parciales o múltiples parciales que corresponde a cada variable. Si la regresión no es significativa, ahí se termina el procedimiento.
17 3c.- Eliminación de variables hacia atrás .Empiece con un modelo que contenga todas la variables independientes. Determine la significancia de todas las variables como si fuera la última en ingresar. Retire la que tenga menor significancia por arriba de 0.05. El procedimiento termina cuando todas las variables en el modelo tengan una significancia parcial o múltiple parcial igual o menor a 0.05.
18 3d.- Ajustar todos los modelos posibles.Para todos los modelos posibles se calcular R2. Se selecciona el modelo con el R2 de mayor magnitud. Se evalúan todas las F parciales o múltiples parciales que corresponde a cada variable. Retirar variables las que tengan significancia por arriba de 0.05.
19 3a.- Selección de variables hacia adelante.p |r| Talla < 0.84 Tabaquismo 0.18 Consumo de alcohol 0.0003 0.16 Sexo 0.0021 0.14 Hipertensión arterial 0.0229 0.10 Embarazo deseado 0.0584 0.09 Anemia 0.5955 0.02 Intensidad de la actividad física 0.7449 0.03
20 3a.- Selección de variables hacia adelante.
21 3a.- Selección de variables hacia adelante.𝐹 tabaco|talla = 111′052, −103′700, /(3−1) 74, =99.21 p < 0.01
22 3a.- Selección de variables hacia adelante.
23 3a.- Selección de variables hacia adelante.
24 3a.- Selección de variables hacia adelante.
25 3a.- Selección de variables hacia adelante.
26 3a.- Selección de variables hacia adelante.p |r| Talla < 0.84 Tabaquismo 0.18 Consumo de alcohol 0.0003 0.16 Sexo 0.0021 0.14 Hipertensión arterial 0.0229 0.10 Embarazo deseado 0.0584 0.09 Anemia 0.5955 0.02 Intensidad de la actividad física 0.7449 0.03
27 Búsqueda de interacciones.
28 Búsqueda de interacciones.𝐹 talla∗tabaco|talla,tabaco, alcohol,h_arter, desea = ′ 538, − 118 ′ 499, /(8−6) 59, =0.644 p > 0.05
29 Búsqueda de interacciones.𝐹 h_arter∗tabaco|talla,tabaco, alcohol,h_arter, desea = ′ 305, − 118 ′ 499, /(8−6) 58, =13.878 p < 0.01
30 Búsqueda de interacciones.