1 Análisis de los datos: La descripción de los datos
2 Una vez ordenados y clasificados, los datos obtenidos pueden ser objeto de descripción estadística Como los datos varían mucho, el reflejo de estos cambios en las variables y atributos se muestra en sus valores y modalidades a lo largo de la población o muestra Estas variaciones se especifican en distribuciones de frecuencia y en porcentajes y pueden representarse gráficamente La esencia de la Estadística radica en: reducir, describir y medir los datos referentes a las variaciones y relaciones entre variables
3 Estadística de variables Distribuciones de frecuencia: Cuando se obtienen valores de una variable o las modalidades de un atributo por el “número de veces” en que se presentan en todas las unidades estudiadas Estás distribuciones se presentan descritas en tablas, que pueden contener y presentar casos de frecuencias para una sola o más variables Las frecuencias de una sola variable pueden ser de tres tipos: pocas observaciones, muchas observaciones pero distribuidas en pocos valores y muchas observaciones y muchos valores
4 Familiares condenadosNúmero% 19849.0 26733.5 32512.5 473.5 531.5 TOTAL200100.0 Delincuentes distribuidos por el número de familiares condenados una vez
5 Cuando hablamos de la frecuencia estamos trabajando con porcentajes El porcentaje se calcula a partir de una frecuencia y de su proporción: la proporción es el cociente de dividir un sumando por el total y multiplicarlo por 100 Con los porcentajes se observa más fácilmente el nivel de representatividad de una frecuencia Con los mismos datos podemos trabajar por frecuencias acumuladas, con ellas se forma una distribución de datos. Los datos se presentan no por el número de veces en que se distribuyen en cada valor de la variable sino con relación “al número de observaciones que corresponden a un valor y a todos los anteriores a él”
6 Familiares condenadosNúmero% Hasta 19849.0 Hasta 216582.5 Hasta 319095 Hasta 419798.5 Hasta 5200100 Delincuentes de frecuencias acumuladas y porcentajes del número de familiares de delincuentes condenados una vez
7 Los límites de la variable se puede también expresar por el límite superior de cada intervalo. Así, según los datos sobre los familiares de delincuentes condenados, también pueden expresarse eliminando el límite superior de cada intervanlo
8 Familiares condenadosNúmero Menos de 298 Menos de 3165 Menos de 4190 Menos de 5197 Menos de 6200 Distribución de frecuencia acumulada de familiares de delincuentes condenados una vez
9 La acumulación puede expresarse en sentido creciente o decreciente. Los datos de las Tablas 2 y 3 están descritos en forma creciente Este tipo de frecuencias acumuladas también se efectúa cuando la variable tiene muchas observaciones y muchos valores distintivos. Estos valores se agrupan en clases formándose los intervalos La elaboración de los grupos de valores se ha de realizar reduciendo las informaciones para que revelen las características importantes de la distribución. En ello surgen distintos problemas:
10 1. Fijar el número de clases o grupos de valores, que dependen de las características de la variable. Se evitará el excesivo detalles así como el poco detalle. El criterio será utilitario: aquel número que sea suficiente para ser manejable y exprese las características de la variable. 2. Fijar los intervalos: a) Fijar los extremos de la variable; b) Dividir las expresiones de la variable en tantas partes o intervalos como clases quieran observarse
11 3. El intervalo tiene dos límites: uno superior y otro inferior, que definen al intervalo en sí mismo y a su amplitud Se han de fijar los límites de los intervalos. Un problema consiste en evitar que el límite superior y el inferior de dos intervalos contiguos estén expresados por el mismo valor De 4 a 8 De 8 a 12 De 12 a 16 Una solución es De 4 a 7,99 De 8 a 11,99 De 12 a 15,99
12 Otra cuestión en este punto es el de los intervalos mal especificados Antes de 12 y después de 21 no está limitados y no se puede calcular su amplitud IntervalosPoblacionesPenitenciarías Ante de 12 años384 De 12 a 164514 De 17 a 21177 Después de 2162 Total10627
13 4. Amplitud de los intervalos pueden ser de la misma amplitud o puede ser variable, ya que lo más importante es que la estadística obtenida exprese lo más fielmente posible las características de la variable estudiada IntervalosPrisión 1 CondenasPrisión 2 preventi Hasta 2 años4510 De 2 y 1 día a 6351 De 6 y 1 día a 10150 De 10 y 1 día a 1710 De 17 y 1 día a 3050 De 30 y 1 día a 4010 TOTAL10211
14 Se forman estadísticas de dos variables cuando en cada unidad estudiada se observan la relación de dos variables, de modo que se obtienen parejas de valores. Los datos resultantes se han de describir de modo que se exprese la ligación de los dos valores de la pareja Hay tres métodos estadísticos que describen esta relación de variables:
15 1. Para las variables de pocas observaciones la tabla se forma poniendo los pares de valores en dos columnas, una para cada variable haciendo corresponder las parejas de valores, de tal forma que las columnas pueden colocarse en el orden que se quiere.
16 Edad en años (9 sujetos)Número de condenas 212 222 252 273 284 292 322 394
17 2. Para las variables en que hay muchos pares de valores pero pocas parejas de valores distintas, se forma una tabla donde hay tres columnas: dos columnas para las parejas distintas y una tercera para las frecuencias de las observaciones
18 Edad en añosNúmero de condenasNúmero de reincidentes 21225 22218 23735 25241 29230 3439 35224 42318 TOTAL200
19 3. El número de observaciones puede ser muy elevado y el número de parejas distintas también. Efectuada la reducción de datos se presenta en una tabla de doble entrada. Puede ocurrir que ambas variables tomen muchos valores distintos o que los tome sólo una, en este caso se presentará a intervalos
20 En una muestra de 800 se requiere ver la relación entre años de escolaridad y salario Años de escolaridad Salarios mensualesUnidades de muestra De 18-30De 30-60De 60-100 6 años143590202 8 años9617032298 10 años012356179 12 años017104121 TOTAL239369192800
21 Con las estadísticas de más de dos variables se pretenden conocer la relación que liga más de dos variables, hasta un conjunto de ellas. Ejemplo: los gastos mensuales de una familia es una variable que está relacionada con: ingresos familiares, número de hijos, edad de los hijos, nivel de precios. En un estudio que se consideren las relaciones de influencia de tales variables los datos se pueden presentar en tablas en las que no cabe el formato de doble entrada como hemos mostrado antes. Además se ha de distinguir entre variables que tengan pocas observaciones, con muchos o pocos valores, y variables donde hay muchas unidades de estuido
22 En el primer caso se elabora una tabla con tantas columnas como variables, descritas estas ya sea en todos sus datos o ya sea en intervalos. En esta tabla cada fila corresponde a una unidad. En el segundo caso los datos se presentan describiendo las unidades por el procedimiento de agregación, es decir, agrupar los elementos de población por modalidades de atributo o valores de una variable en estudio. Los datos se presentan también en tantas columnas como variables se relacionen.
23 Estadística de atributos En los atributos las observaciones de las unidades de la población o de la muestra que se estudia se reúnen en modalidades. Un primer problema es la definición de las modalidades, ya que en muchos atributos éstas son formadas por el investigador según el criterio de la investigación dependiendo de la opción teórica y conceptual. Hay atributos cuyas modalidades son conocidas (sexo: varón y hembra), pero cuando hay que trabajar con actitudes y comportamientos las modalidades han de ser elaboradas comprendiendo todas las características del atributo y después se pueden cuantificar
24 Cuando las actitudes, comportamiento, percepciones, opiniones, se expresan en conceptos y se analizan de este modo, entonces se elaboran las tablas para los atributos Cuando la modalidad del atributo se expresa en un número de atributo pasa a ser una variable. Con relación a la presentación estadística se ha de distinguir entre: un atributo, dos atributos y más de dos, así como ver las estadísticas mixtas: combinación de atributo y variable
25 En las estadísticas de un atributo los datos se presentan en una tabla de dos columnas, en una las modalidades del atributo y en la otra las modalidades de observación Ortodoxia religiosa (atributo) FrecuenciasPorcentaje Práctica y creencia10150,50 Práctica sin creencia4221,00 Creencia sin práctica126,00 Agnósticos3019,50 Sin religión63,00 TOTAL205100
26 En las estadísticas de dos atributos se estudia el grado de dependencia entre dos atributos. Los datos se presentan al igual que en las variables por una tabla de doble entrada Tipos de actitud HombresMujeresTotal Númer o % % % Permisividad63070,7983061,39146065,12 Tolerancia12714,2718113,3930813,74 Punición social12914,4929721,9742619,00 Punición legal40,45443,25482,18 TOTAL89010013521002242100
27 En las estadísticas de más de dos atributos se ha de ver la ligación entre todas ellas Ejemplo: relación que existe en las zonas de marginación entre la falta de escolaridad, el tipo de trabajo, un ingreso escaso o nulo y lo que produce un alto nivel de conductas muy perseguidas por las instancias de control Escolaridad, Trabajo, Ingreso, hábitat y conducta controlada pueden ser traducidas a atributos Es muy difícil presentar toda esta interrelación en tablas en las que se puedan incluir todas las posibilidades de cada atributo
28 Clasificación de la población por el sexo, el trabajo, el hábitat y control SexoTrabajo marginado Hábitat Trabajo no marginado Hábitat Total MiseriaNo Miseria MiseriaNo Miseria HombreDelincuente8051398 No delincuent132385121 MujerDelincuente638475 No delincuent34292137 TOTAL15978194431
29 Análisis de las variables: una variable - los promedios - Moda - Media aritmética - Media aritmética ponderada - Mediana - ¿problema con los intervalos?
30 Dispersión Desviación estándar y recorrido y el coeficiente de variación
31 Representaciones gráficas Diagrama de barras Muchas observaciones y pocos valores Histograma Cuando la variable se reduce en intervalos por haber muchas observaciones y muchos valores, si los intervalos son de amplitud constante. También sirve para los atributos con la única diferencia de que no hay continuidad entre las modalidades del atributo
32 Nube de puntos En estadísticas de dos variables en las que se clasifican parejas de valores, uno de una variable y otro de la otra, su representación gráfica se lleva a cabo por la denominada nube de puntos, que se efectúa sobre un par de ejes rectangulares y se coloca en cada uno una variable Pirámide Para representaciones gráficas de una población. Los intervalos pueden tener distinta amplitud pero se exigirá una corrección
33 Curvas o distribuciones campaniformes Los histogramas se suelen sustituir por una línea curva Las distribuciones (curva) pueden ser simétricas, moderadamente asimétrica y si gnificativamente asimétricas