ESTADISTICA DESCRIPTIVA

1 ESTADISTICA DESCRIPTIVAIng Haydeli Roa Lopez ...
Author: Veronica Flores Lozano
0 downloads 1 Views

1 ESTADISTICA DESCRIPTIVAIng Haydeli Roa Lopez

2 Concepto La estadística descriptiva es la rama de la estadística que recolecta, analiza y caracteriza un conjunto de datos (peso de la población, beneficios diarios de una empresa, temperatura mensual,…) con el objetivo de describir las características y comportamientos de este conjunto mediante medidas de resumen, tablas o gráficos.

3

4 Una población estadística es un conjunto de sujetos o elementos que presentan características comunes. Sobre esta población se realiza el estudio estadístico con el fin de sacar conclusiones.

5

6 El tamaño poblacional es el número de individuos que constituyen la población. Según el número de sujetos, el tamaño puede ser finito o infinito. Los conjuntos infinitos son algo artificial o conceptual, ya que toda población de entidades físicas es finita. Por ejemplo: Población finita: el conjunto de habitantes de una ciudad, los bolígrafos producidos en una fábrica en un día, etc. Población infinita: el conjunto de los números positivos.

7 Cuando la población es muy grande, normalmente es imposible estudiar a todos los individuos.Supongamos que queremos saber cual es el nivel de colesterol de la población de Estados Unidos. Por cuestiones económicas y de tiempo obvias, no está al alcance realizar un análisis de sangre a toda la población de EEUU. Para solucionar este impedimento, se utiliza una muestra estadística.

8 . Una muestra estadística (o una muestra) es un subconjunto de elementos de la población estadística.

9 El mejor resultado para un proceso estadístico sería estudiar a toda la población. Pero esto generalmente resulta imposible, ya sea porque supone un coste económico alto o porque requiere demasiado tiempo. Frente a la dificultad de hacer un censo (estudio de toda la población), se examina una muestra estadística que representará a la totalidad de los sujetos. Con los resultado obtenidos mediante la muestra, se intentará inferir las propiedades de todos los elementos, mediante la estadística inferencial.

10 La muestra elegida debe ser representativa de la poblaciónLa muestra elegida debe ser representativa de la población. Las muestras tienen un nivel de confianza de la bondad con la que representan a todos los sujetos, generalmente del 95% o superior. Por ejemplo, supongamos que se realiza un control de calidad en una fábrica que produce dvds en el transcurso de un día. Esta empresa produce un millón de dvds diarios por lo que sería imposible para los controladores examinarlos todos. Por ello, se elige una muestra de cien elementos para realizar dicho control. Imagen del diálogo: LA muestra se selecciona por un método de muestreo. Pero surge la siguiente pregunta: ¿Cómo elegimos la muestra?

11 Existen diferentes tipos de 

12 VARIABLES ESTADÍSTICASUna variable estadística es el conjunto de valores que puede tomar cierta característica de la población sobre la que se realiza el estudio estadístico. Estas variables pueden ser: la edad, el peso, las notas de un examen, etc. Las variables estadísticas se pueden clasificar por diferentes criterios. Según su medición existen dos tipos de variables:

13 Cualitativa (o categórica): son las variables que pueden tomar como valores cualidades o categorías. Ejemplos: Sexo (hombre, mujer) Salud (buena, regular, mala) Cuantitativas (o numérica): variables que toman valores numéricos. Número de casas (1, 2,…) Edad (12,5; 24,3; 35;…) Las variables cualitativas se pueden clasificar según sigan un orden determinado o no.

14 Tipos Definición Ejemplos Nominal Ordinal BinariaVARIABLES CUALITATIVAS Tipos Definición Ejemplos Nominal Variables cualitativa cuyas categorías no siguen ningún orden. – Color (blanco, rojo, azul,…) – Lateralidad (zurdo, diestro) Ordinal Son las variables categóricas con orden – Nota examen  (suspenso, aprovado, notable, sobresaliente)  – Nivel económico  (pobre, clase media, rico) Binaria Es un caso particular de variable nominal con solo dos categorías. Si las dos categorías determinan dos estados cualesquiera (ejemplo: sexo) se denomina binaria simétrica. Si el 1 determina la presencia de una característica y el 0 la absencia (ejemplo: depresión, enfermedad,…) la variable se dice binaria asimétrica. – Sexo (mujer, hombre) – Enfermo (si, no)

15 – Canastas en un partido (20; 21; 22; pero no 21,5)Las variables cuantitativas se clasifican según el número de valores que puede tomar la variable. VARIABLES CUANTITATIVAS Tipos Definición Ejemplos Discreta La variable solo puede tomar valores en número determinado de valores. En cada intervalo de valores la variable solo puede tomar un valor. – Canastas en un partido (20; 21; 22; pero no 21,5) Continua La variable puede adquirir cualquier valor dentro de un intervalo de valores determinado. – Peso (53,53kg; 89,4kg;…)

16 Las variables se pueden clasificar también según si son independientes o dependientes:Variable independiente: Es una variable que su valor no depende de otra variable. La variable independiente suele representarse en las gráficas en el eje de abcisas (x). Variable dependiente: Es una variable cuyos valores dependen de los valores que tome otra variable. Se representa en el eje de ordenadas y. El investigador utiliza estas variables en el estudio estadístico con el fin de con el de encontrar alguna causalidad de ciertas variables sobre las variables objetivo del estudio

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32 Ejemplos para analizar1.- Análisis de la situación actual de las empresa del sector financiero en Managua 2.-La motivación del Personal Hotelero en Managua 3.- El manejo ambiental por parte de las empresas del sector de artes graficas 4.- Estrategias de marketing de las empresa nacionales , frente a las extranjeras establecidas en el país 5.- Estudio evaluativo del impacto de la tasas de cambio en las tasa de interés durante los últimos dos años.

33 6.- Análisis del desempleo en Managua durante los últimos diez años7.- Análisis de la actitud ética de los profesionales de Contaduría Publica en el desarrollo de su profesión 8.- Importancia de la administración contable en la administración efectiva de las organizaciones 9.- Ventajas del sistema de costeo basado en las actividades respecto al sistema de costeo Tradicional 10.- Aplicación tecnológica sistematizada en el manejo de la producción de la empresas del sector Maquila en las zonas francas

34

35

36

37 ETAPAS PARA REALIZAR UN ESTUDIO ESTADÍSTICO…Selección de caracteres dignos de ser estudiados. Mediante encuestas o medición, obtención del valor de cada individuo en los caracteres seleccionados. Elaboración de tablas de frecuencias mediante la adecuada clasificación de los individuos dentro de cada carácter. Representación grafica de los resultados (elaboración de graficas estadísticas). Obtención de parámetros estadísticos, números que sintetizan los aspectos más relevantes de una distribución estadística.

38 Reordenar los punteos y agruparlos en varias formas para que sea posible tener a primera vista una imagen global de los datos. Construir tablas, graficas y figuras que permitan visualizar los resultados. Convertir los datos originales en formas que sean mas útiles: calificaciones porcentajes

39 Convertir los datos originales en formas que sean mas útiles: calificaciones porcentajesCalcular promedios Tomando el promedio como punto de referencia, describir la dispersión de los datos. Obtener una relación entre dos instrumentos de medida diferente.

40 LA INVESTIGACIÓN ESTADÍSTICALa investigación estadística es la búsqueda sistematizada y objetiva de hechos o de explicación de fenómenos. El método de investigación estadística comprende las cinco fases siguientes: Preparación del trabajo. Recopilación de los datos.

41 Evaluación y depuración de los datos.Presentación de los datos. Análisis e interpretación.

42 PRIMERA FASE O PREPARACION DEL TRABAJOSe limita a la redacción de las instrucciones para recabar los datos, definición precisa de los datos que se necesitan; diseño de formularios y planillas, planificación y organización del trabajo en el espacio y en el tiempo. En esta fase deben quedar perfectamente claros los conceptos y cada participante debe conocer a cabalidad sus atribuciones y responsabilidades; ya que las dudas o malas interpretaciones echarán a perder el resto de la investigación.

43 SEGUNDA FASE O RECOPILACION DE LOS DATOSEn ella se recaban los datos necesarios para la investigación, mediante encuestas, muestreos, censos, o se toman de fuentes secundarias o registros y publicaciones. La eficiencia con que se realice esta etapa generará la calidad de todo el trabajo de investigación estadística.

44 TERCERA FASE O EVALUACIÓN DE LOS DATOSLos datos recopilados, en la vida real, suelen adolecer de imperfecciones y errores varios; debidos a la ignorancia, a malos entendidos, a intereses creados o a prejuicios sociales, de parte de quien aporta los datos o de quien los recaba. De allí que el paso inmediato sería una depuración y evaluación de tales datos, a fin de subsanar o mitigar las influencias y efectos de tales errores e imperfecciones. Para lograrlo se recomiendan los siguientes procedimientos: Revisión total de los cálculos, de las tabulaciones y del procedimiento utilizado.

45 Revisión total de los cálculos, de las tabulaciones y del procedimiento utilizado.Confrontar los datos recopilados, con los obtenidos al cálculo, con los de otras regiones o países, tomados en otras ocasiones o con otra finalidad. Repetir al muestreo, el mismo trabajo, en zonas estratégicamente escogidas; cuando en las verificaciones anteriores se hubieran obtenido notorias discrepancias.

46 Ecuaciones compensadoras:Se usan para efectuar verificaciones, como las anteriores. Un ejemplo sería la utilizada en censos demográficos, así: Explicando cada uno de los elementos de la ecuación nos queda entonces que: Todo referido a un mismo período censal. El resultado así obtenido, debe resultar muy aproximado al obtenido mediante el censo realmente efectuado.

47 * Índices de preferencia:Indican la predilección que por determinados dígitos suelen tener los declarantes; lo cual los induce a errores. Al respecto existen varias publicaciones, siendo la más recomendable la de la “Secretaría de la Organización de las Naciones Unidas” (ONU.)

48 CUARTA FASE O PRESENTACIÓN DE LOS DATOSLos datos suelen estar presentados en forma tabular, en cuadros de doble entrada, proporcionales, porcentuales, o en valores promedios. También suelen representarse gráficamente, mediante: Histogramas, polígonos, diagramas figurados, prismogramas, pictogramas, dibujos acotados, entre otros.

49 QUINTA FASE O ANALISIS E INTERPRETACIÓN DE LOS DATOSPodría decirse que es ésta la fase más amplia de todas y en la cual la investigación rinde sus mejores frutos. Desde la más remota antigüedad se ha venido aplicando el análisis estadístico a las investigaciones demográficas, socioeconómicas, fiscales, entre otros. Obteniéndose así índices y tendencias de natalidad, mortalidad, mortinalidad (nacidos muertos), nupcialidad, inmigración, emigración, etc. De generalización más reciente tenemos los índices y tendencias del costo de la vida, de tan rotunda actualidad; los cuales se obtienen sumando los costos promedios de alimentos, vivienda, medicinas, ropas y servicios consumidos por una persona, familia, estándar, en el período que se estudia. Igualmente, los índices de productividad o relación entre la producción y las horas - hombre de trabajo en ella utilizadas.

50 La investigación debe desarrollarse sistemáticamente pasando por las etapas de planificación, ejecución y evaluación. En la primera etapa se considera integralmente la investigación, poniéndose por escrito en un documento no solo lo que precede a la obtención de la información en el campo, sino que se toman en cuenta las actividades que se desarrollaran en las etapas restantes.

51 PLANIFICACIÓN. Justificación de la investigaciónPLANIFICACIÓN. Justificación de la investigación. Justificar la investigación significa exponer las razones que fundamentan su realización que en general podrían ser de tipo netamente intelectual o pragmático. En el primer caso podría resultar difícil identificar beneficios, pero en el segundo, los argumentos podrán ser expresados en términos de la utilidad que pudiera reportar tal investigación a la institución en donde se trabaja o al investigador mismo. En cualquier circunstancia, la justificación debe hacerse por escrito para contar, con oportunidad y precisión, con los puntos que habrán de esgrimirse para obtener los recursos necesarios.

52 Planteamiento del problema Solo cuando el problema este bien enunciado y delimitado será factible localizar todos los posibles antecedentes que bien podrían incluir una investigación que resolviera una pare o la totalidad del problema, aunque también es cierto que tales antecedentes debieran ser enjuiciados para determinar su validez y aplicabilidad a la situación particular que se este manejando

53 Determinación de los objetivos de la investigación.Cuando se ha planteado el problema se está en condiciones de decidir si la actual investigación se abocará a la solución parcial o integral del problema y de acuerdo con ello se podrán redactar los objetivos. Si de acuerdo con la naturaleza de la investigación lo que se pretende es obtener información sobre el estado de las cosas, esto determinara la redacción del o de los objetivos. Si por el contrario, lo que se pretende es probar una hipótesis, el objetivo expresara esa intención. Debe tenerse en cuenta la posibilidad de que para solucionar el problema planteado en el punto anterior pudiera requerirse la realización de investigaciones previas y que por lo tanto la actual investigación solo constituiría un antecedente indispensable para el desarrollo de lo que pudiese resolver completamente el problema.

54 Definición del universo de estudio.Con el termino universo se hace referencia al conjunto al cual se le podrán atribuir los resultados, ya sea porque comprende todos los elementos que vayan a ser realmente estudiados o porque habiendo acudido al recurso de examinar solo una muestra, sus integrantes hayan tenido una probabilidad - conocida y distinta a cero - de haber podido formar parte de la muestra. Es necesario que la definición incluya la delimitación precisa del área geográfica y de los requisitos que debe satisfacer cada elemento para considerarlo inequívocamente dentro del universo.

55 Determinación de variablesLas variables no son otra cosa que las características que se van a captar en cada elemento del conjunto y se les denomina así porque no todos los elementos quedan clasificados en la misma categoría o clase. Es frecuente denominar variables independientes a aquellos que podrían causar o influir la variabilidad de otras llamadas variables dependientes. Algunas características importantes son: el peso, la edad, el sexo, la estatura, la presión sanguínea. Debe hacerse una selección cuidados de las variables que se van a manejar en la investigación teniendo siempre presente los objetivos para no omitir datos importantes y cuidando de no agregar más que los estrictamente necesarios para controlar las actividades de campo.

56 Formulación de hipótesisComo las hipótesis son enunciados de relaciones entre algunas e las variables, es preciso haber determinado estas para darle un sentido preciso a la relación. Con frecuencia en la hipótesis se niega lo que se pretende probar obteniendo lo que se denomina una hipótesis de nulidad que constituye el punto de partida para la llamada prueba de hipótesis en estadística.

57 Procedimientos de mediciónUna vez identificadas las variables que van a ser analizadas en cada uno de los elementos del conjunto por estudiar, es necesario definirlas estableciendo los procedimientos de medición o en su caso los criterios para establecer la presencia o ausencia de las características. Conviene destacar que las definiciones deben ser operacionales y no conceptuales, pues, por ejemplo, si una de las variables es obesidad, la definición de que un animal obeso es aquel que tiene un evidente exceso de peso Al que podría considerarse como normal para su estatura, sexo y edad, no establece que procedimientos deben seguirse para calificar al animal como obeso, los cual podría realizarse en términos de que exceda en cierta proporción al peso proporcionado en una tabla o que la piel rebase cierta medida en cierta parte del organismo. Lo anterior implica que hay que describir la técnica para medir, ya sea peso, estatura, numero de células; para identificar desarrollo de colonias; para establecer la presencia de padecimientos; para identificar preferencias; para conocer puntos de vista, ETC.

58 Selección del diseño. En el caso de una investigación observacional descriptiva (aquella en la cual se busca obtener información relevante y precisa sobre una situación existente) ocurre que a veces la cobertura es total o sea que se incluye a todo el universo, como en el caso de los censos; pero en otras ocasiones solo se estudio un subconjunto, y los resultados obtenidos se generalizan a todo el universo. En esta situación hay necesidad de utilizar la parte de la estadística que se refiere a los problemas de estimación

59 En la investigación observacional analítica (aquella cuyo objetivo es establecer el tipo de asociación que pudiera existir entre dos mas características cuya presencia o ausencia en los elementos de los grupos es ajena a la voluntad del investigador). Y en la experimental (por medio de la cual se analizan los efectos de la exposición o privación intencionada de un factor bien definido en parte de los elementos del conjunto en estudio), el estudio de subconjuntos para generalizar a todo el universo es una necesidad, y los problemas que con tal proceder se generen pueden ser resueltos con la parte de la estadística que se refiere a las pruebas de hipótesis.

60 Procedimientos de captación de la información.Decididos los datos necesarios debe determinarse cuáles de ellos ya han sido obtenidos, por otro investigador o por otra institución, con las especificaciones requeridas y finalmente establecer para los datos faltantes los mecanismos de captación, que puedan consistir en que el individuo estudiado llene un cuestionario o que un miembro del personal del equipo investigador obtenga la información necesaria; en cualquier caso, habrá que considerar el diseño de un formulario.

61 Procedimientos de elaboración y análisis de la información.Para garantizar, en los posible que todo el tratamiento de los datos se realizara sin tropiezos es conveniente considerar con anticipación a la captación de los datos cual va a ser el proceso de elaboración de la información, ya que esto puede sugerir la inclusión de un nuevo dato o una manera particular de distribución de los datos en el formulario para facilitar la codificación o la perforación de tarjetas, en el caso en que se decide utilizar la computación electrónica, o establecer alguna actividad de control de calidad de la información del terreno.

62 Programación y conducción de la investigación Todas las actividades de campo y de oficina deben ser consideradas en su conjunto, permitiendo así establecer la organización detallada de la investigación definiendo las diversas unidades administrativas, las relaciones entre ellas, los procedimientos de trabajo y los recursos necesarios. Entre otras cosas, conviene destacar la importancia de la elaboración del calendario de actividades, de itinerarios cuando sean necesarios, la descripción del flujo de unidades de observación, las precauciones que deben ser tomadas en la aplicación de ciertas técnicas de medición, las medidas que deben tomarse en las situaciones de emergencia que puedan ser anticipadas y particularmente , la forma en que deben ser identificados los elementos del conjunto que sean incluidos como unidades de observación, y en su caso, la forma en que ellos deban ser asignadas a los diferentes tratamientos.

63 Informe de investigaciónConviene esbozar el contenido con que deberá contar el informe. Esto debe incluir la elaboración de un título que explique claramente el contenido del informe, y cuando sea necesario, un subtitulo; una introducción que enuncie el propósito, tópicos y objetivos del estudio, incluyendo donde y cuando se realizo; los elementos estudiados y los métodos; los hallazgos en forma textual concisa o en forma tabular y gráfica cuando sea necesario; discusión de los resultados; el resumen y finalmente los apéndices.

64 En los apéndices, además de incluir cuadros, definiciones, bibliografías y descripciones de técnicas de medición, se puede agregar un apéndice técnico de circulación restringida en el cual se hagan derivaciones de fórmulas y se den otros resultados de interés, no tanto para los usuarios de esos hallazgos sino para los que necesiten conocer más el proceso de la investigación.

65 EJECUCIÓN Poco puede decirse de la ejecución o desarrollo de investigación en general, pues las características de estas quedan determinadas por el tópico, los recursos y la institución que las vaya a realizar; en esta etapa deberá realizarse todo lo planeado en la etapa anterior. EVALUACIÓN De toda inversión debe obtenerse cierto rendimiento y la que se hace en investigación no debe ser una excepción, por lo que durante el desarrollo debe irse captando información que permita decidir si se está obteniendo un rendimiento razonable de los recursos, y al final de la investigación deberá establecerse no solo en que medida se lograron los objetivos de la investigación, si no que, comparando el rendimiento de cada uno de los recursos con el que habitualmente debía esperarse, decidir si fue satisfactorio o no y, por último, establecer si la inversión global quedó justificada con los hallazgos finales.

66 Por lo que se ha dicho de la investigación en general y tomando en cuenta la definición que se dio de estadística, ya deberá resultar evidente que el papel que esta juega en la primera es muy importante en cada una de sus etapas. Para concluir, la investigación ha de ser un trabajo de equipo, y cuando concurran en una misma persona los dos papeles, el de investigador y el de estadístico, conviene que toda la investigación se discuta con otro investigador o con otro estadístico para no pasar por alto aspectos relevantes.

67 RECOLECCIÓN Y ORGANIZACIÓN DE DATOSENCUESTAS: Instrumento cuantitativo de investigación social mediante la consulta a un grupo de personas elegidas de forma estadística, realizada con ayuda de un cuestionario. En poblaciones pequeñas (por ejemplo, los trabajadores de una empresa) se pueden realizar encuestas censales, es decir, a todos los individuos de un colectivo, pero normalmente las encuestas se realizan mediante muestras estadísticamente representativas de una población mayor, para posteriormente extrapolar los resultados al conjunto de la población. La encuesta se diferencia de otros métodos de investigación en que la información obtenida ya está de antemano preparada y estructurada. En este sentido, la encuesta presenta notables limitaciones, al restringir las posibilidades de obtener información a validar o refutar hipótesis previamente establecidas en el cuestionario, coartando el discurso del entrevistado, y sin que resulte posible saber si existe información relevante que no se tiene en cuenta. Además, al tratarse de entrevistas individuales, se pierde la riqueza de fenómenos que resultan de la interacción social.

68 Según la forma en que se obtienen los datos, las encuestas pueden ser presenciales, telefónicas o postales. Las encuestas presenciales administradas por encuestadores cualificados son las más fiables, exhaustivas y, también, costosas. Por su parte, las encuestas telefónicas permiten una gran rapidez en la obtención de los datos a un bajo coste, pero presentan limitaciones respecto a la duración de la entrevista y un riesgo mayor de sesgo muestral.

69 Los sesgos son precisamente el principal problema a controlar en la realización de una encuesta; pueden provenir de errores muestrales, que dan como resultado una mayor presencia de un grupo de individuos con determinadas características, y/o de la mayor o menor accesibilidad a la entrevista de determinados grupos de personas. También se pueden producir por errores en el cuestionario, que o bien inducen determinadas respuestas, o no tienen en cuenta todas las opciones posibles de los entrevistados. Y, finalmente, pueden aparecer sesgos en el tratamiento estadístico, al establecer las variables a utilizar y al agrupar los datos o los individuos en determinadas categorías

70 En cualquier caso, la utilización masiva de las encuestas en procesos de toma de decisiones, tanto en el ámbito publico como privado, ha supuesto una progresiva sistematización de los procesos de trabajo en este tipo de estudios y la creación de normas metodológicas y códigos deontológicos que tratan de asegurar su calidad y consistencia.

71 ENCUESTA ESTADÍSTICA DE ESTATURA DE ALUMNOS DE Ude M NOMBRE_____________________________________ EDAD______________ SEXO______________ CARRERA__________________________________ SEMESTRE_________ PASATIEMPO_______________________________________________________ QUE TIPO DE EJERCICIO REALIZAS___________________________________ ____________________________________________________________________ PESO____________Kgs. ESTATURA____________Mts. FIRMA DEL ENCUESTADO____________________________________________ NOMBRE DEL ENCUESTADOR_________________________________________ FIRMA DEL ENCUESTADOR____________________________________________

72 TABLAS ESTADÍSTICAS Las tablas estadísticas son recopilaciones numéricas bien estructuradas y fáciles de interpretar de las que se vale el estadístico para sintetizar los datos obtenidos con el fin de hacer un uso sencillo de ellos o bien para darlos a conocer de forma comprensible. Existen infinidad de tablas estadísticas, pero las más básicas son las tablas de frecuencias, las de frecuencias relativas y frecuencias acumuladas, las de frecuencias con datos agrupados en intervalos y las de doble entrada. TABLAS DE FRECUENCIAS Estas tablas constan de dos columnas. En la primera se escriben los valores de la variable, xi. En la segunda las correspondientes frecuencias, fi. Estas sencillas tablas se utilizan, únicamente, cuando la variable es discreta y admite pocos valores (a lo sumo, de 12 a 16). La tabla siguiente da la distribución de la variable “número de hijos” correspondiente a un conjunto de 43 familias:

73

74 TABLAS DE FRECUENCIAS RELATIVAS Y FRECUENCIAS ACUMULADAS Una tabla de frecuencias se puede ampliar con nuevas columnas con las frecuencias relativas y las frecuencias acumuladas. La tabla anterior con estos nuevos datos sería:

75

76 TABLAS DE FRECUENCIAS CON DATOS AGRUPADOS EN INTERVALOSCuando la variable es continua, o es discreta pero toma una gran cantidad de valores, conviene dividir el rango de la variable en unos pocos intervalos (entre 6 y 12) y repartir los valores en ellos. El resultado será una tabla de frecuencias en la cual la variable, en lugar de tomar valores numéricos concretos, varía dentro de intervalos. Cuando se necesita (por ejemplo para el cálculo de parámetros) que cada intervalo quede representado por un único número, se toma su punto medio, al que se llama marca de clase. En la tabla adjunta se muestra cómo se han repartido calificaciones entre 0 y 10, en 10 intervalos iguales —columna (a). Las marcas de clase (centros de los intervalos) están en la columna (b), las frecuencias en la (c), las frecuencias relativas en la (d), las frecuencias acumuladas en la (e) y las frecuencias acumuladas relativas en la columna (f).

77 FRECUENCIA CUMULADA RELATIVAINTERVALO (b) MARCA DE CLASES (c) FRECUENCIA (d) FECUENCIA RELATIVA (e) FRECUENCIA ACUMULADA (f) FRECUENCIA CUMULADA RELATIVA 0-1 0.5 20 0.017 1-2 1.5 15 0.012 35 0.029 2-3 2.5 18 0.015 53 0.044 3-4 3.5 25 0.021 78 0.065 4-5 4.5 44 0.037 122 0.102 5-6 5.5 88 0.073 210 0.175 6-7 6.5 222 0.185 432 0.360 7-8 7.5 335 0.279 767 0.639 8-9 8.5 218 0.182 985 0.821 9-10 9.5 215 0.179 1200 100

78 TABLAS DE DOBLE ENTRADAEn las distribuciones bidimensionales, en las que a cada individuo le corresponden dos valores, xi, yi, puede suceder que cada par de valores (xm, yn) ocurra varias veces, es decir, lleve apareada una frecuencia. En tal caso conviene disponer los resultados mediante una tabla de doble entrada como la que se muestra a continuación, correspondiente a los resultados de un colectivo de 125 personas puntuadas por su sensibilidad ecológica, xi, y por sus conocimientos de biología, yi:

79 ORGANIZACIÓN DE DATOS

80 TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS:Son tablas que contienen frecuencias absolutas, relativas y acumuladas, maraca de clases y numero de clases. Son muy útiles para describir el comportamiento de una sola variable. TABLAS DE CONTINGENCIA: Son muy útiles cuando se desea examinar o comparar dos o más variables

81 CLASES DE FRECUENCIAS FRECUENCIAEl número de veces que ocurre un cierto suceso. Número de elementos comprendidos dentro de un intervalo en una distribución determinada. Es un numero que nos indica las veces que un dato esta repetido. En una tabla de frecuencias, nos indica la cantidad de datos que están comprendidos en un intervalo de clase. Es el número de datos o elementos de la muestra, que caen en un mismo intervalo de clase. Es decir, que sus valores quedan totalmente comprendidos dentro de los linderos de ese mismo intervalo.

82 FRECUENCIA ABSOLUTA (ni):Consiste en la proporción de veces que ocurre dicho suceso con relación al número de veces que podría haber ocurrido. Puede definirse como el número de veces que se repite cada valor o modalidad de la variable o atributo. El número de veces que se observa un mismo ítem (Los datos de una misma magnitud o clase), o la cantidad d datos que caen en un mismo intervalo. La suma de las frecuencias absolutas es igual al tamaño de la población o la muestra.

83 FRECUENCIA RELATIVA (hi):Es la frecuencia absoluta dividida por el número de casos, es decir la muestra o la población. Es la relación geométrica entre la frecuencia absoluta y el total de datos. O sea, el cociente de dividir el número de veces que aparece un dato de un intervalo, entre la totalidad de los datos que conforman la muestra de que se trate. La suma de las frecuencias relativas es igual a la unidad. Por ejemplo, si una experiencia aleatoria se repite 80 veces y un cierto suceso, S, ocurre 36 veces, decimos que su frecuencia ha sido 36, y su frecuencia relativa 36/80 = 0,45: f(S) = 36 fr(S) =36/80 = 0,45 La frecuencia relativa también se expresa, en ocasiones, en tantos por ciento (45%).

84 FRECUENCIAS ACUMULADAS (Ni, Hi)La frecuencia acumulada de una observación de la variable es la suma de las frecuencias correspondientes a los valores menores o anteriores a dicho valor. Es la suma de las frecuencias de un intervalo de clase, con todas las frecuencias de los intervalos que le preceden. Hay dos frecuencias acumuladas que son: Frecuencia absoluta acumulada (Ni) Frecuencia relativa acumulada (Hi) Frecuencia acumulada absoluta Es la acumulación o suma de todas las frecuencias absolutas hasta el intervalo de clase considerado, inclusive.

85 Frecuencia acumulada relativaViene a ser la acumulación de todas las frecuencias relativas hasta el mismo intervalo considerado, inclusive. En una tabla de frecuencias, cuando la variable es cuantitativa y, por tanto, los distintos valores de la tabla aparecen ordenados de menor a mayor, se llama frecuencia acumulada de un valor de la variable a la suma de su frecuencia con las frecuencias de los valores anteriores. Por ejemplo, si al lanzar un dado 100 veces se obtienen los siguientes resultados: f(1) = 16 f(2) = 13 f(3) = 21 f(4) = 19 f(5) = 14 f(6) = 17

86 las frecuencias acumuladas son:fa(1) = 16 fa(2) = = 29 fa(3) = = 50 fa(4) = = 69 fa(5) = = 83 fa(6) = = 100 Estos resultados se aprecian mejor en una tabla:

87

88 Las frecuencias relativas acumuladas son las frecuencias acumuladas divididas por el número total de individuos. EJEMPLO: Supóngase que treinta empleados de acuerdo con el rendimiento al trabajo durante una semana fueron calificados así: A= Excelente B= Bueno C= Aceptable D= Regular F=Deficiente

89 Los resultados fueron: C - B - C - A - F - A - D - B - D - C - A - B - F - D - C - A -B - D - C - C -B - A - A - C - B - F - A - D - D – F HALLAR: Las frecuencias (ni), (hi), (Ni), (Hi). ENDIMIENTO TABULACIÓN ni hi Ni Hi A /////// 7 0.233 B ////// 6 0.20 13 0.433 C 20 0.666 D 26 0.866 F //// 4 0.133 30 0.999

90 Los datos se pueden ordenar dividiéndolos en clases y registrando el número de observaciones en cada clase. CLASES Es un intervalo que contiene un límite inferior y un límite superior. NUMERO DE CLASES En una tabla de distribución de frecuencias se puede utilizar la siguiente formula para aproximar el número de clase a utiliza

91 n = Número de la observaciónLos datos se pueden ordenar dividiéndolos en clases y registrando el número de observaciones en cada clase. CLASES Es un intervalo que contiene un límite inferior y un límite superior. NUMERO DE CLASES En una tabla de distribución de frecuencias se puede utilizar la siguiente formula para aproximar el número de clase a utilizar. nº C= 2C " n n = Número de la observación c = Número de clases El número de clases es la menor potencia a la que se eleva el 2, de tal manera que el resultado será igual o mayor al número de observaciones.

92 INTERVALO DE CLASES (IC)Es el rango de valores encontrados dentro de una clase. IC = valor mayor - valor menor IC = v> - v< Número deseado de clases c

93

94

95

96

97

98

99

100

101

102

103

104

105

106

107 MEDIDAS DE POSICIÓN CENTRALLas medidas de tendencia central (o de centralización) son medidas que tienden a localizar en qué punto se encuentra la parte central de un conjunto ordenado de datos de una variable cuantitativa. Media Definimos media (también llamada promedio o media aritmética) de un conjunto de datos (X1,X2,…,XN) al valor característico de una serie de datos resultado de la suma de todas las observaciones dividido por el número total de datos.

108

109 Visto desde un punto de vista más conceptual, la media aritmética es el centro de los datos en el sentido numérico, ya que intenta equilibrarlos por exceso y por defecto. Es decir, si sumamos todas las diferencias de los datos a la media da cero. l

110 Ejemplo Tenemos las edades de los once jugadores de un equipo de fútbol y queremos calcular sumedia. Para ello, sumamos todas las edades y las dividimos por el número total de elementos, o sea once jugadores.

111 Media a partir de las frecuencias relativasEn un conjunto de datos discretos, podemos calcular la media aritmética a partir de lasfrecuencias relativas de las observaciones distintas. El sumatorio está extendido a las observaciones diferentes de los datos.

112 MUESTREO En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de una población), se selecciona una muestra, entendiendo por tal una parte representativa de la población. El muestreo es por lo tanto una herramienta de la investigación científica, cuya función básica es determinar que parte de una población debe examinarse, con la finalidad de hacer inferencias sobre dicha población.

113 Mediana La mediana (Me(X)) es el elemento de un conjunto de datos ordenados (X1,X2,…,XN) que deja a izquierda y derecha la mitad de valores. Si el conjunto de datos no está ordenado, la mediana es el valor del conjunto tal que el 50% de los elementos son menores o iguales y el otro 50% mayores o iguales.

114 Cálculo de la mediana Sea (X1,X2,…,XN) un conjunto de datos ordenado. El cálculo de la mediana depende de si el número de elementos N es par o impar. Si N es impar, la mediana es el valor que está al medio, es decir:

115 Si N es par, la mediana es la media de los dos valores del centro, N/2 y N/2+1Ejemplo Suponemos que tenemos una muestra con las edades de los once jugadores de un equipo de fútbol.

116 Como el número de elementos del conjunto es impar, la mediana es el sujeto número 6, que se encuentra en el medio del conjunto. Por lo tanto Mediana(X)=26. Para calcular la mediana necesitaríamos ordenar los elementos de menor a mayor y ver cual es el elemento que deja a izquierda y derecha el mismo número de elementos.

117 Moda La moda (Mo(X)) es el valor más repetido del conjunto de datos, es decir, el valor cuya frecuencia relativa es mayor. En un conjunto puede haber más de una moda. Ejemplo Tenemos una muestra de las once edades de los jugadores de un equipo de fútbol.

118 Hacemos recuento del elemento que más se repite en el conjunto.La edad que más se repite es 26, por lo que la moda del conjunto es 26.

119 Media geométrica La media geométrica (MG) de un conjunto de números estrictamente positivos (X1, X2,…,XN) es la raíz N-ésima del producto de los N elementos. Todos los elementos del conjunto tienen que ser mayores que cero. Si algún elemento fuese cero (Xi=0), entonces la MG sería 0 aunque todos los demás valores estuviesen alejados del cero.

120 La media geométrica es útil para calcular medias de porcentajes, tantos por uno, puntuaciones o índices. Tiene la ventaja de que no es tan sensible como la media a los valores extremos.

121 Ejemplo En una empresa quieren saber la proporción media de mujeres en los diferentes departamentos. Para ello, se recoge el porcentaje de mujeres en los cinco principales departamentos.

122 Como es la media de porcentajes, calculamos la media geométrica que es más representativa.

123 Relación entre medias Existe una relación de orden entre cuatro tipos de media. En esta relación se excluye la media ponderada porque depende de los pesos. Sean: H la media armónica MG la media geométrica x la media aritmética RMS la media cuadrática Entonces:

124 Media ponderada La media ponderada (MP) es una medida de centralización. Consiste en otorgar a cada observación del conjunto de datos (X1,X2,…,XN) unos pesos (p1,p2,…,pN) según la importancia de cada elemento.

125 uanto más grande sea el peso de un elemento, más importante se considera que es éste.La media ponderada tiene numerosas aplicaciones, por ejemplo, la nota de una asignaturadonde el examen final tiene un peso mayor al de un trabajo. O en el cálculo del IPC (Índice de Precios de Consumo). El IPC es un indicador de los precios de los bienes y servicios básicos que consume la población. Para calcularlo, se otorga pesos a los diferentes bienes (pan, fruta, vivienda,…) y se calcula la media ponderada. La media aritmética es un caso particular de media ponderada, en la que todos los pesos son uno, ya que a todos los elementos se les otorga la misma importancia.

126 Ejemplo La nota final de una asignatura es una media ponderada de las notas que han obtenido los alumnos en los cuatro elementos evaluables que determina el profesor. El responsable de la asignatura otorga un peso de 3 al examen inicial, de 1 al trabajo entregable, 2 al trabajo final y 4 al examen final. Las notas de un alumno han sido las siguientes:

127 Se hace la suma de los productos de las notas por el peso de cada nota y se divide por la suma de los pesos. La nota final del alumno en esta asignatura es de 6,14. Se puede ver en el siguiente gráfico como la nota es muy próxima a las notas sacadas en los exámenes. Esto es a causa de que los exámenes eran más importantes y tenían unos pesos mucho mayores que los de los trabajos.

128

129 Media armónica La media armónica (H) de un conjunto de elementos no nulos (X1, X2,…,XN) es el recíproco de la suma de los recíprocos (donde 1/Xi es el recíproco de Xi)) multiplicado por el número de elementos del conjunto (N).

130 La media armónica es la recíproca de la media aritméticaLa media armónica es la recíproca de la media aritmética. Los elementos del conjunto deben ser necesariamente no nulos. Esta media es poco sensible a los valores grandes, pero muy sensible a los valores próximos a cero, ya que los recíprocos 1/Xi son muy altos. La media armónica no tiene un uso muy extenso en el mundo científico. Suele utilizarse principalmente para calcular la media de velocidades, tiempos o en electrónica.

131 Ejemplo Un tren realiza un trayecto de 400km. La vía tiene en mal estado que no permitían correr. Los primeros 100 km los recorre a 120km/h, los siguientes 100km la vía está en mal estado y va a 20km/h, los terceros a 100km/h y los 100 últimos a 130km/h. Para calcular el promedio de velocidades, calculamos la media armónica.

132 La media armónica es de H=52,61km/h.

133 Media cuadrática La media cuadrática o RMS (Root Mean Square) de un conjunto de valores (X1, X2,…,XN) es una medida de posición central. Esta se define como la raíz cuadrada del promedio de los elementos al cuadrado.

134

135 La media cuadrática es muy útil para calcular la media de variables que toman valores negativos y positivos. Se suele utilizar cuando el símbolo de la variable no es importante y lo que interesa es el valor absoluto del elemento. Por ejemplo, para calcular la media de errores de medida. Una aplicación clásica es la determinación del valor eficaz de un parámetro sinusoidal en electricidad, en corriente alterna (tensión en voltios o intensidad en amperios)

136 Ejemplo Un profesor pide a sus alumnos que realicen un experimento en el laboratorio. Espera que los alumnos obtengan 5 litros de ácido clorhídrico. Anota en una tabla una columna con las cantidades de ácido obtenidos por cada alumno y en la otra el error por falta o exceso de la cantidad esperada, de la siguiente manera:

137 Se representa gráficamente los errores de los seis alumnos.

138 Al profesor no le importa si el error se produjo por falta o por exceso, sino la cantidad de ácido de diferencia respecto a la esperada. Para ello, utiliza la media cuadrática:

139 La media cuadrática es RMS=0,76.

140 MEDIDAS DE POSICIÓN NO CENTRAL ANUNCIOSLas medidas de tendencia no central permiten conocer puntos característicos de una serie de valores, que no necesariamente tienen que ser centrales. La intención de estas medidas es dividir el conjunto de observaciones en grupos con el mismo número de valores.

141 Cuartiles Los cuartiles son los tres valores que dividen una serie de datos ordenada en cuatro porciones iguales. El primer cuartil (Q1) deja a la izquierda el 25% de los datos. El segundo (Q2) deja a izquierda y derecha el 50% y coincide con la mediana. El tercero (Q3) deja a la derecha el 25% de valores. Los tres cuantiles son:

142 Distinguimos los casos en que los datos están agrupados en frecuencias y los que no lo están. Los datos también pueden estar agrupados en intervalos de valores. Vayamos a datos no agrupados. Para el Q1 y Q3 hallaremos su posición mediante los siguientes pasos: (N+1)/4 y 3(N+1)/4 pueden resultar números decimales. Por ejemplo, si el conjunto de datos es de 20 elementos, N=20, tendremos que el sujeto del primer cuartil es el (N+1)/4=(20+1)/4=21/4=5,25. ¿Qué hacemos en el caso de que nos de un número decimal?

143 Diferenciaremos dos casos:Sin parte decimal: elegimos ese mismo sujeto. Por ejemplo, si el conjunto tiene 19 elementos, (N+1)/4=(19+1)/4=20/4=5, por lo que el primer cuartil será Q1=X5. Con parte decimal: supongamos que el elemento es un número con parte decimal entre el sujeto i y el i+1. Sea un número de la forma i,d donde i es la parte entera y d la decimal. El cuartil será:

144 Podéis ver un ejemplo práctico en el siguiente apartado.El cálculo del segundo cuartil depende de si el número de sujetos N es par o impar. Al ser la mediana, se utiliza el procedimiento de cálculo de la mediana.

145 Ejemplo Sea un conjunto de la edad de los veinte integrantes (N=20) de un club. Supongamos que el conjunto está ordenado:

146 Primer cuartil El primer cuartil será el sujeto (N+1)/4=21/4=5,25. Como es decimal, el cuartil será un número entre el X5=28 y X6=29. El número decimal es el 5,25, por lo que i=5 y d=0,25. El cuartil 1 es:

147 Segundo cuartil El segundo cuartil es la mediana. Al ser un conjunto con un número par de elementos, el cuartil es la media de los sujetos N/2=20/2=10 y N/2+1=20/2+1=11.

148 Es decir, será la media de X10=34 y X6=37.

149 Tercer cuartil El tercer cuartil es el sujeto 3(N+1)/4=63/4=15,75Tercer cuartil El tercer cuartil es el sujeto 3(N+1)/4=63/4=15,75. Como el número es decimal, el cuartil estará entre X15=52 y X16=53.

150 El número decimal es el 15,75, por lo que i=15 y d=0,75El número decimal es el 15,75, por lo que i=15 y d=0,75. El cuartil 3 es:

151 PERCENTILES El percentil es una medida de posición no central. Los percentiles Pi son los 99 puntos que dividen una serie de datos ordenada en 100 partes iguales, es decir, que contienen el mismo número de elementos cada una. El percentil 50 es la mediana. Sea (X1, X2,…,XN) una muestra de N elementos. El percentil Pi es:

152 Los percentiles están pensados para conjuntos de elementos de más de cien elementos.Una aplicación muy conocida de los percentiles son las tablas de crecimiento de los niños, en las que se ubica el peso y la talla de un determinado niño dentro de su grupo de edad.

153 MEDIDAS DE DISPERSIÓN Las medidas de dispersión o medidas de variabilidad muestran la variabilidad de un conjunto de datos, indicando la mayor o menor concentración de datos respecto a las medias de centralización. Rango El rango (R) o recorrido estadístico es la diferencia entre el valor máximo y el mínimo de un conjunto de elementos.

154 Ejemplo Supongamos que deseamos calcular el rango de las edades del once inicial de un equipo de fútbol. El jugador más mayor (máximo del conjunto) tiene 31 años, mientras que el más joven (mínimo) 18. Por lo tanto el rango es:

155 Rango intercuartílico El rango intercuartílico (IQR) (o rango intercuartil) es una estimación estadística de la dispersión de una distribución de datos. Consiste en la diferencia entre el tercer y el primer cuartil. Mediante esta medida se eliminan los valores extremadamente alejados. El rango intercuartílico es altamente recomendable cuando la medida de tendencia central utilizada es la mediana (ya que este estadístico es insensible a posibles irregularidades en los extremos) Con el IQR podremos elaborar los diagramas de caja, que es un instrumento muy visual para evaluar la dispersión de una distribución.

156 Ejemplo Sea un conjunto ordenado de las edades de los veinte sujetos (N=20) de un club.

157 Para calcular el rango intercuartílico, tendremos que calcular el primer y el tercer cuartil (Q1 y Q3). Primer cuartil El primer cuartil será el sujeto (N+1)/4=21/4=5,25. Como es decimal, será un número entre el X5=28 y X6=29.

158 El número decimal es el 5,25, por lo que i=5 y d=0,25. El cuartil 1 es:

159 Tercer cuartil El tercer cuartil es el sujeto 3(N+1)/4=63/4=15,75. Como el número es decimal, el cuartil estará entre X15=52 y X16=53.

160 El número decimal es el 15,75, por lo que i=15 y d=0,75El número decimal es el 15,75, por lo que i=15 y d=0,75. El cuartil 3 es:

161 Rango intercuartílicoUna vez hemos calculado en primer y tercer cuartil, ya podemos calcular el rango intercuartílico.

162 VARIANZA La varianza (S2) mide la dispersión de los datos de una muestra (X1,X2,…,XN) respecto a la media (x), calculando la media de los cuadrados de las distancias de todos los datos.

163 Al elevar las diferencias al cuadrado se garantiza que las diferencias absolutas respecto a la media no se anulan entre si. Además, resaltan los valores alejados. Siempre se cumple que la varianza es mayor o igual que cero (S2 ≥ 0). La varianza es cero cuando todos los datos son el mismo (ejemplo: {1,1,1,1,1}). Si en vez de tratarse de una muestra, la varianza se refiere a la población, el denominador será N.

164

165 Ejemplo Un médico de un instituto quiere realizar un estudio para ver si los alumnos de un centro tienen sobrepeso. Le interesaría calcular la varianza para ver como difieren los pesos respecto a la media. Para ello, se selecciona una muestra de doce alumnos de 14 o 15 años.

166 e calcula la media de los pesos de los alumnos, y se obtiene que x = 53,5kg.Una vez se sabe la media, se halla la diferencia de cada elemento respecto a esta, para calcular la dispersión de los datos.

167

168 Una vez se ha calculado el cuadrado de la diferencia de cada elemento con la media, ya se puede determinar la varianza (S2): El valor alto de la varianza confirma una de sus características: que es sensible a los valores que se separan bastante de la media. A continación se puede observar un gráfico de las diferencias del peso de cada alumno respecto a la media:

169

170 DESVIACIÓN TÍPICA La desviación típica es la medida de dispersión (S) asociada a la media. Mide el promedio de las desviaciones de los datos de una muestra (X1,X2,…,XN) de la media (x) en las mismas unidades de los datos. Dicho de otra forma, es un indicador de cómo tienden a estar agrupados los datos respecto a la media.

171 El cuadrado de la desviación típica es la varianza.Cuando se trata de la desviación típica de una población, el denominador es N. Si se trata de una muestra, serà N-1.

172

173 COEFICIENTE DE VARIACIÓN DE PEARSONEl coeficiente de variación de Pearson (r) mide la variación de los datos respecto a la media, sin tener en cuenta las unidades en la que están.

174 El coeficiente de variación toma valores entre 0 y 1El coeficiente de variación toma valores entre 0 y 1. Si el coeficiente es próximo al 0, significa que existe poca variabilidad en los datos y es una muestra muy compacta. En cambio, si tienden a 1 es una muestra muy dispersa. Para interpretar fácilmente el coeficiente, podemos multiplicarlo por cien para tenerlo en tanto por cien.

175 ASIMETRÍA Y CURTOSIS La asimetría y curtosis informan sobre la forma de la distribución de una variable. Estas medidas permiten saber las características de su asimetría y homgeneidad sin necesidad de representarlos gráficamente. Asimetría La asimetría es la medida que indica la simetría de la distribución de una variable respecto a la media aritmética, sin necesidad de hacer la representación gráfica. Los coeficientes de asimetría indican si hay el mismo número de elementos a izquierda y derecha de la media.

176 Existen tres tipos de curva de distribución según su asimetría:Asimetría negativa: la cola de la distribución se alarga para valores inferiores a la media. Simétrica: hay el mismo número de elementos a izquierda y derecha de la media. En este caso, coinciden la media, la mediana y la moda. La distribución se adapta a la forma de la campana de Gauss, o distribución normal. Asimetría positiva: la cola de la distribución se alarga para valores superiores a la media.

177

178 Existen tres coeficientes de asimetría:Coeficiente de asimetría de Fisher El coeficiente de asimetría de Fisher CAF evalúa la proximidad de los datos a su media x. Cuanto mayor sea la suma ∑(xi–x)3, mayor será la asimetría. Sea el conjunto X=(x1, x2,…, xN), entonces la fórmula de la asimetría de Fisher es:

179

180 Si CAF<0: la distribución tiene una asimetría negativa y se alarga a valores menores que la media. Si CAF=0: la distribución es simétrica. Si CAF>0: la distribución tiene una asimetría positiva y se alarga a valores mayores que la media.

181

182 Existen tres coeficientes de asimetría:Coeficiente de asimetría de Pearson El coeficiente de asimetría de Pearson CAP mide la diferencia entre la media y la moda respecto a la dispersión del conjunto X=(x1, x2,…, xN). Este procedimiento, menos usado, lo emplearemos solamente en distribuciones unimodales y poco asimétricas.

183

184 Si CAP<0: la distribución tiene una asimetría negativa, puesto que la media es menor que la moda.Si CAP=0: la distribución es simétrica. Si CAP>0: la distribución tiene una asimetría positiva, ya que la media es mayor que la moda.

185

186 Coeficiente de asimetría de BowleyEl coeficiente de asimetría de Bowley CAB toma como referencia los cuartiles para determinar si la distribución es simétrica o no. Para aplicar este coeficiente, se supone que el comportamiento de la distribución en los extremos es similar. Sea el conjunto X=(x1, x2,…, xN), la asimetría de Bowley es:

187 Esta fórmula viene de:

188 Recordemos que la mediana (Me) es lo mismo que el segundo cuartil (Q2).Si CAB<0: la distribución tiene una asimetría negativa, puesto que la distancia de la mediana al primer cuartil es menor que al tercero. Si CAB=0: la distribución es simétrica, ya que el primer y tercer cuartil están a la misma distancia de la mediana. Si CAB>0: la distribución tiene una asimetría positiva, ya que la distancia de la mediana al tercer cuartil es mayor que al primero.

189

190 Curtosis La curtosis (o apuntamiento) es una medida de forma que mide cuán escarpada o achatada está una curva o distribución. Este coeficiente indica la cantidad de datos que hay cercanos a la media, de manera que a mayor grado de curtosis, más escarpada (o apuntada) será la forma de la curva.

191 La muestra debe lograr una representación adecuada de la población, en la que se reproduzca de la mejor manera los rasgos esenciales de dicha población que son importantes para la investigación. Para que una muestra sea representativa, y por lo tanto útil, debe de reflejar las similitudes y diferencias encontradas en la población, es decir ejemplificar las características de ésta

192

193 La curtosis se mide promediando la cuarta potencia de la diferencia entre cada elemento del conjunto y la media, dividido entre la desviación típica elevado también a la cuarta potencia. Sea el conjunto X=(x1, x2,…, xN), entonces el coeficiente de curtosis será:

194 Los errores más comunes que se pueden cometer son: 1Los errores más comunes que se pueden cometer son: 1.- Hacer conclusiones muy generales a partir de la observación de sólo una parte de la Población, se denomina error de muestreo. 2.- Hacer conclusiones hacia una Población mucho más grandes de la que originalmente se tomo la muestra. Error de Inferencia. En la estadística se usa la palabra población para referirse no sólo a personas si no a todos los elementos que han sido escogidos para su estudio y el término muestra se usa para describir una porción escogida de la población.

195