1 Contenido General MÉTODOS ESTADÍSTICOS 1 Introducción a ProbabilidadDistribuciones discretas Distribuciones continuas 2 Muestreo y Estimación Puntual Estimación por intervalos Prueba de hipótesis 3 Regresión Componentes principales Clusters (Conglomerados)
2 Revisión de los Conceptos Básicos de ProbabilidadTema 1
3 Contenido programáticoEspacio muestral y axiomas de probabilidad Probabilidad condicional e independencia Variables aleatorias discretas y continuas Medidas de tendencia central y dispersión Principales distribuciones discretas y continuas Variables aleatorias bidimensionales
4 Términos básicos Experimento: es el proceso de obtener una observaciónEventos Simples: Cualquier resultado básico de un experimento. Un evento simple no se puede descomponer en resultados más simples. Ej.: ¿Cuál sería un evento simple asociado al lanzamiento de un dado? ¿Cuál al lanzamiento de dos dados? En la mia se inicia por espacio muestral, como está aquí se habla de el e. muestral sin definirlo. Cambiar.el orden.
5 Términos básicos Espacio Muestral: Es la colección de todos los eventos simples de un experimento. Ej.: ¿Cuál sería el espacio muestral asociado al lanzamiento de un dado? ¿Cuál al lanzamiento de dos dados? Evento: Conjunto de eventos simples. Subconjunto del espacio muestral. ¿Cuál sería un ejemplo de un evento no-simple del experimento ‘lanzar un dado’?
6 Términos básicos Espacio Muestral: Es la colección de todos los eventos simples de un experimento. Ej.: ¿Cuál sería el espacio muestral asociado al lanzamiento de un dado? ¿Cuál al lanzamiento de dos dados? Evento: Conjunto de eventos simples. Subconjunto del espacio muestral. Ej.: Un evento de lanzar un dado puede ser: A : {1,3,5} Donde A sería el evento “obtener un número impar.”
7 Diagramas de Venn Los diagramas de Venn son útiles para representar probabilidades. Ej.: Probabilidad de pertenecer a uno cualquiera de tres conjuntos.
8 Operaciones elementalesUnión El evento Unión (A B) consiste de todos los eventos simples que están contenidos en A o B o en ambos. A B puede ser descrito como que ocurre por lo menos uno de los dos eventos A o B. A B A B
9 Operaciones elementalesIntersección El evento Intersección (A ∩ B) consiste de todos los eventos simples comunes de A y B. A ∩ B puede ser descrito como que ocurren ambos eventos A y B. A ∩ B
10 Operaciones elementalesComplemento El evento A’, llamado complemento de A, consiste de todos los eventos simples que no están en A. A’ significa que el evento A no ocurra. A’ A
11 Eventos Disjuntos Eventos disjuntos: Dos eventos son disjuntos si no pueden ocurrir al mismo tiempo, en otras palabras, ellos no tienen eventos simples en común. A y B son disjuntos si A ∩ B = Ø En el siguiente diagrama de Venn A y B son disjuntos porque su intersección es el conjunto vacío. B y C no son disjuntos. A B C
12 Interpretación frecuentista de ProbabilidadGeneralmente, la probabilidad de un evento puede pensarse como la proporción de veces que se espera que el evento ocurra.
13 Axiomas de la probabilidadPara cada evento A, se asigna la probabilidad del evento tal que: Axioma 1: 0 ≤ P(A) ≤ 1 Axioma 2: P(S ) = 1 Axioma 3: Si A1, A2, A3, ..., An son disjuntos dos a dos: P(A1 A2 A3 ··· An) = P(A1) + P(A2) + P(A3) + … P(An) Caso particular: Dos eventos disjuntos cualesquiera A y B, P(A B ) = P(A) + P(B)
14 Eventos complementariosSi el evento A no ocurre, decimos que su complemento A’ ha ocurrido y viceversa. Las probabilidades de A y A’ estan relacionadas por la fórmula: P(A’) = 1 – P(A) A’ A
15 Regla general de la sumaLa probabilidad de la unión de dos eventos es: P(A B) = P(A) + P(B) - P(A ∩ B) Para 3 conjuntos: P(A B C) = P(A) + P(B) + P(C) - P(A ∩ B) - P(A ∩ C) - P(B ∩ C) + P(A ∩ B ∩ C)
16 Operaciones elementales EjercicioDe los voluntarios que llegan a un banco de sangre, 1 de 3 tiene sangre tipo O+; 1 de 15, tipo O-; 1 de 3, tipo A+; y 2 de 15, tipo A-. Se selecciona al azar el nombre de un donante de los registros del banco. ¿Cuál es la probabilidad de que la persona seleccionada tenga Sangre tipo O+? Sangre tipo O? Sangre tipo A? Sangre que no es del tipo A, ni O?
17 Ejercicio La siguiente tabla muestra un resumen de una encuesta realizada a 500 personas en referencia a su posición frente a la despenalización del aborto: A favor En contra Total Mujeres 200 100 300 Hombres 50 150 250 500 Quitar o cambiar Si aleatoriamente se selecciona una persona de entre las 500, ¿cuál es la probabilidad de que: El encuestado esté a favor de despenalizar el aborto? El encuestado sea hombre y esté en contra de la despenalización del aborto?
18 Ejercicio La siguiente tabla muestra un resumen del análisis realizado a las flechas de un compresor para determinar el grado con que éstas satisfacen ciertos requerimientos: La curvatura cumple con los requerimientos El acabado superficial cumple con los requerimientos Sí No 345 5 12 8 Si se toma una flecha al azar ¿cuál es la probabilidad de que cumpla con los requerimientos de acabado superficial? ¿Cuál es la probabilidad de que la flecha cumpla con los requisitos de acabado y curvatura? ¿Cuál es la probabilidad de que la flecha seleccionada cumpla con los requisitos de acabado o con los de curvatura? ¿Cuál es la probabilidad de que la flecha cumpla con los requisitos de acabado o que no cumpla con los de curvatura?
19 Ejercicio La siguiente tabla muestra un resumen del análisis realizado a las flechas de un compresor para determinar el grado con que éstas satisfacen ciertos requerimientos: La curvatura cumple con los requerimientos El acabado superficial cumple con los requerimientos Sí No 345 5 12 8 Se escoge una flecha y se observa que cumple con los requisitos de curvatura. ¿Cuál es la probabilidad de que la flecha cumpla con los requisitos de acabado?
20 Probabilidad CondicionalSean A y B dos eventos y P(B) > 0. La probabilidad condicional de A con respecto a B es la probabilidad de que ocurra A sabiendo que ocurre B: Hay ocasiones en las que nos interesa alterar nuestra estimación de la probabilidad de un evento cuando poseemos información adicional que podría afectar el resultado. Esta probabilidad modificada se denomina probablidad condicional del evento. (Mendenhall) En ocasiones, el conjunto de todos los resultados posibles puede constituir un subconjunto del conjunto universal. En otras palabras, la población de interés se puede reducir mediante algun subconjunto de condiciones no aplicables a la población total. Cuando se calculan las probabilidades con un subconjunto del conjunto universal como denominador, eñ resultado es una probabilidad condicional.
21 Probabilidad CondicionalEjemplo: Probabilidad de que un test de embarazo dé positivo sabiendo que la persona está embarazada Dos moléculas raras tienden a encontrarse siempre juntas. La probabilidad de que una muestra de aire contenga alguna de las dos moléculas es pequeña. Sin embargo, como éstas tienden a aparecer juntas, el conocimiento de que una de ellas está presente aumenta de manera muy marcada la posibilidad de que la otra también esté presente en la muestra.
22 Probabilidad CondicionalLinda Hay ocasiones en las que nos interesa alterar nuestra estimación de la probabilidad de un evento cuando poseemos información adicional que podría afectar el resultado. Esta probabilidad modificada se denomina probablidad condicional del evento. (Mendenhall) En ocasiones, el conjunto de todos los resultados posibles puede constituir un subconjunto del conjunto universal. En otras palabras, la población de interés se puede reducir mediante algun subconjunto de condiciones no aplicables a la población total. Cuando se calculan las probabilidades con un subconjunto del conjunto universal como denominador, eñ resultado es una probabilidad condicional. Axioma 1: 0 ≤ P(A) ≤ 1 ¿Puede violarse este axioma al aplicar esta fórmula?
23 Eventos independientesDos eventos A y B son independientes si la probabilidad de que ocurra uno no afecta la ocurrencia del otro Luego:
24 Eventos independientesEn un grupo de estudiantes de bachillerato que consta de 60 mujeres y 40 varones, se observa que 24 chicas y 16 muchachos usan lentes. Además, se sabe que si un estudiante es elegido aleatoriamente la probabilidad de que el estudiante use lentes es 40%=0.4 Considerando esto, Calcule la probabilidad de que un estudiante elegido aleatoriamente use lentes dado que es un estudiante varón ¿Puede usted afirmar que ambos eventos son independientes en este grupo?
25 Eventos independientes¿Que los eventos sean independientes significa que los eventos son excluyentes?
26 Encuesta encubierta Se desea determinar el porcentaje de homosexuales en el Zulia. Dado que el ser homosexual no es ampliamente aceptado en la sociedad no podemos hacer preguntas directas, para ello utilizamos ítems del tipo: Es homosexual o es fumador, de manera que la persona conteste con honestidad. Por ejemplo: Si Ud. fuma o es homosexual responda la siguiente pregunta … Es importante que el evento de interés, en este caso ser homosexual, sea relacionado con eventos independientes de él, tales como ser fumador, hacer deporte, etc.
27 Encuesta encubierta P(F) Probabilidad de ser fumador (Conocida)P(H) Probabilidad de ser homosexual (Buscada) F y H son eventos independientes P(F H) = P(F) + P(H) – P(F ∩ H) [Unión] P(F H) = P(F) + P(H) – P(F)*P(H) [F y H Independientes] Despejamos P(H) y resulta:
28 a.- P(A) b.- P(B) c.- P(A U B) d.- P(A|B) e.- P(B|A)La siguiente tabla muestra porcentaje de mujeres adultas desglosadas por estado civil y número de hijos en el pueblo de Macondo : Número de hijos Casadas Solteras Totales 0.30 0.10 0.40 1 0.15 0.05 0.20 2 3 0.06 0.04 4 0.01 5 ó más 0.07 0.03 Total 0.72 0.28 1.00 Suponga que de este conjunto se toma al azar una mujer. Sean A: el evento la mujer tiene cuatro o más hijos y B: el evento estar casada. Hallar: a.- P(A) b.- P(B) c.- P(A U B) d.- P(A|B) e.- P(B|A)
29 Teorema de Probabilidad TotalLa probabilidad de infarto para hipertensos es del 0,3 y para no hipertensos del 0,1. Si la probabilidad de hipertensión en una cierta población es del 25% ¿Cuál es la probabilidad de infarto en esa población? A1 A1 = {ser hipertenso} A2 = {no serlo} (estos sucesos constituyen una partición) B = {padecer infarto} P(B) = ? B A2 Recordemos que:
30 Teorema de Probabilidad TotalA1, A2,…, A6, forman una partición del espacio muestral. A2 A3 A6 B A1 A5 A4
31 Teorema de Bayes. EjercicioCuando los artículos llegan al final de una línea de producción, un supervisor escoge los que deben pasar por una inspección completa; 10% de todos los artículos producidos son defectuosos; 60% de todos los artículos defectuosos y 20% de todos los artículos buenos pasan por una inspección completa. ¿Cuál es la probabilidad de que un artículo sea defectuoso, dado que pasó por una inspección completa? Cambiar por uno que tenga más sentido
32 Teorema de Bayes Por definición de probabilidad condicional se tiene:Hacer notar que el denominador es P(B) y viene de la lámina anterior
33 Teorema de Bayes. EjercicioCuando los artículos llegan al final de una línea de producción, un supervisor escoge los que deben pasar por una inspección completa; 10% de todos los artículos producidos son defectuosos; 60% de todos los artículos defectuosos y 20% de todos los artículos buenos pasan por una inspección completa. ¿Cuál es la probabilidad de que un artículo sea defectuoso, dado que pasó por una inspección completa? Cambiar por uno que tenga más sentido
34 Teorema de Bayes A2 A3 A6 B A1 A5 A4Hacer notar que el denominador es P(B) y viene de la lámina anterior A4
35 Teorema de Bayes Para el caso de una partición en dos conjuntos A y AC: Hacer notar que el denominador es P(B) y viene de la lámina anterior
36 Teorema de Bayes. EjercicioEl departamento de meteorología ha anunciado tres posibilidades para el fin de semana: Que llueva: probabilidad del 50% Que nieve: probabilidad del 30% Que haya niebla: probabilidad del 20% Según estos posibles estados meteorológicos, la posibilidad de que ocurra algún accidente es la siguiente: Si llueve: 20% Si nieva: 10% Si hay niebla: 5% Resulta que Ud, que estaba de viaje, escuchó en la radio que ocurrió un accidente el fin de semana ¿cuál es la probabilidad de que estuviera nevando?
37 Teorema de Bayes. EjercicioLos clientes se encargan de evaluar los diseños preliminares de varios productos. En el pasado, el 95% de los productos con mayor éxito en el mercado recibieron buenas evaluaciones, el 60% de los productos con éxito moderado recibieron buenas evaluaciones, y el 10% de productos de escaso éxito recibieron buenas evaluaciones. Además, el 40% de los productos ha tenido mucho éxito, el 35% un éxito moderado y el 25% una baja aceptación. a.- ¿Cuál es la probabilidad de que un producto obtenga una buena evaluación? b.- Si un nuevo diseño recibe una buena evaluación, ¿cuál es la probabilidad de que se convierta en un producto de gran éxito? c.- Si un producto no obtiene una buena evaluación, ¿cuál es la probabilidad de que se convierta en un producto de gran éxito?
39 Variables Aleatorias Experimento: lanzar tres monedasS = {ccc,ccx,cxc,xcc,cxx,xcx,xxc,xxx} S R xxx ccc ccx cxc xcc cxx xcx xxc 3 2 1 Variable aleatoria: Función del espacio muestral S en el conjunto de los reales R (Número de caras)
40 Variables Aleatorias DefiniciónUna variable aleatoria es una función que asigna un número real a cada resultado en el espacio muestral de un experimento aleatorio. Con frecuencia el interés recae en resumir con un número el resultado de un experimento aleatorio. … Ya que el resultado de un experimento no se conoce con anticipación, sucede lo mismo con el valor de la variable. Por esta razón, la variable que asocia un número con el resultado de un experimento aleatorio se conoce como variable aleatoria. Ejemplos de variables aleatorias son: Número de años que un recién nacido va a vivir Número de hembras en familias de 3 hijos
41 Variables Aleatorias Las variables aleatorias tienen asociada una estructura de probabilidad que se caracteriza por la distribución de probabilidad Las variables aleatorias se denotan con una letra mayúscula (por ejemplo X) y con una letra minúscula (x) el valor posible de la variable. Con frecuencia el interés recae en resumir con un número el resultado de un experimento aleatorio. … Ya que el resultado de un experimento no se conoce con anticipación, sucede lo mismo con el valor de la variable. Por esta razón, la variable que asocia un número con el resultado de un experimento aleatorio se conoce como variable aleatoria.
42 Variables Aleatorias “X=x” representa el evento "la variable aleatoria X toma el valor x“ p(X=x) representa la probabilidad de dicho suceso. “X
43 Variables Aleatorias DiscretasUna Variable Aleatoria X es Discreta si el conjunto de valores que toma es finito o, si es infinito, puede ordenarse en una secuencia que se corresponda con los números naturales. Ejemplo: El número de artículos defectuosos en una selección de 4 artículos de entre 240 El número de trabajos recibidos por un centro de cómputo en un día
44 Variables Aleatorias DiscretasEjemplo: Una pareja decide tener hijos hasta que nazca un varón o 5 hembras. Sea la variable aleatoria número de hembras
45 Variable aleatoria: número de hembrasEvento probabilidad Variable aleatoria v hv hhv hhhv hhhhv hhhhh Para cada valor que toma la variable es necesario conocer su probabilidad
46 Variable aleatoria número de hembrasEvento probabilidad Variable aleatoria v 1/2 hv 1/4 1 hhv 1/8 2 hhhv 1/16 3 hhhhv 1/32 4 hhhhh 5 Para cada valor que toma la variable es necesario conocer su probabilidad
47 Características La distribución de probabilidad para una variable aleatoria discreta y, se representa por una tabla , gráfica o fórmula, que da la probabilidad p(y) asociada a cada posible valor de y. Eliminar los requisitos no dependen de que sea discreta
48 Ejemplo: Se lanza dos veces una moneda balanceada y se observa el número X de caras. Calcule la distribución de probabilidad para X.
49 El espacio muestral de un experimento aleatorio es {a, b, c, d, e, f} y cada resultado es igualmente probable. Se define una variable aleatoria de la siguiente manera: resultado a b c d e f x 1,5 2 3 Determine la distribución de probabilidad de X. Determine las siguientes probabilidades: P(X = 1,5) P(0,5 < X < 2,7) P(0 <= X < 2) P(X=0 o X=2)
50 La representación gráfica más usual de la distribución de probabilidad es un diagrama de barras no acumulativo.
51 Distribución Acumulada
52 Distribución AcumuladaSu representación gráfica tiene forma escalonada, siendo los saltos coincidentes con las probabilidades pi correspondientes a los valores xi de la variable X.
53 Supóngase que la distribución acumulada de la variable aleatoria X es:Fx(x) Determine la distribución de probabilidad de X.
54 Probabilidades Si la Variable X es discreta: Prob( X ≤ k ) = F(k)Prob( h ≤ X ≤ k )= F(k) - F(h-1) Prob( X > k ) = 1 - F(k) Prob( X = k )= F(k) - F(k-1) Prob( X < k ) = F(k-1)
55 Variables Aleatorias ContinuasUna Variable aleatoria X es continua si el conjunto de valores que toma es uno o más intervalos de la recta real. Su distribución de probabilidad está caracterizada por la función de densidad f: a b La probabilidad es el área bajo la curva
56 Ejemplos: Supongamos el experimento que consiste en elegir al azar 500 personas y medir su estatura. La función que asocia a cada persona su estatura es una variable aleatoria continua. Consideremos el experimento que consiste en elegir al azar 100 patillas de una plantación y pesarlas. La función que asocia a cada patilla su peso es una variable aleatoria continua. Pero ¿serán esas las variables asociadas a esos experimentos?
57 Distribución de ProbabilidadFunción de distribución acumulada F Densidad de Probabilidad f Con el propósito de calcular probabilidades, se tabula esta Función de Distribución Acumulada.
58 Propiedades de una función de densidad
59 Si X es una variable aleatoria continua, entonces,P(X=x)=0 Para cualquier x1 y x2,
60 Función de Distribución AcumuladaSi f(x) es la función de densidad su distribución acumulada está dada por: Por ser una probabilidad siempre se cumple que: 0 ≤ F(x) ≤ 1.
61 Ejemplo: Sea c una constante y consideremos la función de densidadcy si 0 <= y <= 1 0 en cualquier otro punto f(y) Calcule el valor de c Calcule P(0.2 < y <0.5) Obtenga la función de distribución acumulada para la variable aleatoria Calcule F(0.2) y F(0.7)
62 P(0.2 < y < 0.5)
63 F(0.7)
64 Probabilidades Si la Variable es X continua: Prob( X ≤ a ) = F(a)Prob( a < X ≤ b )= F(b) - F(a) Prob( X > a ) = 1 - F(a)
65 Medidas de Tendencia CentralPara una Variable Aleatoria X es necesario establecer su valor medio, (Valor Esperado), y cómo se dispersa respecto de su valor medio (Varianza).
66 Valor esperado Si X es discreta se define el Valor Esperado E(X):Si X es continua se define el Valor Esperado E(X):
67 Suponga la siguiente distribución para una variable aleatoria X y para una variable Y:18 20 22 f(x) 0.2 0.6 y 15 25 40 f(y) 0.2 0.3 Determine el valor esperado de X y de Y
68 Ejemplo: Sea X una variable aleatoria continua cuya función de densidad de probabilidad está dada por: x2/3 si -1<= x <= 2 0 en cualquier otro punto f(x) Calcule la media o valor esperado de x
69 Mediana La mediana es el número donde la distribución acumulada vale ½. F(mediana)=1/2 Si la distribución es simétrica la media y la mediana coinciden.
70 Medidas de Dispersión Varianza:
71 Medidas de Dispersión Si X es discreta se define la varianza V(X):
72 Medidas de Dispersión Si X es continua se define la varianza V(X):
73 Medidas de Dispersión y la Desviación Estándar:
74 Distribuciones continuas de distinta Varianzaσ = 3 σ = 8
75 Varianza Distribución NormalSi dos poblaciones tienen una altura promedio de 1,7 m, pero la primera presenta una desviación estándar de 0,5 y la segunda de 1,5. ¿Qué diferencia se observaría entre una y otra población? ¿En cuál esperaríamos encontrar un mayor porcentaje de personas de menos de 1,6 m?
76 Suponga la siguiente distribución para una variable aleatoria X y para una variable Y:18 20 22 f(x) 0.2 0.6 y 15 25 40 f(y) 0.2 0.3 Determine la varianza de X y de Y
77 Ejemplo: Sea X una variable aleatoria continua cuya función de densidad de probabilidad está dada por: x2/3 si -1 <= x <= 2 0 en cualquier otro punto f(x) Calcule la varianza de x
78 Regla Empírica Si un conjunto de datos tiene una distribución simétrica con forma aproximada de “joroba”, pueden utilizar las siguientes reglas prácticas para describir el conjunto de datos: Aproximadamente el 68% de las observaciones quedan a 1 desviación estándar de su media (esto es, dentro del intervalo μ ± σ para poblaciones) Aproximadamente el 95% quedan a 2 desviaciones estándar de su media (esto es, dentro del intervalo μ ± 2σ para poblaciones) Casi todas quedan a menos de 3 desviaciones estándar de su media (esto es, dentro del intervalo μ ± 3σ para poblaciones)
79 Algunos resultados sobre valores esperados y varianzasSi X e Y son variable aleatorias y k es una constante entonces: E(k) = k E(k X)= k E(X) E(X+Y)= E(X) + E(Y) V(X) = E[(X - µ)2] = E(X2) - µ2
80 Ejemplo de Distribuciones DiscretasUna pareja decide tener hijos hasta que nazca un varón o 5 hembras. Si esta conducta es adoptada por todos los marabinos, ¿se altera el orden natural acerca del equilibrio entre hombres mujeres? ¿Cuál sería el número promedio (valor esperado) de hembras y varones de cada pareja?
81 Solución del Ejemplo 31/32 1 total 5/32 5 1/32 hhhhh 1/8 4 hhhhv 3/161/16 hhhv 1/4 2 hhv hv 1/2 v x P(x) Hembras P(x) Evento Valor esperado de hembras = 31/32
82 Solución del Ejemplo 1 total 1/32 hhhhh hhhhv 1/16 hhhv 1/8 hhv 1/4 hv1/32 hhhhh hhhhv 1/16 hhhv 1/8 hhv 1/4 hv 1/2 v x P(x) Varones P(x) Evento 31/32 Valor esperado de varones = 31/32
83 Valor Esperado Decisiones: Inversiones Lotería Seguro
84 Distribuciones Discretas
85 5 pruebas de embarazo Si estando embarazada la probabilidad de que el test dé positivo es 0.9 ¿Cuál es la probabilidad de obtener 4 o más positivos en 5 ensayos (estando la mujer embarazada)? X = 4 E = Positivo E F E E E n = 5
86 Distribución BinomialCaracterísticas: Hay n ensayos independientes. El resultado de cada ensayo es éxito (E) o fracaso (F). La probabilidad p de éxito es constante en los ensayos.
87 Distribución BinomialVarianza: ¿? Variable aleatoria: Número x de éxitos en los n ensayos. Parámetros: n, p. Valor esperado: ¿? ¿Cuál es la probabilidad de obtener x éxitos?
88 Distribución BinomialVarianza: V(X)= n p (1-p) Variable aleatoria: Número x de éxitos en los n ensayos. Parámetros: n, p. Valor esperado: E(X)= n p
89 Gráfica de Distribución BinomialAcotada Simetría => p = 1/2
90 Ejemplo de Distribución Binomial5 pruebas de embarazo Si estando embarazada la probabilidad de que el test dé positivo es 0.9 ¿Cuál es la probabilidad de obtener 4 o más positivos en 5 ensayos? X = 4 E = Positivo E F E E E n = 5 x x 0.10 = = 1-binocdf(3, 5, 0.9)
91 Distribución Binomial. EjercicioDe acuerdo a un estudio realizado, el 26% de las personas adultas de Barinas tiene sobrepeso. Si se extrae una muestra aleatoria simple de 10 adultos, encuentre la probabilidad de que el número de personas con sobrepeso, dentro de la muestra, sea: Exactamente tres personas Menos de 2 Dos o más personas ocultar
92 Distribución Binomial. EjercicioLa probabilidad de que una persona que sufre de migraña tenga alivio con una fármaco específico es de Se seleccionan aleatoriamente a tres personas con migraña a las que se les administra el fármaco. Encuentre la probabilidad de que el número de personas que logran alivio sea: Exactamente 0 Exactamente uno Dos o menos Dos o tres ocultar
93 Distribución Binomial. EjercicioEn un estudio se encontró un gran número de casos de contaminación en peces en supermercados de las ciudades de Nueva York y Chicago. El estudio reveló que el 40% de los trozos de pez espada disponibles para la venta tenía un nivel de mercurio superior al limite establecido por la Administración de Alimentos y Medicinas de Estados Unidos (FDA). Para una muestra aleatoria de tres trozos de pez espada, calcule la probabilidad de que: Los tres trozos tengan niveles de mercurio por encima del límite establecido por la FDA. Exactamente un trozo de pez espada tenga un nivel de mercurio por encima del límite Cuando más, un trozo de pez espada tenga un nivel de mercurio por encima límite establecido por la FDA.
94 Distribución BinomialCaracterísticas: Hay n ensayos independientes. El resultado de cada ensayo es éxito (E) o fracaso (F). La probabilidad p de éxito es constante en los ensayos. Distribución asociada al muestreo con reemplazo.
95 ¿Cuál es el número esperado de aspirantes Se supone que el 5% de las enfermeras que se presentan en el Hospital General del Sur aspirando al cargo de asistente de cirugía, tienen entrenamiento en Instrumentación Quirúrgica. Determine la probabilidad de que se encuentre la primera enfermera con entrenamiento en instrumentación quirúrgica en la quinta entrevista. ¿Cuál es el número esperado de aspirantes que hay que entrevistar para encontrar la primera enfermera con entrenamiento en instrumentación quirúrgica? Cambiar por enfermeras que se presentan al hospital del sur como asistentes de cirugía. Y la probabilidad en 0.05
96 Distribución geométricaCaracterísticas: Pruebas idénticas e independientes. Dos posibles resultados: éxito o fracaso Probabilidad de éxito p constante para cada prueba Variable aleatoria geométrica X es el número de la prueba en la cual ocurre el primer éxito en lugar del número de éxitos que ocurren en n pruebas
97 Distribución geométricaF F E Éxito en la tercera prueba P(x) = P(F F F … F E) Nótese que aquí el espacio muestral es infinito y la variable puede tomar infinitos valores ¿Qué tiene que pasar para cumplir con el requisito de que ΣP(x) = 1? ¿Qué pasa con P(S)? X - 1 P(x) = (1-p) x – 1 p
98 Distribución geométrica
99 Distribución geométricaSe supone que el 5% de las enfermeras que se presentan en el Hospital General del Sur aspirando al cargo de asistente de cirugía, tienen entrenamiento en Instrumentación Quirúrgica. Determine la probabilidad de que se encuentre la primera enfermera con entrenamiento en instrumentación quirúrgica en la quinta entrevista. ¿Cuál es el número esperado de aspirantes que hay que entrevistar para encontrar la primera enfermera con entrenamiento en instrumentación quirúrgica? Cambiar por enfermeras que se presentan al hospital del sur como asistentes de cirugía. Y la probabilidad en 0.05
100 Para evitar que lo descubran en la aduana, un viajero ha colocado 6 tabletas de narcótico en una botella que contiene 9 píldoras de vitamina que son similares en apariencia. Si el oficial de la aduana selecciona 3 tabletas aleatoriamente para analizarlas, a) ¿Cuál es la probabilidad de que el viajero sea arrestado por posesión de narcóticos?, b) ¿Cuál es la probabilidad de que no sea arrestado por posesión de narcóticos?.
101 Ejemplo de HipergeométricaNP A A’ ¡El KINO! NP = 25 Favorables = K = 15 Se elige una muestra de 15 ¿Cuál es la probabilidad de que x sea 12, 13, 14, 15? X n
102 Distribución HipergeométricaCaracterísticas: Población de tamaño NP, K de ellos son ”especiales”. Si se selecciona una muestra aleatoria de n elementos ¿cuál es la probabilidad de que en ésta se hallen x elementos ”especiales”? Muestreo sin reemplazo.
103 Distribución HipergeométricaParámetros: NP K n NP = número total de elementos K = número de elementos que hay de un determinado tipo (“especiales”) n = número total de elementos que se seleccionarán (tamaño de la muestra) X = número de elementos “especiales” en la muestra
104 Distribución HipergeométricaSea p= K/NP la proporción de elementos del tipo A en la población: Valor esperado: E(X)= ¿? Varianza:
105 Distribución HipergeométricaSea p= K/NP la proporción de elementos del tipo A en la población: Valor esperado: E(X)= n·p Varianza:
106 P(12) = P(13) = P(14) = P(15)=
107 Ejemplo de HipergeométricaPara evitar que lo descubran en la aduana, un viajero ha colocado 6 tabletas de narcótico en una botella que contiene 9 píldoras de vitamina que son similares en apariencia. Si el oficial de la aduana selecciona 3 tabletas aleatoriamente para analizarlas, a) ¿Cuál es la probabilidad de que el viajero sea arrestado por posesión de narcóticos?, b) ¿Cuál es la probabilidad de que no sea arrestado por posesión de narcóticos?.
108 Ejemplo de Hipergeométrica¿Cuál es la probabilidad de que una mesera se rehúse a servir bebidas alcohólicas únicamente a dos menores de edad si verifica aleatoriamente solo 5 identificaciones de entre 9 estudiantes, de los cuales 4 no tienen la edad suficiente? ¿Cuál es la probabilidad de que como máximo 2 de las identificaciones pertenezcan a menores de edad?.
109 Distribución de PoissonCaracterísticas Eventos que ocurren con cierta velocidad en el tiempo (número de casos semanales de Dengue en el hospital del sur), o en el espacio (número de camarones por m3 en el Lago de Maracaibo). El número de eventos que ocurre en una unidad de tiempo, longitud, área o volumen es independiente del número de los que ocurren en otras unidades El número medio (o esperado) de eventos en cada unidad se denota por la letra griega lambda λ
110 Distribución de PoissonVariable aleatoria: Número x de ocurrencias del suceso por unidad de tiempo o espacio (x = 0, 1, 2, ...). Parámetros: λ promedio de ocurrencias del suceso por unidad de tiempo o espacio. Valor esperado: E(X)= ¿?
111 Distribución de PoissonVariable aleatoria: Número x de ocurrencias del suceso por unidad de tiempo o espacio (x = 0, 1, 2, ...). Parámetros: λ promedio de ocurrencias del suceso por unidad de tiempo o espacio. Valor esperado: E(X)= λ Varianza: V(X)= λ
112 A menudo, el número de llamadas telefónicas que llegan a un conmutador se modela como una variable aleatoria de Poisson. Suponga que, en promedio, se reciben 10 llamadas por hora. ¿Cuál es la probabilidad de que lleguen exactamente cinco llamadas en una hora? ¿Cuál es la probabilidad de que se reciban exactamente 15 llamadas en dos horas? ¿Cuál es la probabilidad de que lleguen exactamente cinco llamadas en 30 minutos?
113 Distribución de Poisson
114 Ejemplo de Distribución de PoissonSi la media del número de casos semanales de Dengue en un hospital es 1.3, ¿Cuál es la probabilidad de que en una semana se presenten 5 o más casos de Dengue? λ = 1.3
115 Ejemplo de Distribución de PoissonSi la media del número de casos semanales de Dengue en un hospital es 1.3, ¿Cuál es la probabilidad de que en una semana se presenten 5 o más casos de Dengue? λ = 1.3 1 – F(4) = 1 – (P(0) + P(1) + P(2) + P(3) + P(4)) 1 - poisscdf(4, 1.3);
116 Distribución de PoissonCaracterísticas: Se utiliza como aproximación al modelo binomial cuando n es grande y p pequeño (ley de los sucesos raros). p < 0.1 np < 5, tomando como parámetro λ = np También se conoce como “la distribución de los sucesos raros”
117 Distribuciones Continuas
118 Distribución Normal ImportanciaLa distribución Normal es indudablemente la distribución continua fundamental, tanto por sus aplicaciones como por el rol que juega dentro de la Teoría Estadística. Es la piedra angular de la inferencia ya que muchas estadísticas muestrales tienden hacia la distribución Normal cuando el tamaño de la muestra crece. Enfoque original: Moivre, ca Posteriormente: Karl Gauss, 1855 También es conocida como distribución Gaussiana
119 Distribución Normal Características Tiene forma de campanaEs simétrica con respecto a la media Es continua Las dos colas (extremos) de una distribución normal de probabilidad se extienden de manera indefinida y nunca tocan el eje horizontal.
120 Distribución Normal Parámetros μ y σ Función de DensidadSe afirma que una variable aleatoria X es Normal N(μ,σ2) si su función de densidad está dada por: Valor Esperado μ Varianza σ2
121 Normal
122 Gráfica de Distribución Normal
123 Gráfica de Distribuciones Normales con diferentes medias e igual dispersión
124 Prob( X ≤ w ) = Prob ( Z ≤ (w-μ)/σ ).Normal Estándar Si X es N(μ,σ2) entonces: Z = (X-μ)/σ es N(0,1) se designa como Normal Estándar. Esta propiedad permite relacionar la función de distribución acumulada de X con la de Z, ya que: Prob( X ≤ w ) = Prob ( Z ≤ (w-μ)/σ ).
125
126
127 Normal Estándar P(Z < 0) = ? P(Z > 0) = ?
128 Normal Estándar Estándar
129 Consideremos que el peso de los niños varones en el momento del nacimiento se distribuye normalmente. Si sabemos que el peso medio en el momento de nacer es 3,25 kgs y la desviación típica es de 0,82 kgs, ¿cuál es la probabilidad de que el peso de un niño varón al nacer sea superior a 4 kgs? Estandarizamos la variable aleatoria X, peso de los niños al nacer. En el proceso de estandarización, al valor de X=4, le corresponde el valor, t=0,9146 :
130 Si el nivel de colesterol de los habitantes de Maracaibo tiene una distribución aproximadamente normal, con una media de 200 mg/100 ml y una desviación estándar de 20 mg/100 ml, calcule la probabilidad de que una persona de Maracaibo, elegida al azar, tenga un nivel de colesterol: a.- Entre 180 y 200 mg/100 ml b.- Mayor que 225 mg/100 ml c.- Menor que 150 mg/100 ml d.- Entre 190 y 210 mg/100 ml ocultar? a) b) < 0,11 c) d) 0.383
131 El tiempo de incapacidad por enfermedad de los empleados de una compañía en un mes tiene una distribución normal con media de 100 horas y desviación estándar de 20 horas. ¿Cuál es la probabilidad de que el tiempo por incapacidad del siguiente mes se encuentre entre 50 y 80 horas? ¿Cuánto tiempo de incapacidad deberá planearse para que la probabilidad de excederlo sea solo del 10%? a) b)
132 Se supone que el ancho de una herramienta utilizada en la fabricación de semiconductores tiene una distribución normal con media de 0.5 micrómetros y desviación estándar de 0.05 micrómetros. a.- ¿Cuál es la probabilidad de que el ancho de la herramienta sea mayor que 0.62 micrómetros? b.- ¿Cuál es la probabilidad de que el ancho de la herramienta se encuentre entre 0.47 y 0.63 micrómetros? c.- ¿Debajo de qué valor está el ancho de la herramienta en el 90% de las muestras? c) 1.14 um
133 Distribución Gamma Características Valores positivosAsimetría hacia la derecha Muy versátil, dependiendo del valor de los parámetros adopta formas muy distintas Dos distribuciones fundamentales son casos particulares de ella: Exponencial y Chi-cuadrado. “Se utiliza en problemas de líneas de espera para representar el intervalo total para completar una reparación, si esta se lleva a cabo en subestaciones”. “Existen algunos ejemplos que no siguen el patrón anterior, pero que se aproximan de manera adecuada mediante el empleo de la distribución gamma, como los ingresos familiares y la edad del hombre al contraer matrimonio por primera vez”
134 Distribución Gamma Parámetros Función de Densidad:θ: Parámetro de escala α: Parámetro de forma Función de Densidad: Valor esperado θ * α Varianza θ2 * α Enteros -> (z-1)!
135 Distribución Gamma θ = 1 α = 1 α = 3 α = 5
136 Distribución Gamma α = 1 θ = 1 θ = 3 θ = 5
137 Distribución ExponencialEstá relacionada con la distribución de Poisson. Diferencia: a la distribución de Poisson le interesa el número de ocurrencias, mientras que a la exponencial le interesa el tiempo (distancia, área, volumen) transcurrido entre las ocurrencias. Ejemplo: Poisson: el número de personas en la cola del banco Exponencial: el tiempo entre llegadas a la taquilla
138 Distribución ExponencialParámetro Θ Función de Densidad: Valor esperado Θ Varianza Θ2 ELIIMINAR o escoger una de las dos formulaciones alternativas La distribución exponencial es una GAMMA con α = 1.
139 Distribución ExponencialParámetro λ Función de Densidad: Valor esperado 1/λ Varianza 1/λ2 ELIIMINAR o escoger una de las dos formulaciones alternativas La distribución exponencial es una GAMMA con α = 1.
140 Distribución ExponencialFunción de Densidad (alternativa): λ: La media del proceso de Poisson. Número medio de sucesos por unidad de medida. La variable aleatoria X indica el tiempo desde que comienza la observación (experimento) hasta que ocurre un evento. Ejemplos: El tiempo que transcurre en la emergencia de un hospital, para la llegada del siguiente paciente. El tiempo transcurrido hasta la falla de un dispositivo.
141 Distribución ExponencialValor esperado Varianza Función de Probabilidad Acumulada: La probabilidad de que no ocurra un evento de Poisson en el tiempo x es equivalente a la probabilidad de que el tiempo de observación requerido para que suceda el evento sea mayor que x.
142 Distribución ExponencialValor esperado Varianza Función de Probabilidad Acumulada: ¿Cuál es la mediana de una variable exponencial de media 1/λ?
143 Exponencial media = 40
144 Exponencial media = 40 Mediana = 27.73 50%
145 Ejemplo de Distribución ExponencialSi la esperanza de vida de un suazi es de 40 años ¿Cuál es la probabilidad de que viva más de 60 años?
146 Distribución ExponencialLos clientes de un supermercado llegan en promedio de 2 por minuto. Halle la probabilidad de que transcurran: A lo sumo 3 minutos antes de la llegada del próximo cliente Por lo menos 4 minutos
147 Distribución ExponencialLa duración de un cierto tipo de bombillo es una variable aleatoria exponencial de media 5000 horas. ¿Cuál es la probabilidad de que dure más de 6000 horas? Si lleva funcionando 1000 horas ¿cuál es la probabilidad de que dure: 6000 horas adicionales a las 1000 que lleva funcionando? 6000 horas en total?
148 Distribución ExponencialPropiedad de carencia de memoria En la duración que se espera que tenga el objeto, no influye para nada el tiempo que en la actualidad lleva funcionando El dispositivo no se desgasta. Para una variable aleatoria exponencial X, P(X < t1 + t2 | X > t1) = P(X < t2)
149 Distribución ExponencialEl tiempo entre arribos de los taxis en un cruce muy concurrido tiene una distribución exponencial con media de 10 minutos. ¿Cuál es la probabilidad de que una persona que esté en el cruce tenga que esperar más de una hora para tomar un taxi? Suponga que la persona ya esperó una hora, ¿cuál es la probabilidad de que llegue uno en los siguientes 10 minutos?
150 El tiempo de duración de un ensamble mecánico en una prueba de vibración tiene una distribución exponencial con media de 400 horas. ¿Cuál es la probabilidad de que el ensamble falle durante la prueba en menos de 100 horas? ¿Cuál es la probabilidad de que el ensamble trabaje durante más de 500 horas antes de que falle? Si el ensamble se ha probado durante 400 horas sin falla alguna, ¿cuál es la probabilidad de que falle en las siguientes 100 horas?
151 El tiempo de vida de los reguladores de voltaje de los automóviles tiene una distribución exponencial con un tiempo de vida medio de seis años. Una persona compra un automóvil que tiene una antigüedad de seis años, con un regulador en funcionamiento. ¿Cuál es la probabilidad de que el regulador de voltaje falle en el lapso de seis años? Si el regulador de voltaje falla después de tres años de haber efectuado la compra del automóvil y se reemplaza, ¿cuál es el tiempo promedio que transcurrirá hasta que el regulador vuelva a fallar?
152 Distribución Exponencial. EjercicioEn una red de computadoras grande, el acceso de los usuarios al sistema puede modelarse como un proceso de Poisson con una media de 25 accesos por hora. ¿Cuál es la probabilidad de que no haya accesos en un intervalo de 6 minutos? ¿Cuál es la probabilidad de que el tiempo que transcurre hasta el siguiente acceso esté entre 2 y 3 minutos?
153 Distribución Beta Características:Se la utiliza para representar variables aleatorias cuyos valores se encuentran restringidos a intervalos de longitud finita.
154 Distribución Beta Parámetros : Función de densidad :α y β ambos parámetros de forma. Función de densidad : Es 0 en todas partes salvo en el intervalo [0,1] donde está definida por:
155 Distribución Beta Valor esperado: Varianza :α/(α + β) Varianza : α β/(α + β)2(α + β + 1) Función de distribución acumulada: Es la función de distribución acumulada definida para todo x en (0,1). MATLAB: betacdf(x, α, β)
156 Gráfica de Distribución Beta
157 Los sensores de infrarrojo de un sistema robótico computarizado envían información a otros sensores en diferentes formatos. La proporción x de las señales que se envían y que son directamente compatibles para todos los sensores del sistema sigue una distribución beta con α=β=2. Calcule la probabilidad de que más de 30% de las señales de infrarrojo enviadas en el sistema sean directamente compatibles para todos los sensores
158 Distribución Uniforme ContinuaCaracterísticas: La distribución uniforme o rectangular tiene densidad constante en un intervalo [a, b] y vale 0 fuera del mismo. f(x) a b
159 Distribución Uniforme ContinuaParámetros: a y b Función de densidad: f(x)= ? en [a, b] en el resto Valor esperado: ? Varianza:
160 Distribución Uniforme ContinuaParámetros: a y b Función de densidad: f(x)= 1/(b-a) en [a, b] en el resto Valor esperado: (a + b)/2 Varianza: (b – a)2/12
161 Distribución Uniforme ContinuaSuponga que un departamento de investigación de enfermedades cardiovasculares está realizando un estudio sobre la hipertensión arterial, trabajando para ello con una muestra aleatoria de personas y donde la presión arterial diastólica se distribuye uniformemente entre 60 y 160. Este grupo de investigación desea excluir aquellos pacientes cuya presión arterial esté por debajo de 90. Poner un ejemplo después lo elegimos que sea de salud Calcule la media y la desviación estándar de x, la presión arterial diastólica de las personas de la muestra. Grafique la distribución de probabilidad Calcule la fracción de personas que se omitirán para el estudio.
162 Distribución Uniforme ContinuaSuponga que el departamento de investigación de un fabricante de acero cree que una de las máquinas de la compañía está produciendo láminas de metal con espesores variables. El espesor es un variable aleatoria uniforme con valores entre 150 y 200 milímetros. Cualquier lámina que tenga menos de 160 milímetros de espesor debe desecharse, pues resulta inaceptable para los compradores. Grafique la distribución de probabilidad de las láminas de acero producidas por esta máquina Calcule la fracción de las láminas de acero producidas por esta máquina que se desechan
163 Distribución Uniforme ContinuaInvestigadores de la Universidad de los Andes han diseñado, construido y probado un circuito de condensador conmutado para generar señales aleatorias. Se demostró que la trayectoria del circuito estaba distribuida uniformemente en el intervalo (0,1). Indique la media y la varianza de la trayectoria del circuito Calcule la probabilidad de que la trayectoria esté entre 0.2 y 0.4 ¿Esperaría usted observar una trayectoria que excediera 0.995?
164 Distribuciones de Probabilidad Conjuntas
165 Distribución de probabilidad conjuntaSi X y Y son variables aleatorias discretas, la distribución de probabilidad conjunta de X y Y, es una descripción del conjunto de puntos (x,y) en el rango de (X,Y) junto con la probabilidad asociada con cada uno de ellos. Es conocida como distribución bivariada o distribución bivariable Satisface las siguientes condiciones: (1) (2) (3) para todos los valores de x y y
166 Distribución de probabilidad conjuntaSuponga dos variables aleatorias: X: Posición frente a la legalización del aborto (0: en contra, 1: a favor) Y: Nivel de educación de la persona (1: primaria, 2: bachiller, 3: universitaria) Distribución Bidimensional Discreta DISTRIBUCIÓN CONJUNTA Y 1 2 3 X .1 .2 .3
167 Distribución de probabilidad conjuntaY Marginal de X 1 2 3 X .1 .2 .3 .6 .4 Marginal de Y Distribuciones de probabilidad marginales (incondicionales)
168 Distribución de probabilidad conjuntaY Marginal de X 1 2 3 X .1 .2 .3 .6 .4 Marginal de Y Obtenga la distribución de probabilidad condicional de x dado y=1
169 Distribución de probabilidad conjuntaValor esperado En el ejemplo, DISTRIBUCIÓN CONJUNTA Y Marginal de X 1 2 3 X .1 .2 .3 .6 .4 Marginal de Y ¿Cuál sería el valor esperado de X? ¿y el de Y? ¿el de XY?
170 Variables IndependientesDefinición X e Y son variables aleatorias independientes si: Para todas a y b, P(X < a y Y < b) = P(X < a)·P(Y < b)
171 Variables IndependientesTeorema Si X y Y son variables aleatorias independientes, entonces E(XY) = E(X)E(Y) Atención: Este es un teorema, no una definición.
172 Covarianza La covarianza(X,Y) es una medida de asociación lineal entre las variables X e Y Producto cruzado de las desviaciones (x-μx) (y-μy) para cada punto de datos
173 Signos de los productos cruzados (x-μx)(y-μy)+ (x,y) (y-μy) (x-μx) + - (μx , μy)
174 (covarianza cercana a 0)Signos de los productos cruzados (x-μx)(y-μy) Relación lineal débil (covarianza cercana a 0)
175 Covarianza Si Definición Teorema
176 La covarianza(X,Y) es una medida de asociación lineal entre las variables X e YSi la relación entre las variables aleatorias no es lineal, puede que la covarianza no sea sensible a dicha relación. Ejemplo: Covarianza: 0
177 En el ejemplo, DISTRIBUCIÓN CONJUNTA Y Marginal de X 1 2 3 X .1 .2 .3 .6 .4 Marginal de Y E(x) = 0.4 E(y) = 2 E(xy) = 0.6 Calcule la covarianza de las variables aleatorias
178 ¿Será lo contrario cierto también? Es decir:Teorema Si X y Y son dos variables aleatorias independientes, entonces: Cov(X,Y)=0 ¿Será lo contrario cierto también? Es decir: ¿si la covarianza es cero entonces puede concluirse que las variables son independientes?
179 Supongamos Y1 y Y2 dos variables aleatorias discretas con la siguiente distribución de probabilidad conjunta: DISTRIBUCIÓN CONJUNTA Y1 -1 1 Y2 1/16 3/16 ¿Cuál es su covarianza? ¿Son independientes?
180 Valor esperado y varianza de funciones lineales de variables aleatoriasSean X y Y dos variables aleatorias continuas y a y b dos constantes: E(aX + bY) = aE(X) + bE(Y) Var(aX + b) = a2Var(X) Var(aX+bY) = a2Var(X) + b2Var(Y) + 2abCov(X,Y) Si X y Y son independientes, entonces: Var(aX+bY) = a2Var(X) + b2Var(Y)
181 Un vendedor obtiene sus ingresos mediante la venta de dos productos distintos. Por experiencia sabe que el volumen de ventas de A no tiene influencia alguna sobre el de B. Su ingreso mensual es el 10% del volumen, en dólares, del producto A y el 15% del volumen de B. Si en promedio las ventas del producto A ascienden a $ con una desviación estándar de $2.000 y las de B a $8.000 con una desviación estándar de $1.000, obténgase el valor esperado y la desviación estándar del ingreso mensual del vendedor. Sean X y Y dos variables aleatorias que representan el volumen de ventas en dólares de los productos A y B, respectivamente. Por hipótesis: E(X)= desv (X)= E(Y)= desv(Y)=1000 De esta forma se tiene: E(0.1X Y) = 0.1*E(X) *E(Y) = $2.200 Var(0.1 X Y) = 0.01Var(X) Var(Y) = 62500 (Esto porque Var(aX)=a2Var(X)) Luego, la desviación estándar es de $250. (Libro de Canavos)
182 Correlación La correlación entre dos variables (x, y) es una medida de asociación que expresa el grado de dependencia lineal entre ambas, formalmente: -1 ≤ ρ ≤ 1 Si las variables aleatorias son independientes entonces la correlación entre ambas es 0
183 En el ejemplo, DISTRIBUCIÓN CONJUNTA Y Marginal de X 1 2 3 X .1 .2 .3 .6 .4 Marginal de Y E(x) = 0.4 E(y) = 2 Cov(xy) = *2 = -0.2 Calcule el coeficiente de correlación ρ para x y y
184 Coeficiente de Correlación rX1 X2 r = 0.9 r = 0.5 r = 0 r = -0.5 r = -0.9 Distintos grados de asociación lineal entre dos variables Nótese la orientación de la nube en función del signo de la correlación Independencia
185 Correlación Positiva Si la correlación es 1, todas las observaciones se encuentran alineadas en una recta. -1 ≤ ρ ≤ 1 Si ρ = X, Y independientes
186 Algunos resultados sobre valores esperados y varianzasSi X e Y son variable aleatorias y k es una constante entonces: E(k X)= k E(X) V(k X)= k2 V(X) E(X+Y)= E(X) + E(Y) Además si X e Y son independientes: V(X + Y) = V(X - Y) = V(X) + V(Y)
187 Cuidado con la confusión entre correlación y causalidadQue dos fenómenos estén correlacionados no implica que uno sea causa del otro. Es frecuente que una correlación fuerte indique que las dos variables dependen de una tercera que no ha sido considerada. Este tercer elemento se llama “factor de confusión”. Por ejemplo, puede ser que una fuerte correlación exprese una verdadera causalidad, como en el número de cigarrillos que se fuma al día y la aparición de cáncer de pulmón. Pero no es la estadística la que demuestra la causalidad, ella solo permite detectarla.
188 Cantidad de prostitutas y cajas de chicles consumidas en MaracaiboPeriodo:
189
190
191 Correlación y Causalidad
192 FIN DE PROBABILIDAD