Modulo de estadistica ii

2.010 visualizaciones

Publicado el

Publicado en: Educación
0 comentarios
1 recomendación
Estadísticas
Notas
  • Sé el primero en comentar

Sin descargas
Visualizaciones
Visualizaciones totales
2.010
En SlideShare
0
De insertados
0
Número de insertados
3
Acciones
Compartido
0
Descargas
45
Comentarios
0
Recomendaciones
1
Insertados 0
No insertados

No hay notas en la diapositiva.

Modulo de estadistica ii

  1. 1. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ MODULO DE ESTADÍSTICA II ALBERTO QUINTO JIMÉNEZ Especialista en Matemática Avanzada. Universidad Nacional de Colombia. FACULTAD DE HUMANIDADES PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS UNIVERSIDAD TECNOLOGICA DEL CHOCÓ “DIEGO LUIS CORDOBA” 2007 1
  2. 2. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ OFRENDA A mi querida tía, recordada por siempre ROSA QUINTO MOSQUERA a mis hijos, a todos y cada uno de mis actuales y futuros alumnos. 2
  3. 3. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ INDICE PAGINA Ofrenda Introducción UNIDAD 1.0 SUCESOS ALEATORIOS Y PROBABILIDAD. 5 1.1 Concepto de suceso 6 1.2 Fenómeno o Experimento Aleatorio 6 1.3 Espacio Muestral 6 1.4 Clasificación de los Sucesos 7 1.5 Análisis Combinatorio 10 1.5.1Factorial de N 10 1.5.2 Permutaciones 11 1.5.3 Variaciones Simples 12 1.5.4 Combinaciones 13 1.6 Teoría Elemental de la Probabilidad 15 1.7 Teoremas del Cálculo de Probabilidad 17 1.8 Axiomatización de la Probabilidad 20 Ejercicios UNIDAD 2.0 DISTRIBUCIONES DE PROBABILIDADES. 31 2.1 Variables Aleatorias 32 2.2 Esperanza Matemática 32 2.3 Distribuciones de Probabilidades 34 2.3.1 Poisson 34 2.3.2 Binomial 38 2.3.3. Normal 41 Ejercicios 3
  4. 4. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ UNIDAD 3.0 DECISION ESTADISTICA 54 3.0 Nociones sobre pruebas de hipótesis y métodos no parametritos 55 3.1 Pruebas de Uno y Dos Extremos 57 3.2 Reglas de Decisión 57 3.3 Errores Estadísticos 58 3.4 Potencia de una Prueba 59 3.5 Procedimientos Estadísticos en la Investigación 59 3.6 Diferencias entre las Pruebas Parámetricas y no Parámetricas 60 3.6.1 El tamaño de la muestra 62 3.7 Prueba Binomial 63 3.8 Prueba de los Signos 68 3.9 Prueba de Cox y Stuart para Tendencia 76 3.10Prueba X2 Para Diferencias en Probabilidades 2x2 78 3.11Prueba de Mc Nemar Para Cambios de Significancias 82 3.12Prueba de la Mediana 86 3.13Prueba de Bondad de Ajuste de Kolmogorov-Smirnov 91 3.14Prueba U de Mann-Whitney 95 3.15Prueba de Kruskal-Wallis 101 3.16Prueba de Sparman 106 UNIDAD 4.0 ASPECTOS GENERALES SOBRE SERIES CRONOLOGICAS, NUMEROS INDICES Y TASAS. 112 4.0 Series cronológicas. 113 4.1 Componentes de una serie. 113 4.2 Determinación de la tendencia. 115 4.3 Ajuste rectilíneo. 116 4.4 Los números índices. 123 4.5 usos de los números índices. 138 4.6 Proporciones, porcentajes, razones y tasas. 148 Ejercicios aplicativos - Bibliografía. 4
  5. 5. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ INTRODUCCIÓN Cada día de nuestras vidas estamos expuestos a una amplia variedad de información numérica relativa a fenómenos como la actividad del mercado de valores, los hallazgos de estudios de mercados, los resultados de encuestas de opinión, las tasas de desempleo, los pronósticos de éxito futuro de industrias especificas y datos en general. Es importante recordar que el tema de la estadística moderna abarca la recolección presentación y caracterización de información para ayudar tanto en el análisis de datos como en el proceso de la toma de decisiones. Por la forma en que está estructurado el modulo, es poca la preparación matemática que se requiere para entenderlo. Aquellos que hayan tomado el primer curso de estadística, no tendrán dificultad alguna para seguir la manipulación matemática y estadística en este curso. Tengo fe en que el estudiante, o el lector común, llegará a darse cuenta que en la estadística hay más que las meras matemáticas; que la Estadística, primero que todo, es una filosofía, una manera de pensar. Si el estudiante puede desarrollar los conceptos, verá la estadística simplemente como el vehículo para su expresión y comunicación de resultados. Aspiro, en consecuencia, prestar un nuevo servicio a los educadores Colombianos; porque considero que todo lo que se hace en beneficio de los futuros ciudadanos ha de estar inspirado en un elevado anhelo de engrandecimiento patrio, y ello sólo se logra con la dedicación y el sacrificio constante de cada uno de nosotros, pues como lo expresa claramente CHARLES SUMMER, “la verdadera grandeza de las naciones está en aquellas cualidades que constituyen la grandeza del individuo”. 5
  6. 6. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ UNIDAD 1.0 SUCESOS ALEATORIOS Y PROBABILIDAD OBJETIVO DE LA UNIDAD: Desarrollar una comprensión de los conceptos básicos de probabilidad que son la base necesaria para el desarrollo y estudio de distribuciones de probabilidad e inferencia estadística. CONTENIDOS: 1.1 Concepto de suceso 1.2 Fenómeno o Experimento Aleatorio 1.3 Espacio Muestral 1.4 Clasificación de los Sucesos 1.5 Análisis Combinatorio 1.5.1Factorial de N 1.5.2 Permutaciones 1.5.3 Variaciones Simples 1.5.4 Combinaciones 1.6 Teoría Elemental de la Probabilidad 1.7 Teoremas del Cálculo de Probabilidad 1.8 Axiomatización de la Probabilidad Ejercicios 6
  7. 7. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ 1.1 CONCEPTO DE SUCESO Se denomina suceso o evento (E), a cada uno de los posibles resultados de un experimento aleatorio. 1.2 FENÓMENOS O EXPERIMENTOS ALEATORIOS Son todos aquellos sucesos cuyos resultados están establecidos pero no se pueden predecir con exactitud a priori, o sea que en las mismas condiciones pueden presentar resultados diferentes. Además consideramos que el fenómeno aleatorio puede ocurrir respectivamente en forma indefinida. Los fenómenos aleatorios, se caracterizan por la imposibilidad de predecir resultados individuales; sin embargo, al repetir el mismo experimento aleatorio en condiciones idénticas los resultados promedios o globales presentan una regularidad o estabilidad sorprendente. Así, hablamos de los fenómenos o experimentos aleatorios de lanzar una o más monedas, uno o más dados, de extraer una o más carta de una baraja, de extraer uno o más remedio de un lote, etc. 1.3 ESPACIO MUESTRAL Consideremos el experimento aleatorio que consiste en lanzar un dado y anotemos los posibles resultados (E): E = 1, 2, 3, 4, 5, 6 Los resultados posibles del experimento constituyen un conjunto (S) S = { 1, 2, 3, 4, 5,6 } 7
  8. 8. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ Que llamaremos espacio de los resultados o espacio muestral correspondiente al experimento aleatorio de lanzar un dado una sola vez. En general, si tomamos el conjunto fundamental de resultados posibles de un fenómeno aleatorio, como un conjunto de puntos, tal que cada punto represente uno y sólo uno de los resultados posibles, el espacio que reúne estos puntos es espacio muestral. . Cara. .Cruz Conjunto de los eventos que aparecen al lanzar una moneda al aire. .1 .3 .6 .4 .2 .5 Conjunto de los eventos que aparecen al lanzar un dado al aire. 8
  9. 9. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ 1.4 CLASIFICACIÓN DE LOS SUCESOS 1.4.1 SUCESO SEGURO: Es aquel que siempre se produce al realizar un experimento aleatorio (certeza). EJEMPLO: En el experimento de lanzar un dado, el suceso de que salga un número menor que 7 es un suceso seguro. 1.4.2 SUCESO IMPOSIBLE Es aquel que nunca se produce al realizar un experimento aleatorio (imposibilidad). EJEMPLO: En el experimento de lanzar un dado, el evento de que salga un número mayor que seis es un suceso imposible. 1.4.3 INCLUSIÓN DE SUCESO Se dice que un suceso E1 está incluido en otro E2 cuando todos los sucesos elementales de E1 pertenecen al suceso E2. Se representa con el símbolo E1 ⊂ E2 significa: E1 está contenido en E2. 9
  10. 10. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ EJEMPLO: Si en el experimento de lanzar un dado al aire se consideran los dos sucesos siguientes: E1: que salga la cifra 4. E2: que salga una cifra par. Se observa que E1 ⊂ E2. 1.4.4 IGUALDAD DE SUCESO Dos sucesos son iguales cuando están formado por los mismos sucesos elementales. EJEMPLO: En el experimento de una mujer dar luz un bebe se consideran dos sucesos. E1 : que salga niño E2: que no salga niña Se observa fácilmente que E1 = E2, puesto que ambos sucesos aquí valen al suceso elemental que salga niño 1.4.5 SUCESO CONTRARIO Se denomina suceso contrario, E _ de un determinado suceso E, al suceso formado por todos los sucesos elementales que no están en E y que pertenecen al conjunto de todos los sucesos elementales de un experimento. EJEMPLO: En el experimento de lanzar una moneda al aire, si se considera el suceso E: que salga cruz, el suceso contrario E _ se forma por los sucesos que no están en E pero que pertenecen al experimento E _ : que salga cara. 1.4.6 DOS SUCESOS (UNO U OTRO) 10
  11. 11. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ Cuando se están interesados por 2 sucesos A y B, se desea que se produzca uno de los dos sucesos A ó B, es fácil comprender que esto ocurre siempre que se produce algún suceso elemental de A o B, es decir, perteneciente a la unión A ∪ B de los dos conjuntos. EJEMPLO: Sean los sucesos A y B siguientes: A : que salga 1 ó 2 al lanzar un dado. B : que salga 2, 5 ó 6 al lanzar un dado. Tendrá lugar el suceso A ó B cuando se produzca uno cualquiera de los sucesos elementales de A, de B ó de A U B. B A 1. 2. 5. 6. 1.4.7 DOS SUCESOS SIMULTÁNEOS (UNO Y OTRO) Si se desea que se produzcan los dos sucesos A y B al mismo tiempo, basta con que se produzca uno de los sucesos elementales de la intersección de los sucesos dados, ya que por ser de la intersección A ∩ B, pertenecen al mismo tiempo a ambos conjuntos de sucesos elementales, con lo que los dos sucesos A y B se verificarán a la vez. EJEMPLO: En el ejemplo anterior, el suceso A y B tendrá lugar cuando se verifique el suceso elemental que salga 2, ya que éste es el único suceso perteneciente a la intersección de A y B. En el caso de que la intersección sea vacía A ∩ B = φ , se dice que los sucesos de A y B son INCOMPATIBLES, ya que por ser disjuntos no tienen ningún elemento en común y no pueden darse al mismo tiempo. 11
  12. 12. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ 1.4.8 MAS DE DOS SUCESOS SEGUROS Cuando se esta interesado por más de dos sucesos, A, B, C disjuntos dos a dos que cumplen con la condición de que su reunión A U B U C requiera certezas, S, puede afirmarse que siempre se verificará uno de los sucesos A, B ó C del experimento aleatorio. EJEMPLO: Sea el experimento de lanzar un dado al aire. Si se consideran los sucesos siguientes: A : que salga 1 ó 2. B : que salga 3 ó 4 C : que salga 5 ó 6 Se comprueba fácilmente que los 3 sucesos son disjuntos 2 a 2. Pues: A n B = φ A n B = φ B n C = φ Además A U B U C es el suceso seguro. 1.5 ANÁLISIS COMBINATORIO Las secciones que discutiremos a continuación hacen referencia a las diferentes maneras en que en un momento dado podemos ordenar, agrupar o seleccionar los elementos de un conjunto. Este método combinatorio nos llevará al cálculo de la probabilidad a - priori de un suceso en forma más sencilla y ágil. EJEMPLO: Si hay 3 candidatos para Gobernador y 5 para alcalde, los dos cargos pueden ocuparse de 3 x 5 = 15 formas. 1.5.1 FACTORIAL DE N. El factorial de n se denota por n! y viene definido por n! = n (n-1) (n - 2). . .1 Así: 5! = 5.4.3.2.1 = 120 12
  13. 13. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ 4! 3! = (4.3.2.1) (3.2.1) = 144 Conviene decir que O! = 1 1.6 PERMUTACIONES Una permutación de n objetos diferentes tomados de r en r es una ordenación de r objetos entre los n dados y atendiendo a la situación de cada objeto en la ordenación. El número de permutaciones de n objetos tomados de r en r se representa por n Pr, Pn,r ó P(n,r) y viene dado por n Pr = n (n -1 ) ( n -2) ... ( n - r + 1) = n n r ! ( )!− En particular, el número de permutaciones de n objeto tomados de n en n es n Pn = n ( n -1 ) ( n -2 ) ... 1 = n! EJEMPLO 1: El número de permutaciones de las letras a, b, c tomadas de dos es: 3 P2 = 3.2 = 6, estas son ab, ba, ac, bc, cb. EJEMPLO 2: El número de permutaciones de las palabras estadística es: 11 1 2 2 2 2 1 1 1110 9 8 7 6 5 4 3 21 12121212111 39916800 16 2494800 ! !. !. !. !. !. !. ! . . . . . . . . . . . . . . . . . . . . = = = Puesto que hay: 1e, 2s, 2t, 2a, 2i, 1d, 1c EJEMPLO 3: En un departamento sanitario municipal se tienen cinco oficinas adyacentes que van a ser ocupadas por cinco enfermeras A, B, C, D y E. De cuántas maneras diferentes pueden asignarse las enfermeras a las oficinas. 5P5 = 5 5 5 5 4 3 21 0 120 1 120 ! ( )! . . . . !− = = = 13
  14. 14. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ 1.6.4 PERMUTACIÓN CON REPETICIÓN Se llaman permutaciones con repetición de n elementos, donde hay r1 iguales y de la misma clase, r2 iguales y de la misma clase etc. donde r1 + r2 +.....= n a las distintas ordenaciones que se le puedan dar al conjunto. Se puede expresar así: P(n,r1 ,r2 ,...) = n r r ! ! !...1 2 EJEMPLO: Cuántos números distintos, de cinco cifras, se pueden formar con el número 22111. SOLUCIÓN: Hay dos iguales y tres iguales, luego: p (5, 2, 3) = 5 2!3 1 2 3 4 5 1 2 1 2 3 10 ! ! . . . . ( . )( . . ) = = Se pueden formar 10 números distintos con el número dado. 1.7 VARIACIONES SIMPLES En algunas circunstancias nos interesa ordenar o conocer la disposición de objetos cuando no se toman todos los elementos del conjunto a la vez. EJEMPLO: Cuantos números de dos cifras se pueden formar con los dígitos del 1 al 5. Evidentemente se trata de formar ordenaciones, de cinco elementos tomados de a dos y escribimos: V5.2 = 5 5 2 ! ( )!− V5.2 = 5 3 5 4 20 ! ! = =x 14
  15. 15. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ EJEMPLO: De cuántas maneras se pueden elegir y disponer en un estante 3 libros tomados de un conjunto de 10. V10.3 = 10 10 3 10 7! 10 9 8 7! 7! 720 ! ( )! ! . . . − = = = 15
  16. 16. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ 1.8 COMBINACIONES Consideremos ahora un caso importante de la combinatoria. Frecuentemente se nos presentan situaciones en las cuales al efectuar una disposición de r objetos de n elementos, no nos interesa el orden de dicha agrupación; tal tipo de agrupaciones las denominamos combinaciones de n objetos tomados de r en r. 1.8.1 DEFINICIÓN Se llaman combinaciones de orden r en un conjunto A, las partes o subconjuntos de r elementos del conjunto A. se denota por Cn.r , en general la formula es: C n.r = n rV r . ! Si reemplazamos el valor de Vn.r por n n r ! ( )!− obtenemos la formula general para calcular el número de combinaciones de n elementos tomados de r en r : Cn.r. = n r n r ! !( )!− EJEMPLO: Las combinaciones binarias de orden dos (r =2) en el conjunto A = a1, a2, a3 es: a1, a2  , a1, a3 , a2, a3  Obsérvese que si cambiamos el orden de los elementos en los subconjuntos anteriores, no obtenemos conjuntos diferentes, razón por la cual decimos que en las combinaciones no nos interesa el orden. Ahora si aplicamos las fórmulas: donde n = 3, r = 2 tenemos: 16
  17. 17. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ Cn.r = n r n r ! !( )! ! )! ! !− = − = = 3 2!(3 2 3 2!.1 3 EJEMPLO: Cuántos comités integrados por tres personas se pueden formar de un conjunto de doce personas. C12.3 = 12! 3 12 3 12! 3 9! 1320 6 220 !( )! !.− = = = comites 1.8.2 COMBINACIONES CON REPETICIÓN En el caso de combinaciones no se permite repeticiones de sus elementos. Si se trata de formar todas las combinaciones posibles, de orden r elegidas entre las n, cuando los elementos pueden repetirse, se dice que cada grupo de estos es una combinación con repetición de orden r de los n elementos. Como se trata de combinaciones, dos de ellas son distintas si difieren en algún elemento, por lo menos. Por ejemplo, sea a, b, c,  un conjunto de 3 elementos, entonces aa, ab, bc. etc. son distintas combinaciones con repetición de orden 2 de 3 elementos. La formula general para este caso es: Cn. r = [ ] ( )! ! ( ) ! n r r n r r + − + − − 1 1 EJEMPLO: Se dispone de un recipiente con cuatro tipos de arandelas, A, B, C y D, y se van a sacar muestras de 3 arandelas cada una. Cuántas muestras distintas se pueden elegir. SOLUCIÓN: Hay 4 tipos de arandelas y se van a formar grupos de 3 arandelas, donde se permite repeticiones (por ejemplo), dos grupos distintos pueden ser A A A, A B B, dos de estos grupos son distintos si difieren, al menos, en una arandela. Se trata de combinaciones con repeticiones de orden 3, de 4 elementos. O sea: 17
  18. 18. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ C4.3 = [ ] ( )! ! ( ) ! ! ! ! 4 3 1 3 4 3 1 3 6 3 3 120 6 20 + − + − − = = = Lo que nos permite decir que podemos sacar 20 muestras distintas. 1.9 TEORÍA ELEMENTAL DE LA PROBABILIDAD 1.9.1 DEFINICIÓN DE PROBABILIDAD: INTRODUCCIÓN: En el lenguaje corriente al hablar acerca de cierto suceso formamos enunciados tales como: Probablemente estudiaré ingeniería. Posiblemente me case en enero. Es muy probable que pruebe el examen. Es poco probable que gane el 2080 en la lotería del jueves. Empleamos los términos, probablemente, muy probable, poco probable muchas posibilidades, en un sentido muy vago y de ninguno de los sucesos anteriores podemos asegurar que se verifique o no. Pero tales términos los podemos utilizar para describir, aunque en forma muy vaga, nuestro “grado de creencia” en que estos sucesos se verifiquen. En efecto, podemos interpretar intuitivamente el concepto de probabilidad como una medida de la posibilidad (creencia) de ocurrencia de un suceso. Es frecuente el empleo de expresiones tales como: el suceso A tiene menor, igual o mayor probabilidad de ocurrencia que el suceso B. Pero tales afirmaciones no tendrán validez lógica mientras no podamos darle un sentido preciso al término probabilidad, de tal manera que nos permita asociarle a cada probabilidad de ocurrencia de los sucesos A y B un número real. 18
  19. 19. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ DEFINICIÓN: Dado un experimento aleatorio cualquiera, que pueda dar lugar a varios sucesos elementales igualmente posible, se define como probabilidad de un suceso E, al cociente entre el número de sucesos favorables (SF) y el número de suceso elementales posibles (SP). Que denotaremos: 19
  20. 20. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ P (E) = NumerodeSucesosElementalesFavorablesaE NumerodesucesosElementalesPosibles P (E) = SF SP Esta definición es denominada REGLA DE LAPLACE. El método para obtener una medida de un suceso se basa en experimentos aleatorios; los experimentos más sencillos son: lanzar una moneda al aire, lanzar un dado, extraer una carta, seleccionar una bola de color de una urna, extraer un número de una urna, etc. OBSERVACIONES: Es muy importante darle a entender al lector que no entiende de cartas o barajas, que en este texto trataremos de un conjunto de naipes ( Rumis) formado por 4 tipos de cartas ; diamante, trébol, rojo o corazón y negras; donde de cada carta hay 4, por ejemplo existen 4 ases, 4 jotas, 4 q, 4 cinco, etc. La probabilidad de aparición del suceso E (llamada su ocurrencia) viene dada por. P(E) = SF SP = p La probabilidad de no aparición del suceso (llamada su no ocurrencia) viene dada por g = p (no E) = 1 - P (E) = 1 - P Así, pues: p + q = 1 o P (E) + P (no E) = 1 El suceso “no E” a veces se denota por ª , , ∗ − ¬E E E 20
  21. 21. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ EJEMPLO 1: Determinar la probabilidad p de la aparición de un número impar en una tirada de un dado equilibrado. SOLUCIÓN: De los 6 casos igualmente probables (1, 2, 3, 4, 5, 6) 3 casos son favorables cuando salga: 1, 3, ó 5. Entonces: P = 3/6 = 1/2. EJEMPLO 2: La aparición de un as, el cinco de diamante o el tres de corazón en una sola extracción de una baraja de 52 cartas. SOLUCIÓN: El suceso puede ocurrir de 6 formas (uno cualquiera de los ases son 4, el cinco de diamante, y el tres de corazón) del total de 52 cartas igualmente probables. Entonces. p = 6/52 = 3/26 EJEMPLO 3. En el experimento aleatorio de lanzar una moneda al aire. Los dos sucesos elementales posibles son: que salga cara ( c ) y que salga sello (s), luego la probabilidad de cara y de sello es la misma 1/2. P ( c ) = P (s) = 1/2. NOTA: La probabilidad del suceso seguro E, P(E) es iguala a 1, y la probabilidad del suceso imposible, es igual a cero, luego entre estos dos números o valores, 0 y 1 se sitúa la probabilidad de cualquier otro suceso A. 0 < p (A) < 1 1.9.2 TEOREMAS DEL CÁLCULO DE PROBABILIDAD 1.9.2.1. PROBABILIDAD CONDICIONAL. SUCESOS INDEPENDIENTES Y DEPENDIENTES. 21
  22. 22. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ Dado un experimento aleatorio cualquiera que puede dar lugar, entre otros, a los sucesos A y B, se denomina probabilidad del suceso B condicionada al suceso A, y se representa mediante P ( B / A) y se lee probabilidad de que ocurra el suceso B sabiendo el suceso A ha ocurrido , o simplemente, probabilidad de B dado A. Si el hecho de que se haya realizado el acontecimiento A no altera, en absoluto, la probabilidad de que se realice el acontecimiento B, los sucesos A y B son llamados “Independientes” y no tiene sentido hablar de probabilidad de B condicionado A. En este caso: P (B/A) = P (B) En caso contrario, se dice que los sucesos A y B son “Dependiente” y: P (B/A) ≠ P (B) Para el cálculo de la probabilidad condicional P (B/A) se utiliza la siguiente fórmula: P (B / A ) = P B A P A ( ) ( )  , Con P(A) ≠ 0 En donde P (B  A) representa la probabilidad de que se verifique a la vez los sucesos A y B, P (A) la probabilidad de que se produzca el suceso A. P (B  A) = P ( B / A ). P (A) Por analogía con esta fórmula puede decirse que: P (A  B) = P (A / B). P (B) Pero por ser P (B /A ) = P ( A / B ) , ya que ambas expresiones indican por igual la probabilidad de que se produzca a la vez los sucesos A y B, puede escribirse indistintamente que : P (B  A) = P (A  B) = P (B / A) . P (A) = P (A / B) . P (B) 22
  23. 23. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ De este modo se obtienen dos fórmulas distintas para la probabilidad de que se verifiquen a la vez los dos sucesos A y B de un experimento aleatorio cualquiera. P (A  B) = P ( B / A ) . P ( A ) P (A  B) = P ( A / B ) . P ( B) Si A y B son independientes se tiene: P (A  B) = P (A ) . P ( B) EJEMPLO1: Sea el experimento aleatorio consiste en lanzar un dado al aire. Calcular la probabilidad de obtener un 4, sabiendo que se ha obtenido un número par. SOLUCIÓN: Sea A el suceso obtener un 4 al lanzar un dado y B el suceso de obtener un número par al lanzar un dado, luego se trata de calcular P ( A / B ). Aplicando la fórmula correspondiente se tendrá: P ( A / B ) = P A B P B conP B ( ) ( ) , ( )  ≠ 0 P (B) = 3/6, puesto que de los 6 resultados posibles, sólo 3 (2, 4, 6) son favorables al experimento considerado. P (A  B) = 1/6 ya que sólo existe un resultado favorable, de los 6 posibles, que sea al mismo tiempo número par y que coincida con el número cuatro. Por tanto: P(A/B) = P A B P B ( ) ( ) / /  = = 1 6 3 6 1 3 EJEMPLO 2. Supóngase una caja que contenga 4 bolas blancas y 3 bolas negras. Sea A el suceso de que la primera bola extraída se negra y B el suceso de que la segunda bola extraída se negra, en extracción sin remplazamiento. Aquí A y B son sucesos dependiente. 23
  24. 24. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ SOLUCIÓN: P (A) = 3 4 3 3 7+ = P ( B ) = P ( B / A ) = 2 6 , puesto que de las 3 bolas negras ya sacamos una, y de las 7 existentes han quedado 6. Luego: P (A  B) = P ( B / A ) . P ( A ) = 2 6 3 7 6 42 1 7 . = = 1.9.3. AXIOMATIZACION DE LA PROBABILIDAD. La teoría de probabilidad ha sido construida partiendo de varios axiomas como lo fue la geometría, la mecánica teórica y otras ciencias. El desarrollo axiomático de las probabilidades que ha tenido mayor aceptación es el propuesto por: Andrej N. Kolmogorov (1903, ) en 1933. Kolmogorov inicia con un conjunto U de eventos simples, o sea un espacio muestra. Luego considera una familia F de subconjunto de U los cuales denomina eventos aleatorios. Esta familia de eventos debe conformar lo que en el álgebra moderna se llama un Campo de Borel. Con cada evento A del campo de eventos F hay asociado un número, llamado la probabilidad del evento A, escrito P (A) y tal que: Axioma 1: P (A) ≥ 0 para cualquier evento A Axioma 2: P (U) = 1 Axioma 3: P ( A ∪ B ) = P (A) + P (B), si A y B son eventos mutuamente excluyentes. La terna (U, F, P) se llama espacio probabilístico y representan el modelo matemático usado para el estudio de los fenómenos aleatorios. A partir de los tres axiomas se deducen varias propiedades de las probabilidades que son útiles en la solución de problemas. P1 . P ( ∅) = 0, o sea que la probabilidad del evento imposible es cero. 24
  25. 25. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ P2. O ≤ P (A ) ≤ 1. la probabilidad es un número entre 0 y 1. P3 P ( AC ) = 1 - P (A). P4 . Si un evento A implica otro evento B, es decir, si A ⊂ B, entonces P (A) ≤ P (B). P5 . P (A1 U A2 U... Uan ) = P (A1 ) + P (A2) +...+P (An) cuando A1, A2, An son eventos mutuamente excluyentes. P6 . p ( A ∪ B ) = P (A ) + P (B ) - P (A ∩ B) Cuando A y B son eventos cualquiera. Esta probabilidad se llama regla de adición P7. P ( A - B ) = P (A) - P (A ∩B). En los ejemplos siguientes veremos cómo se aplican estas propiedades. EJEMPLO 1. Una urna contiene 6 bolas blancas, 4 rojas y 5 azules de igual tamaño, se extrae una bola al azar, cuál es la probabilidad de que esta bola sea roja? Sea R: obtener bola roja, B: obtener bola blanca y A: obtener bola azul. Entonces: P ( R ) = 4 6 4 5 4 15+ + = Cuál es la probabilidad de que la bola sea blanca o azul? P (A ∪ B ) = P (A) + P (B ), ( eventos mutuamente excluyentes) P (A ∪ B ) = 6 15 5 15 11 15 + = Cuál es la probabilidad de que la bola no sea azul? P ( AC ) = 1 - P (A) 25
  26. 26. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ P ( AC ) = 1 - 5 15 10 15 2 3 = = EJEMPLO 2. Se extrae una carta al azar de una baraja de 52 cartas (poker). Cuál es la probabilidad de obtener un As? Sea A: obtener un as. En las 52 cartas hay 4 ases, luego P (A) = 4/52 Cuál es la probabilidad de obtener un 10 ó un diamante? Sea B: obtener un diez y D: obtener un diamante. En la baraja hay 4 dieses y 13 diamantes y una de las cartas es el 10 diamante. Entonces. P (B) = 4/52, P (D) = 13/52 y P (B ∩ D) = 1/52. Por lo tanto P (B∪D) = P (B) + P (D) - P ( B∩ D) P (B∪D) = 4/52 + 13/52 - 1/52 = 16/52 EJEMPLO 3. Se lanzan dos dados una vez. Cuál es la probabilidad de obtener una suma igual a 5 con los dados? Sea C: obtener suma igual a 5. El espacio muestral es uno de los números del 2 al 12 pero estos números no ocurren con igual probabilidad. El 5 se puede obtener cuando los dados caen: (3,2), (2,3), (1,4), (1,4) esto es, se tienen 4 casos favorables al evento C entre los 36 posibles. Luego: P ( C) = 4/36. De igual manera se obtienen las probabilidades para las otras sumas. Cuál es la probabilidad de obtener una suma al menos de 9? Sea M: obtener al menos 9. P (M) = P (obtener 9 ó 10 ó 11 ó 12) P (M) = P ( 9) + P (10) + P (11)+ P (12) P (M) = 4/36 + 3/36 + 2/36 + 1/36 = 10/36 26
  27. 27. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ EJEMPLO 4; Un envío de 12 cajas con drogas contienen 3 cajas alteradas. Cuál es la probabilidad de obtener una caja alterada al tomar al azar 7 cajas de las 12? Llamaremos H dicho evento. No es fácil resolver este problema si queremos calcular directamente el número de casos favorables y posibles. En caso como éste, es recomendable acudir a la teoría del análisis Combinatorio: entonces razonamos así: el número de casos posibles es el número de combinaciones de 12 cajas tomas 7 a la vez, es decir C12.7, las cajas alteradas pueden seleccionarse entre las 3 alteradas en C3.1 formas y las 6 restantes pueden seleccionarse entre las 9 no alteradas en C9.6 formas. Por principio fundamental, tenemos que el número de casos favorables es C3.1 C9.6. Luego: P(H) = 3 1 9 6 12 7 . . . C C C Aplicando la fórmula de combinaciones: Cn. r = n r n r ! !( )!− C3.1 = 3 1 3 1 3 ! !( )!− = C9.6 = 9! 6 9 6 84 !( )!− = C12.7 = 12! 7!(12 7 792 − = )! Luego: P(H) = ( )( )3 84 792 7 22 = EJEMPLO 5. La siguiente tabla muestra al personal (animales) de un zoológico, tabulados por edad. 27
  28. 28. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ ANIMALES X ≤ 25 Y 26- 30 Z 31 -35 W >35 TOTAL Águilas 0 5 25 75 105 Búfalo 20 30 35 35 120 Caballo 3 6 6 10 25 Delfín 7 15 8 12 42 Elefante 200 375 442 203 1220 Faisán 1 12 8 3 24 Gacela 4 10 19 12 45 Hipopótamo 5 25 15 10 55 Ibis 20 35 50 25 130 28
  29. 29. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ Totales 260 513 608 385 1766 29
  30. 30. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ Con los datos de la tabla podemos determinar: a) Las águilas que tienen más de 35 años: N (A ∩ W) = 75 b.) B ∪ Y, Consiste en los animales búfalos o los animales que están entre las edades de 26 y 30 o ambos, luego : N ( B ∪ Y ) = B + Y - ( B ∩ Y) = 120 +513 - 30 = 603. Es de anotar se resto el 30 quienes son animales que ya han sido contados puesto que están incluidos en el número 120 como el 513. c) Supóngase se elige un animal al azar dentro de todos que se representan, cuál es la probabilidad de que este animal tenga 25 años de edad o sea más joven? P ( X) = n X n U ( ) ( ) . .= = = 260 1766 0147 015 d) Cuál es la probabilidad de que un animal sea águila, dado que se elige al azar del conjunto de animales que tienen más de 35 años. P ( A / W ) = n A W n W ( ) ( ) .  = = 75 385 019 e.) Cuál es la probabilidad de que un animal sea águila y de 25 años de edad o menos?. Son eventos mutuamente exclusivos, puesto que: A ∩ X = O, luego: P( A ∪ X ) = P (A) + P (X) = 105 1766 260 1766 0059 0147 0206 021+ = + = =. . . . f) Cuál es la probabilidad de que un animal elegido al azar de todos los animales sea tanto elefante como tener una edad comprendida entre 31 - 35 años P (E ∩ Z ) = P (Z) . p (E/Z) = (608 / 1766) . (442 /608) = ( 0.34 ) ( 0.73) = 0.25 30
  31. 31. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ PROBLEMAS SOBRE LA UNIDAD 1.0 1.1 Hallar el valor de: a) 7p3 , 9p2 , 8p3 , 6p1 , 10p3 , 4p4 b.) 8C4, 4C4, 6C1, 9C3, 5C3, 5C3, 10C4. NOTA: ( nCr = C n.r). 1.2 Calcular el número de permutaciones que se pueden formar con las letras de la palabra matemáticas. 1. 3 De cuántas maneras puede formarse un equipo de fútbol de entre un grupo de 12 voluntarios? 1.4 De cuántas formas pueden ordenarse 6 libros en un estante, si: a) No se da ninguna restricción b) 2 libros determinados deben estar juntos. c.) Un libro determinado debe estar en el extremo izquierdo. 1.5 De un total de 5 Químicos y 7 Biólogos, se forman un comité de 2 Químicos y 3 Biólogos. De cuántas formas pueden formarse, si : a.) puede pertenecer a él cualquier químico y biólogo b.) un biólogo determinado debe pertenecer al comité? c.) Dos biólogos determinados no pueden estar en el comité 1.6 Un conductor de terapia de grupos en una clínica de enfermos mentales tiene 10 pacientes de los cuales debe formar un grupo de 6. Cuantas combinaciones de pacientes son posibles? 1.7 Un educador en asuntos sanitarios tiene 3 carteles para exhibir uno junto al otro en la pared del vestíbulo de un centro de salud. En cuántas formas diferentes los puede disponer? 1.8 Supóngase que en cierto laboratorio se tiene 4 trabajos que deben realizarse en una tarde particular y existen 5 personas para llevarlos a cabo. En cuántas formas pueden asignarse las 5 personas a los 4 trabajos? 31
  32. 32. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ 1.9 Un investigador tiene 4 medicamentos que desea poner a prueba, pero sólo cuenta con los suficientes animales experimentales para probar a 3 de los medicamentos. Cuántas combinaciones de medicamentos pueden poner a prueba. 1.10 Ocho animales experimentales han sido inoculados con cierta droga; tres con tipo A, tres con tipo B y dos con tipo C. Cada animal debe colocarse en una de las ocho jaulas adyacentes para su observación. Si los animales sólo se distinguen con base en el tipo que recibieron, cuántos arreglos diferentes son posibles?. 1.11 De una baraja de póquer, cuántas manos de 5 cartas cada una se puede sacar? 1.12 Un dado normal se lanza dos veces. Determinar la probabilidad de obtener un seis en ambos lanzamientos. 1.13 Una urna contiene una bola blanca y una bola negra. Se extrae una cada vez sin reposición. Determinar la probabilidad de que la primera bola sea blanca y la segunda negra. 1.14 Una urna contiene seis bolas negras y cuatro blancas. Se extrae sin reposición dos bolas, una a una. Determinar la probabilidad de seleccionar una bola blanca en la primera extracción y una bola negra en la segunda. 1.15 Determinar la probabilidad de que todas las cuatros cartas extraídas aleatoriamente y sin reposición de una baraja de 52 resulten aseas. 1.16 En una ciudad de 10.000 electores el 50% son liberales y el 50% son conservadores. Si se seleccionan dos electores aleatoriamente cuál es la probabilidad de que ambos sean liberales?. 1.17 Supóngase que P (A) = ½ y P (B) = ¼, encontrar p ( AB ) si: a.) A y B son independiente b.) A y B son mutuamente excluyentes. 1.18 Si la P (A) = 1/3, P (B) = ¼ y P (A/B) = 1/2, en contar P ( A + B) 32
  33. 33. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ 1.19 A y B juegan 12 partidas de ajedrez, de los cuales A gana 6 veces, B gana 4 y 2 terminan en tabla. Acuerdan jugar un torneo consistente en 3 partidas. Hallar la probabilidad de que: a.) A gane 3 partidas b.) D os partidas terminan en tabla c.) A y B ganen alternativamente. d.) B gane al menos un partida 1.20 Se extrae una bola al azar de una caja que contiene 10 rojas, 30 blancas, 20 azules y 15 naranjadas. Hallar la probabilidad de que: a) sea naranja o roja b) no roja o azul c.) no azul d.) blanca e ) roja, blanca o azul 1.21 Un pescador atrapa 10 peces, 3 de los cuales son más pequeños que los permitidos por la ley. Un policía se le acerca y examina la pesca, pero mirando 2 peces solamente elegidos al azar. Cuál es la probabilidad de que el pescador sea multado? 1.22 De acuerdo con la tabla del ejemplo 5 de la presente unidad, calcular a.) P (F ∩ W), P ( H / Z ) , P ( G ∪ C ) , P (I /Y) 1.23 Un joven tiene en su bolsillo una moneda de 10 centavos, una de 20, una de 25, una de 50 y otra de un peso. Al sacar simultáneamente dos monedas que posibilidad existe que: a.) El joven saque menos de 80 centavos b.) Saque más de 50 centavos c.) Saque al menos 10 centavos 1.24 La siguiente tabla muestra la distribución de un grupo de personas: SEXO GRUPO SANGUÍNEO MASCULINO FEMENINO TOTAL 0 113 113 226 A 103 123 226 B 40 37 77 33
  34. 34. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ AB 30 20 50 Total 286 293 579 Para este grupo calcular: a) La probabilidad de que un paciente elegido al azar sea femenino. b.) Sea femenino o Masculino c) Sea masculino y de grupo B. d.) Sea femenino de grupo A. e) La probabilidad de que un paciente sea elegido de grupo AB f.) De que un paciente sea elegido de los masculinos, dado que es grupo O. 1.25. Supongamos que la probabilidad de nacer varón es 0.51 y que se estudia familias con tres hijos. Se elige al azar una familia, hallar la siguiente probabilidad: a.) Que todos sean varones. b) Que uno de los hijos sea mujer c.) Que todos sean mujeres. Asuma que hay independencia entre los nacimientos 1.26 Se lanzan 2 dados. Determinar la probabilidad que : a.) La suma de los puntos sea 8 b) La suma de los puntos es menor que 5. c) La suma sea mayor que 12. 1.27 En un paquete hay 9 semillas de las cuales 2 producen flores blancas, 3 producen flores rojas y 4 producen flores amarillas. Se extraen al azar dos semillas y se siembra. Calcular la probabilidad de que : a.) Ambas produzcan flores blancas. b) Una produzca flor blanca y la otra roja c. ) Ambas produzcan flores del mismo color. 1.28 Un club de señorita tiene 120 socias con las siguientes características: 34
  35. 35. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ 35
  36. 36. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ COLOR DE OJOS RUBIAS TRIGUEÑAS MORENAS PELIROJAS Azul 8 4 8 7 Café 5 18 20 6 Verde 9 23 8 16 Un apuesto joven llama al club y concreta una cita con una de ellas para ir al concierto. Calcular la probabilidad de que la señorita: a.) Sea trigueña y de ojos verde. b.) Sea pelirroja c.) Sea morena y de ojos café o verde d.) Sea rubia y de ojos azules e.) Sea rubia o morena sabiendo que tiene ojos verde. 1.29 Una rata debe atravesar un laberinto de tres secciones como se ve en la figura. En la primera sección hay dos caminos, uno de ellos con comida. En la segunda hay tres caminos y al pasar por uno de ellos la rata recibe un choque eléctrico. La tercera sección consta de cuatro caminos y en un de ellos también encuentra comida. Calcule la probabilidad de que la rata atraviese el laberinto comiendo dos veces y sin sufrir un choque eléctrico Comida Choque Comida 1.30 Empíricamente se ha estimado que la probabilidad de que germine una semilla de Olmo Americano es 0.63 y de que germine una semilla de Abeto es 0.56. Si se siembra una semilla de olmo y otra de Abeto. Calcular la probabilidad de que : a.) Germine al menos una de ellas b.) no germine ninguna c.) Germine la semilla de olmo y no la de abeto. 36
  37. 37. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ 1.31 El 60% del ganado de una región fue vacunado contra un tipo especial de enfermedad. La probabilidad que tiene un animal de recuperarse es 1 en 5 si fue vacunado y de 1 en 20 si no fue vacunado. Un animal tomado al azar estaba enfermo pero se recupero. Calcular la probabilidad de que éste animal haya sido vacunado. 1.32 Se tienen dos lápices uno blanco y otro negro, las caras de ellos están numeradas 1, 2, 3, 4. Se hecha a rodar al piso para leer sus caras superiores. a.) Establezca el espacio muestra b.) Determine la probabilidad de que la cara superior de los lápices sea una suma de 1 ó 3 c.) La suma de sus caras sea 4. d.) La suma de sus caras sea un número par e.) La suma de sus caras sea un número impar 37
  38. 38. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ UNIDAD 2.0 DISTRIBUCIÓN DE PROBABILIDAD OBJETIVO DE LA UNIDAD: Desarrollar una comprensión del concepto de esperanza matemática y sus aplicaciones en la toma de decisiones y mostrar cómo ciertos tipos de datos pueden ser representados por tipos particulares de modelos matemáticos. CONTENIDOS 2.1 Variables Aleatorias 2.2 Esperanza Matemática 2.3 Distribuciones de Probabilidades 2.3.1 Poisson 2.3.2 Binomial 2.3.3 Normal Ejercicios 38
  39. 39. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ 2.1. VARIABLES ALEATORIAS Es también llamada variable ESTOCASTICA y es una variable estadística que asume cada uno de sus valores numéricos posibles con una probabilidad definida. Siempre que se determina la estatura, el peso o la edad de un individuo, con frecuencia se dice que el resultado es un valor de la variable respectiva. Cuando los valores obtenidos son el resultado de factores fortuitos, se dice que la variable es una variable aleatoria. Frecuentemente se da el nombre de observaciones o, simplemente, el de medidas a los valores que resultan de procedimientos de medición. Los valores de las variables aleatorias difieren porque en su observación escapan a nuestro control las diferencias casuales. Los siguientes son algunos ejemplos de variables aleatorias: 2.1.1. La velocidad de una molécula de gas, Varían en cada choque molecular y cada choque, a su vez, depende de muchos factores. 2.1.2. El número de meteoritos que penetran en la atmósfera y alcanzan la superficie terrestre. Siempre es variable debido a factores de carácter aleatorios. 2.1.3. El peso de los gramos de café cultivados en determinada región. Es variable en virtud de numerosos factores, tales como calidad del suelo y semilla, riego, condiciones ambientales etc. 2.1.4. Momento en que se presenta las desintegraciones atómicas. Estos momentos se presentan al azar y son independientes entre sí. 2.1.5. Número de llamadas a una central telefónica durante un año. 2.2. ESPERANZA MATEMÁTICA 39
  40. 40. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ La esperanza matemática de una variable aleatoria, es llamada comúnmente valor medio, valor esperado, o media, se define como una media ponderada de la población en donde las ponderaciones son las probabilidades de los valores de la variable aleatoria. En otras palabras, la esperanza matemática es un promedio probabilistico de los valores de la variable aleatoria. Si P es la probabilidad de que una persona reciba una suma de dinero s, la esperanza matemática o simplemente la esperanza, se define como: ps. Si X representa una variable aleatoria discreta que puede tomas los valores X1, X2, X3 ,....,Xk con probabilidades respectivas p1 , p2, p3 , .. .pK, donde P1 + P2 , P3 , +... + PK = 1, la esperanza de X simbolizada por E (X), se define como: E ( x ) = P1 X1 + P2 X2 + P3 X3 +... +PK XK = j j j k p x px= ∑∑= 1 Si las probabilidades pj en esta esperanza se sustituyen por las frecuencias relativas fj / N, donde N =Σfj, la esperanza se reduce a (ΣFX)/N, que es la media aritmética ( X _ _ ). Cuando N crece, las frecuencias relativas Fj / N se aproximan a las probabilidades pj . Esto conduce a interpretar que E (X) representa la media de la población de la que se ha extraído la muestra. Si se denota por X _ _ la media de la muestra, la media de la población vendrá representa por la correspondiente letra griega ( µ ). La esperanza también puede definirse para variables aleatorias continuas, pero la definición no requiere la utilización de cálculo avanzado. EJEMPLO 1: Si la probabilidad de que una persona gane un premio de $ 450.000 es 0.5 su esperanza es (0.5) (450.000) = 225.000. EJEMPLO 2: Si un hombre compra una boleta de rifa, en la que puede ganar un primer premio de $ 70.000. ó un segundo premio de $ 40.000 con posibilidades 0.002 y 0.005 respectivamente. cuál es el precio justo a pagar por la boleta de rifa . 40
  41. 41. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ E (X) = ( 70.000) (0.002) + (40.000) ( 0.005 ) = $ 140 + $ 200 = $340. Luego el precio justo a pagar por la boleta de rifa es de $ 340. EJEMPLO 3: Una Compañía de seguros piensa asegurar un carro en $ 800.000. La compañía estima que puede haber un pérdida total del vehículo con una probabilidad de 0.009, daños en el 50% del vehículo con una probabilidad de 0.030 y daños en un 25% del vehículo con una probabilidad de 0.07. Cuánto debe cobrar la compañía por una póliza de este tipo si desea ganar $ 2.500? E (X) = (800.000) (0.009) + ( 400.000) (0.030 ) + (200.000) (0.07) = 7.200 + 12.000 + 14.000 = $ 33.200. La compañía de seguros deberá cobrar $ 33.200 + 2.500 = 35.700 Por la póliza para asegurar la ganancia programada. 2.3. DISTRIBUCIÓN DE PROBABILIDADES Cuando a una variable aleatoria se asocia la probabilidad, de tal manera que a cada valor de la variable le corresponde su respectiva probabilidad, se ha determinado una “distribución de probabilidad “. Puesto que toda variable aleatoria tiene una distribución de probabilidades, diremos que las variables aleatorias discretas tienen distribuciones discretas de probabilidades y las variables aleatorias continuas tienen distribución continua de probabilidades. Entre las distribuciones de probabilidades, algunas son tan conocidas y usuales que tienen nombre propio. por ejemplo, las distribución binominal, la distribución de Poisson, la distribución Hipergeometrica, la distribución geométrica, la distribución binominal negativa. etc. entre las discretas. Entre las distribuciones continuas tenemos la distribución Normal, la distribución Exponencial, la distribución Gamma, la distribución Beta, la distribución Uniforme, etc. A continuación veremos las distribuciones de probabilidades de uso más generalizado, como: binominal, normal y de poisson. 41
  42. 42. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ 2.3.1 LA DISTRIBUCIÓN BINOMIAL Nos permite determinar la probabilidad de que un suceso se presente exactamente x veces en repetidos ensayos. Es una de las distribuciones de probabilidad que se encuentra con más frecuencia en la estadística aplicada. Se obtiene de un procesos conocido como ensayo de BERNOULLI, en honor del matemático suizo JAMES BERNOULLI (1654-1705), quien realizo importantes contribuciones en el campo de la probabilidad incluyendo, en particular a la distribución Binomial. Cuando un solo ensayo de algún proceso o experimento puede concluir sólo a uno de los resultados mutuamente exclusivos, tales como muerto o vivo, enfermo o saludable, masculino o femenino, el ensayo se conoce como ensayo Bernoulli. Para la aplicación de la distribución binomial se deben tener en cuenta los siguientes criterios. 2.3.1.1.-Debe existir un número exacto de pruebas repetidas. Este número corresponde a los N ensayos. 2.3.1.2.-Cada prueba realizada debe tener dos posibilidades de resultados (cara o sello ). por eso es binomial. 2.3.1.3.-La probabilidad de éxito ( p ) en un solo ensayo es un único número. Este determina la probabilidad de fallo o fracaso ( 1 - p ) denota por ( q ) donde q = 1 - p . 6.3.1.4.-Cada prueba o ensayo realizado es independiente de los demás. 2.3.1.5.-Se trata de determinar la probabilidad de éxito, exactamente, x ensayos o pruebas. Si p es la probabilidad de ocurrencia de un suceso en un solo ensayo (llamada probabilidad de éxito ) y q = 1 - p es probabilidad de que el suceso no ocurra en un solo ensayo ( llamada probabilidad de fallo ), entonces la probabilidad de que el suceso se presente exactamente X veces en N ensayos ( es decir , X éxitos y N - X fallos ) viene dado por : 42
  43. 43. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ P(X) = N CX . PX .qN - X = N X N X X N X P q ! !( )!− − Donde X = O,1, 2,...,N y N! = N (N - 1) ( N - 2 )..... 1 Se llama distribución binomial, puesto que para X = 0, 1, 2,. . ., N, corresponde sucesivo términos de la fórmula binomial o desarrollo binomial: (q + p ) N = qN + N C1 qN-1 p + N C2 qN-2 p2 +...+pN Donde 1, N C1 , N C2 son los coeficientes binominales 2.3.1.5 ALGUNAS PROPIEDADES DE LA DISTRIBUCIÓN BINOMIAL. Media µ = NP Varianza S2 = NPq Desviación Típica S = Npq Coeficiente de sesgo α3 = q p Npq − Coeficiente de curtosis α4 = 3 + 1 6− pq Npq EJEMPLO1: La probabilidad de obtener exactamente 3 caras en 7 lanzamientos de una moneda es: P ( x = 3 ) = 7 C3 (1/2)3 (1/2)7-3 = 7! 3 4! 5040 6 16 1 128 0 41 7 1 2!. ( )( ) . .( / ) = = EJEMPLO 2. la probabilidad de obtener al menos 4 cara en 6 lanzamiento de una moneda es : p ( x = 4 ) + (p (x = 5 ) + ( p (x = 6) = 6 C 4 (1/2)4 (1/2)6-4 + 6 C 5 (1/2)5 (1/2)6-5 + 6 C 6 (1/2)6 (1/2)6-6 = 15 64 6 64 1 64 22 64 0 34+ + = = . 43
  44. 44. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ EJEMPLO 3. Se inyecta una droga tóxica a 5 conejos. Se sabe que la droga es mortífera en un 70% de los casos, cuál es la probabilidad de que mueran 3 de los 5 conejos? En este caso: N = 5 , X = 3, P = 0.7 , q = 0.3 luego : P (X = 3) = 5 C 3 ( 0.7)3 (0.3)2 = 0.3087 Cuando la función binomial es P ( X ≤ r ) = x o r = ∑ N C X pX qN - X Dicha función está tabulada para diferentes valores de N y P, y se conoce como tabla de la distribución binomial. Mediante el siguiente ejemplo veremos como se maneja dicha tabla. EJEMPLO 1. Por estudios hechos anteriormente se sabe que 25 de cada 100 personas de una población pertenecen al grupo sanguíneo B. Cuál es la probabilidad de que máximo 5 de 20 donantes tomados al azar tengan sangre tipo B? Los parámetros son N = 20 y p = 0.25 entonces: P(máximo 5 con sangre tipo B) = P(5 o menos) = P( X ≤ 5) P (X ≤ 5) = P( X = 0 ) + P( X=1 ) + P( X = 2) + P(X=3) + P (X=4 ) + P( X=5 ). El cálculo de esta suma es larga y engorroso. Afortunadamente disponemos de tablas de la distribución binomial en donde encontraremos que para N = 20, r = 5 y P = 0.25: la suma vale 0.6172 luego: P ( X ≤ 5 ) = 61.72% b.) Cuál es la probabilidad de que al menos 3 de los 20 donantes tengan sangre tipo B ?. 44
  45. 45. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ P ( 3 o Más) = P ( X ≥ 3 ) = 1 - P ( X ∠ 3) = 1 - P (X ≤ 2) = 1 - 0.0913 = 0.9087 Debemos tener presente que la tabla da únicamente sumas o valores acumulados de la forma p ( X ≤ r ). Cualquier otra expresión que se tenga, debe transformarse en ésta antes de buscar los valores en la tabla. c.) Cuál es la probabilidad de que exactamente 3 de los 20 donantes tenga sangre tipo B ?. P ( X = 3 ) = P( X ≤ 3 ) - P( X ≤ 2 ) = 0.2252 - 0.0913 = 0.1339 = 13.39% La distribución binomial se encuentra tabulada para valores de N menores que 30 y unos pocos valores de P. cuando N es muy grande y P es pequeño, o en general cuando los valores no se encuentran en la tabla, los cálculos deben hacerse con una calculadora, o también aproximando el resultado mediante la distribución de poisson. 2.3.2. DISTRIBUCIÓN DE POISSON Otro modelo probabilístico discreto de gran utilidad en estadística es este modelo, ideado por el francés SIMEON DENIS POISSON (1781, 1840) y publicado en 1837. Esta distribución ha sido usada para describir el comportamiento de eventos raros por la que se le llama también “ ley de los eventos improbables”. 45
  46. 46. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ El modelo de poisson sirve para describir una serie de fenómenos cuyos eventos se presentan como resultados al azar ya sea en el tiempo, en el espacio o el volumen. Algunos ejemplos de estos resultados pueden ser el número de : accidente de tránsito durante un período de tiempo dado, personas con enfermedades raras que llegan mensualmente a un hospital, llamadas telefónicas recibidas por una central cada minuto, partículas emitidas por segundo por una sustancia radiactiva, glóbulos rojos por volumen en una muestra de sangre, barcos que llegan semanalmente a un puerto, defectos por m2 de tela , pétalos adicionales en flores que tienen 5 pétalos normales, etc. este numero varían aleatoriamente con el tamaño de la muestra o con el intervalo de tiempo considerado. Las características comunes a estos fenómenos que nos permite reconocerlos como fenómenos poissonianos son : 2.3.2.1. Las ocurrencias de los eventos en intervalos no traslapados son independientes. 2.3.2.2. La probabilidad de ocurrencia de un solo evento en un intervalo o espacio pequeño es pequeña y es proporcional al tamaño del intervalo o espacio considerado. 2.3.2.3. La probabilidad de dos o más ocurrencia del evento en un intervalo o espacio pequeño es despreciable o se supone igual a cero. Una particularidad interesante de la distribución de poisson es el hecho de que la media y la varianza son iguales. La función de densidad de poisson viene dada por la siguiente fórmula : P (X) = X e X λ λ− ! , con X = 0, 1, 2,... donde la letra griega λ (lambda ) se llama parámetro de la distribución y es el número promedio de ocurrencia del evento aleatorio en el intervalo. El símbolo e = 2.71828. Los valores de p (x) pueden calcularse mediante una tabla que da los valores de e-λ para distintos valores de λ o mediante logaritmo. 46
  47. 47. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ 2.3.2.1 ALGUNAS PROPIEDADES DE LA DISTRIBUCIÓN DE POISSÓN Media µ = λ Varianza S2 = λ Desviación S = λ Coeficiente de sesgo α3 = 1/ λ Coeficiente de curtosis α4 = 3 + 1/λ EJEMPLO 1.Un cátodo emite electrones a una rata promedio de 1013 electrones por segundo. Hallar la probabilidad de que no se emita ningún electrón durante un intervalo de 1 segundo. P (0) = ( ) ( ) ( ) ( ) 13 0 10 13 13 13 10 0 10 1 10 e e e − − = = ! EJEMPLO 2. Los registros del hospital revelan que, durante este período, las Administraciones de emergencia han sido, en promedio, de 3 por día. Encontrar la probabilidad de que: a.) En un día dado, ocurran exactamente dos admisiones de emergencia. P (X = 2) = 2 3 3 2! 0 224 − =e . b.) En un día particular, no ocurra admisión de emergencia alguna. P (X = 0 ) = 0 3 3 0 0 05 − =e ! . 47
  48. 48. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ c.) En un día particular sean administración tres ó cuatro casos de emergencia. P (X = 3 ) + P (X = 4 ) = 3 3 4 3 3 3 3 4! 0 224 0168 0 39 − − + = + =e e ! . . . EJEMPLO 3.En un estudio de cierto organismo acuático, se tomaron gran número de muestra de un estanque y se contó el número de organismos que había en cada muestra. Se encontró que el número promedio organismo por muestra era de dos. Suponiendo que el número de organismo está distribuido según poisson, encontrar la probabilidad de que: a. La siguiente muestra que se toma tenga uno o más organismos. P ( X ≥ 1) = 1 - P ( X = O ) En la tabla se ve que, cuando λ = 2 la probabilidad de que X = 0 es de 0.1553. Por lo tanto P ( X ≥ 1) = 1 - 0.1353 = 0.865 b. La siguiente muestra que se toma tenga exactamente 3 organismos. P ( X = 3 ) = P (X ≤ 3 ) - P ( X ≤ 2 ) = 0.8571 - 0.6767 = 0.18 2.3.3. DISTRIBUCIÓN NORMAL Entre las distribuciones continuas de probabilidades, la distribución normal es la más conocida, usual y útil en Estadística. Esta distribución fue descubierta por ABRAHANADE MIVRE (1667, 1754) un protestante francés que debió huir a Londres, y quien, en 1733 encontró la distribución normal como el límite de la distribución binomial cuando N tiende a infinito. También 48
  49. 49. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ se atribuye la paternidad de la distribución normal a LAPLACE (1749 , 1827 ) y a GAUSS ( 1777, 1855 ) por lo que se dice a veces distribución gaussiana en vez de distribución normal. El hecho es que, históricamente, la distribución la distribución normal está relacionada con la teoría de errores en la medición, teoría fundada por Gauss y Laplace en una fecha posterior a la investigación de Moivre. La distribución normal es un modelo probabilístico apropiado para el estudio de muchas variables aleatorias continuas tales como la estatura de los estudiantes de una universidad, el peso de objetos de una misma naturaleza, el contenido en volumen de un frasco de jarabe, los errores en la medición de una misma magnitud física, el diámetro de alguna parte para ensamblaje, la duración de las baterías y bombillas, etc. La densidad normal está dada por: y s sX e= − −1 2 1 2 2 2 π µ( ) / Donde µ es la media, S desviación típica, π = 3.14159 2.3.3.1. REPRESENTACIÓN GRÁFICA Gráficamente la distribución normal se representa mediante una curva en forma de campana, llamada curva de probabilidad, campana de Gauss o curva de error. El área bajo la curva normal es igual a uno (1) ó al 100%. La media (µ) se encuentra localizada en el centro (punto medio de x) y divide la curva en dos sectores iguales, es decir, la curva es simétrica respecto a su media. El área bajo la curva normal entre dos ordenadas X = a y X = b, siendo a ∠ b, representa la probabilidad de que x se encuentre entre a y b lo cual se denota por p ( a ∠ x ∠ b ). 50% 49
  50. 50. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ Z X µ Z Z1 Z2 X µ a b 2.3.3.2. TIPIFICACIÓN DE DATOS Para hallar el área bajo la curva normal se introduce una nueva variante estadística (Z ), es decir, se hace necesario, tificar o estandarizar la variable X cuando X viene expresada en unidades de desviación. La tipificación de datos se efectúa mediante la aplicación de la siguiente fórmula Z X S = − µ La anterior fórmula antes expuesta para la densidad normal quedará reducida así: Z X S = − µ y Z e= −1 2 1 2 2 π 50
  51. 51. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ Las áreas bajo la curva normal, para los diferentes valores de Z, se encuentran en una tabla normal típica de 0 a z. 2.3.3.3. PROPIEDADES DE LA DISTRIBUCIÓN NORMAL 2.3.3.3.1.-Los términos tienden a agruparse alrededor del puntaje cero . Esto quiere decir que a medida que los términos se apartan del eje vertical, la curva decrece. 2.3.3.3.2.-La curva normal es simétrica respecto a su eje vertical. La altura de la curva para Z = a, exactamente igual a la altura para Z = - a. 2.3.3.3.3 Los extremos de la campana son asíntotas, lo cual significa que por más que se prolonguen nunca se intersectan con el eje horizontal 2.3.3.3.4 La media se localiza en el puntaje Z = O, ya que es el punto de equilibrio de la distribución Según la propiedad de simetría, el eje vertical divide exactamente por la mitad el área bajo la curva, o sea que la mitad de los términos se ubica a cada lado de la vertical. Allí se localiza, por tanto, la mediana. 51
  52. 52. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ La moda se sitúa en el máximo de la curva, que es el punto correspondiente al puntaje Z = 0 Media µ = NP Varianza S2 = Npq Desviación típica S = √ NPq Coeficiente de sesgo α3 = 0 Coeficiente se curtosis α4 = 3 Desviación media S = 2 π = 0,79795 EJEMPLOS 1: 1. Determinar el área bajo la curva normal entre Z = -1 y Z = 1, Z = -2 y Z = +2, Z= -3 y Z = +3. SOLUCIÓN: Área para Z = 1 es 0.3413 (según tabla) Área para Z = -1 es 0.3413 Área total 0.6826 que equivale a 68.26% Área para Z = 2 es 0.4772 Área para Z =-2 es 0.4772 Área total 0.9544 que equivale a 95.4% Área para Z = 3 = 0.4987 Área para Z= 3= 0.4987 Área total 0.9974 que equivale a 99.74% Un gráfico de esta curva normal tipificada es: 52
  53. 53. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ -3 -2 -1 0 1 2 3 68.26% 95.44% 99.74% EJEMPLO 2. Un físicoterapeuta nota que las calificaciones que se obtienen en cierta prueba de habilidad manual están distribuidas aproximadamente en forma normal, con una media de 10 y una desviación estándar de 2.5 si un individuo elegido al azar realiza la prueba, cuál es la probabilidad de que obtenga una calificación de 15 o más? SOLUCIÓN: Tracemos el área correspondiente a esta distribución y sombreémosla, S µ=10 15 En este caso X = 15, µ = 10 y S = 2.5, por lo tanto aplicamos: Z X S = − = − = µ 15 10 2 5 2 . Luego el área para Z = 2 es: 53
  54. 54. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ P (X ≥ 15) = P (Z ≥ 2) = 0.5 - 0.4772 = 0. 0228 EJEMPLO 3.Supóngase que se sabe que los pesos de cierto grupo de individuos están distribuidos aproximadamente en forma normal con una media de 70 Kg. y una desviación estándar de 12.5 Kg. Cuál es la probabilidad de que una persona elegida al azar de este grupo pese entre 50 y 85 Kg? SOLUCIÓN: P (50 ≤ X ≤ 85) = P Z 50 70 12 5 85 70 12 5 − ≤ ≤ −      . . = P( -1.6 ≤ Z ≤ 1.2 ) = P( -1 .6 ≤ Z ≤ O ) + P ( O ≤ Z ≤ 1.2) = 0.4452 + 0.3849 = 0.8301 2.4.- RELACIÓN ENTRE LAS DISTRIBUCIONES BINOMIAL Y NORMAL Si N es grande y ni p ni q están muy próximo a cero, la distribución binomial puede aproximarse estrechamente a la distribución normal con variable tipificada por: Z X NP NPq = − La aproximación es tanto mejor conforme aumenta N, y en el límite es total . Esto se ve claramente en las propiedades de las distribuciones que al aumentar N, el sesgo y la curtosis de la distribución Binomial se aproximan a los de la distribución Normal. En la práctica, la aproximación es muy buena si ambos Np y Nq son superiores a 5. 2.5 RELACIÓN ENTRE LAS DISTRIBUCIONES BINOMIAL Y DE POISSON 54
  55. 55. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ En la distribución binomial, si N es grande, mientras que la probabilidad P de ocurrencia de un suceso está cerca de cero, de modo que q = (1 - p) está cerca de 1, el suceso recibe el nombre de “raro “. En la práctica se puede considerar un suceso como raro si el número de repeticiones del experimento (ensayos) es al menos 50 (N ≥ 50) mientras que Np es menor que 5. En tales caso la distribución binomial se aproxima mucho a la distribución de poisson con λ = Np. Esto se ve comparado las dos propiedades de cada una de las distribuciones y sustituyendo λ = Np, q ≅ 1 y p ≅ 0. Puesto que existe una relación entre las distribuciones binomial y normal, se deduce que hay también una relación entre las distribuciones de poisson y normal. Puede en efecto ponerse de manifiesto que la distribución de poisson se aproxima ala normal con variable tipificada. X − λ λ Cuando λ crece indefinidamente. 55
  56. 56. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ PROBLEMAS SOBRE LA UNIDAD 2.0 2.1 Responda las preguntas siguientes: a.) Que se entiende por distribución de probabilidades de una variable aleatoria? b.) Cómo se diferencian las variables aleatorias discretas de las continuas? c.) Qué es una variable aleatoria ? d.) Pueden estudiar las probabilidades sin necesidad del concepto de variable aleatoria ?. Discuta su respuesta. ESPERANZA MATEMÁTICA 2.2 En un negocio determinado un hombre puede tener un beneficio de $ 379.000 con probabilidad 0.6 o una pérdida de $ 120.000 con probabilidad 0.4. Determinar su esperanza. 2.3 Hallar ( a ) E ( X ), ( b ) E ( X2 ), ( c) E X X( __ )−         2 para la siguiente distribución de probabilidad. X : 9 14 16 23 37 P ( X) : 1/7 1/5 4/5 3/7 1/9 2.4 Cual es precio justo a pagar para entrar en un juego en el que uno puede pagar $ 5.000 con probabilidad de 0.4 y $ 3.500 con probabilidad de 0.6. 2.5 Si llueve, un vendedor de paraguas puede ganar $ 130.000 por día. Si no llueve, puede perder $ 56.000 por día, cual es su esperanza matemática si la probabilidad de lluvia es 0.4. 56
  57. 57. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ 2.6 Se ha estimado que siguiendo cierta dieta y cierto tipo de ejercicios, una persona robusta pierde 1.0 kg de su peso por semana con probabilidad 1/2, pierde 1.5 kg con probabilidad 1/4, pierde 2.0 kg con probabilidad 1/6 y pierde 2.5 kg con probabilidad 1/12. Halle la pérdida de peso esperada por semana para una persona sometida a dicha dieta. 2.7 Una lotería del país vende 10.000 billetes cada uno de 100 fracciones a un costo de $ 200 por fracción. Cada fracción ganadora recibe un premio de $ 300.000. Si una persona acostumbra comprar una fracción de esta lotería, cuánto espera ganar en promedio semanal? DISTRIBUCIÓN BINOMIAL 2.8 Un vendedor de seguros vende póliza a 5 hombres, todos de las misma edad y con buena salud. De acuerdo con las tablas actuariales, la probabilidad de que un hombre de esta edad viva 30 años más es 2/3. Hallar la probabilidad de que a los 30 años vivan: a.) Los 5 hombres, b.) Al menos 3 c.) Solamente 2 d.) Al menos 1. 2.9 Supóngase que el 24 por ciento de cierta población tiene el grupo sanguíneo B. Para una muestra de tamaño 20 extraída de una población, encontrar la probabilidad de que: a.) Se encuentren exactamente tres personas con grupo sanguíneo B. b.) Se encuentren tres o más personas con las característica de y interés. c.) Se encuentren menos de tres . 2.10 Supóngase que se sabe que la probabilidad de recuperación de cierta enfermedad es de 0.4. Si 15 personas contraen la enfermedad, cuál es la probabilidad de que: a.) Tres o más se recuperen?. b.) Cuatro o más? c. ) Menos de cinco ? 57
  58. 58. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ 2.11 Supóngase que la tasa de mortalidad para cierta enfermedad es del 0.10 y supóngase que la contraen 9 personas de la comunidad. Cuál es la probabilidad de que: a.) Ninguna sobreviva? b) El cincuenta por ciento muera? c. ) Al menos tres mueran. 2.12 El 80% de los cerdos de una región está infectado con triquinosis. Se examinan 20 cerdos de esa región, halle la probabilidad de que: a.) A lo sumo 12 estén infectados. b.) Haya entre 13 y 16 cerdos infectados c.) Haya más de 14 cerdos infectados. 2.13 Las gallinas ponen huevos fecundos entre las 24 y las 28 horas siguientes a su apareamiento. La vida de los espermatozoides en el cuerpo de la gallina puede prolongarse de 15 a 20 días después. En un experimento realizado para determinar la fecundidad de los huevos puestos por las gallinas después de estar separadas del gallo, se encontró que pasado cuatro días de separación, el 70% de los huevos resultaron fecundos. Si se toman 15 huevos al azar, halle la probabilidad de que todos resulten fecundo y la probabilidad de que no menos de 10 resulten fecundos. DISTRIBUCIÓN DE POISSON 2.14 Supóngase que se sabe que en cierta área de una gran ciudad, el número promedio de ratas por manzanas de casas es de cinco .Su poniendo que el número de ratas se distribuye según poisson, encuentre la probabilidad de que en una manzana elegida aleatoriamente: a.) Se tenga exactamente cinco ratas. b.) Más de cinco ratas. c.) Menos de cinco ratas. d.) Entre cinco y siete ratas, inclusive. 2.15 Supóngase que durante un periodo de varios años, el número promedio de muerte debida a cierta enfermedad no contagiosa ha sido de diez. Si el número de muertes debidas a esta enfermedad sigue la distribución de poisson, cuál es la probabilidad de que durante el año que transcurre: 58
  59. 59. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ a.) Mueren exactamente siete personas de esa enfermedad b.) Mueran diez o más personas c.) Nadie muera de esa enfermedad. 2.16 Si el número medio de accidentes graves por año en una fábrica (el número de empleados es constante) es de cinco, encontrar la probabilidad de que en el año en curso: a.) Se tenga exactamente siete accidente. b.) Diez o más accidente c.) Ningún accidente d.) Menos de cinco accidente. 2.17 En un estudio sobre la efectividad de un insecticida contra cierto insecto, se roció un área grande de tierra, posteriormente se examino el área en relación con los insectos vivos, seleccionando lotes cuadrados al azar y contando el número de insectos vivos por lote cuadrado. Experiencias anteriores han demostrado que el promedio de insectos vivos por lote cuadrado después de haber rociado, es de 0.5. Si el número de insectos vivos por lote cuadrado se distribuye según poisson, cuál es la probabilidad de que un lote cuadrado elegido contenga: a.) Exactamente un insecto vivo. b.) Menos de cuatro. c.) Mas de un insecto. 2.18 Se ha estimado en un 0.5% el número de nacimientos de niños vivos con alguna anomalía cromosómica. Cuál es la probabilidad de que en los próximos 2.000 niños que nazcan vivos hayan por lo menos 10 con anomalías cromosómica. 2.19 Si el 3% de las bombillas fabricadas por una compañía son defectuosas, hallar la probabilidad de que en una muestra de 100 bombillas, sean defectuosas a.) 5 Bombillas b.) Más de cinco c.) Entre 1 y 3 d.) Menos de 4. DISTRIBUCIÓN NORMAL 2.20 Hallar el área bajo la curva normal: a.) A la izquierda de Z = - 1.78 b.) A la izquierda de Z = 0.56 59
  60. 60. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ c. ) A la derecha de Z = -1.45 d.) A la correspondiente a Z ≥ 2.16 e.) Correspondiente a - 0.80 ≤ Z ≤ 1.53 f.) A la izquierda de Z = -2.52 y a la derecha de Z = 1.83 2.21 Si la altura de 300 estudiantes se distribuyen normalmente con media 68 pulgadas y desviación típica de 3 pulgadas, cuántos estudiantes tienen alturas: a.) Mayor de 72 pulgadas. b.) Menor o igual a 64 pulgadas c.) Entre 65 y 71 pulgadas inclusive. d.) Igual a 68 pulgadas. 2.22 Supóngase que las edades en la que se adquieren cierta enfermedad están distribuidas en forma aproximadamente normal con una media de 11.5 años y una desviación estándar de 3 años. Un niño acaba de contraer esta enfermedad. Cuál es la probabilidad de que el niño tenga: a.) Entre 8 ½ y 14 ½ años de edad. b.) Más de 10 años de edad c. ) Menos de 12 años. 2.23 En el estudio de las huellas digitales, una importante característica cuantitativa es el número total de surcos para los 10 dedos de un individuo. Supóngase que los números totales de surco de los individuos en cierta población están distribuidos aproximadamente en forma normal, con una media de 140 y una desviación estándar de 50. Hallar la probabilidad de que un individuo elegido al azar de esta población tenga un número de surcos : a.) De 200 o más b.) Menos que 100 c.) Entre 100 y 200 2.24 Si las capacidades de la cavidad craneana de ciertas población están distribuidas aproximadamente en forma normal, con una media de 1400 c.c y una desviación estándar de 125, encontrar la probabilidad de que una persona elegida al azar de esta población tenga una capacidad de la cavidad craneana. a.) Mayor que 1450 cc b.) Menos que 1350 cc c.) Entre 1300 y 1350 cc 60
  61. 61. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ 2.25 Dada una población normalmente distribuida con una media de 75 y una varianza de 225, encontrar. a.) P ( 50 ≤ X ≤ 100 ) b.) P ( X > 90 ) c.) P (X < 60 ) d.) P (X ≥ 85 ) e.) P ( 30 ≤ X ≤ 110) 2.26 La pérdida de agua por transpiración de una planta de maíz en un día caluroso es una variable aleatoria aproximadamente normal con media 2,7 litros y varianza 0.64 litros2 . Que porcentaje de planta de maíz pierden más de 3.2 litros de agua por día caluroso. 2.27 Calcular la media, desviación típica, coeficiente de sesgo y coeficiente de curtosis de una distribución en la que P = 0.7 y N = 60, interpretar los resultados. 2.28 Responda las preguntas siguientes: a.) Qué son los ensayos de Bernoulli. b.) Qué características determinan un fenómeno Binomial. c. ) Qué característica determina un fenómeno de poisson. d,) Cómo se estandariza un variable aleatoria. 2.29 Un dado se lanza 180 veces. Hallar la media, desviación típica, coeficiente de curtosis y coeficiente de sesgo del número de veces que aparece el 4 en este experimento. 61
  62. 62. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ UNIDAD 3.0 DECISIÓN ESTADÍSTICA Objetivo De la unidad: Desarrollar la metodología de prueba de hipótesis como una técnica para analizar diferencias y tomar decisiones; determinar los riesgos implicados al tomar tales decisiones. Contenidos: 3.0 Nociones sobre pruebas de hipótesis y métodos no parametritos 3.1 Pruebas de Uno y Dos Extremos 3.2 Reglas de Decisión 3.3 Errores Estadísticos 3.4 Potencia de una Prueba 3.5 Procedimientos Estadísticos en la Investigación 3.6 Diferencias entre las Pruebas Parámetricas y no Parámetricas 3.7 Prueba Binomial 3.8 Prueba de los Signos 3.9 Prueba de Cox y Stuart para Tendencia 3.10Prueba X2 Para Diferencias en Probabilidades 2x2 3.11Prueba de Mc Nemar Para Cambios de Significancias 3.12Prueba de la Mediana 3.14Prueba de Bondad de Ajuste de Kolmogorov-Smirnov 3.15Prueba U de Mann-Whitney 3.16Prueba de Kruskal-Wallis 3.17Prueba de Sparman Ejercicios 62
  63. 63. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ 3.0 NOCIONES SOBRE PRUEBA DE HIPÓTESIS Y MÉTODOS NO PARAMETRICOS El término más ampliamente usado en la estadística moderna es la palabra “decisión”; se usa tanto porque la teoría estadística y los métodos estadísticos toman una importancia, siempre en aumento, en la confección y análisis de los criterios en los cuales se basan las decisiones. No importa como decidamos los problemas que surgen en las ciencias naturales, en la economía, en la vida cotidiana, etc. siempre hemos de enfrentarnos, con el riesgo de escoger incorrectamente y sufrir las consecuencias que encierra. Considérense las siguientes cinco preguntas. 1. Qué porcentaje de los cupones impresos en un período se recupera?. 2. Es más eficaz la receta A que la B?. 3. Es cierto que el 30% de las personas compra su marca favorita de pasta para dientes sin importarle el precio de ésta?. 4. Se encuentra este dado cargado a favor del 3?. 5. Los resultados que obtienen los hombres y las mujeres en la parte verbal de la prueba SAT, ¿son diferentes?. Estas preguntas son de dos tipos. Las preguntas 1 y 2 piden una respuesta numérica. Las últimas tres requieren un respuesta del tipo si o no. En muchas ocasiones, los estadísticos tratan este tipo de preguntas mediante la formulación de dos proposiciones opuestas que reciben el nombre de hipótesis. Una hipótesis estadística es una afirmación a cerca de una población. Un experimentador intenta probar o desmentir una afirmación “más allá de toda duda razonable” mediante un análisis de la muestra obtenida de esa población. Para las preguntas 3, 4 y 5 pueden obtenerse los siguientes pares de hipótesis. 3. Denótese con p = P(una persona compra su marca favorita de pasta para dientes sin importar el precio de ésta). Entonces las dos hipótesis podrían ser: H1: El 30% de las personas compra su marca favorita sin importar el precio, p =0.30 63
  64. 64. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ H2: El porcentaje de quienes son fieles a su marca es diferente del 30%, p ≠ .30. 4. Sea p= P (en un tiro, el dado muestra un 3). Las dos hipótesis podrían ser: H1: El dado es legal, p = 1/6. H2: El dado está cargado en favor del 3, p > 1/6 Nótese que no se considera la posibilidad de que p sea menor de 1/6. De manera estricta, H1 y H2, en este ejemplo, no son exactamente opuestos. Las hipótesis opuestas de H2:p>1/6 es H: p≤1/6, esto es p es menor o igual a 1/6. Ocurre en muchas ocasiones que en un experimento real no se consideran ciertas alternativas. en este caso, si una persona comienza a sospechar al observar que el dado muestra muchos 3, el mismo comportamiento indica que no existe ninguna razón para tratar de establecer que se están obteniendo muy pocos 3. Sólo se desea decidir si se obtienen o no más números 3 de los que se esperaría obtener con un dado legal. 5. Sea uB el promedio de los resultados obtenidos por los hombres, y uG el promedio de las mujeres. Las hipótesis podrían ser: H1: Los hombres y las mujeres obtienen los mismos resultados en la parte verbal de la prueba SAT, esto es, uB = uG. H2: Los hombres y las mujeres obtienen diferentes resultados en la parte verbal de la prueba SAT, esto es, uB ≠ uG. En general, los profesionales de la estadística prueban la hipótesis que les dice qué esperar al proporcionarle un valor específico con qué trabajar. 64
  65. 65. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ Ellos hacen llamar a esta hipótesis nula y la denotan por H0. La hipótesis nula es la que presume franqueza y lealtad. Es la que ve al mundo a través de anteojos de color rosa. El dado es legal. La afirmación que se encuentra en este periódico es verdadera. Esta teoría es correcta. La hipótesis opuesta recibe el nombre de hipótesis alternativa y se denota como H1: Sin embargo, la mayor parte de las veces esta hipótesis no es de interés. Se sospecha que el dado está cargado, que el periódico está en un error, que la teoría está equivocada. En muchas ocasiones, es esta sospecha la que incita a investigar, en primer lugar, la pregunta. Algunos estadísticos se refieren a H1 como la hipótesis motivada. 65
  66. 66. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ 3.1 PRUEBAS DE UNO Y DOS EXTREMOS Si se sospecha que cierta hipótesis nula es falsa, pueden formularse tres alternativas diferentes. Supóngase que una persona lee en la revista “Pets” que el 34% de las personas en Guatemala son propietarios de más de dos mascotas y se pregunta si en su localidad, Nort Southtown, el porcentaje será el mismo. Entonces, su hipótesis nula deberá ser que cifra de 34% es verdadera. Sea P (un habitante de North Southtown es propietaria de más de dos mascotas). Entonces, H0 es p =0.34. La hipótesis alternativa podría ser cualquiera de las siguientes. 1. Si se piensa que p es mayor de 0.34 entonces H1: p>0.34 2. Si se sospecha que p es menor de 0.34, entonces H1: p<0.34. 3. si no se tiene ninguna idea de si el valor de p es más grande o más pequeño de 0.34 entonces puede escribirse p ≠ 0.34. En la primera alternativa sólo se está interesado en aquellos valores de p que sean más grande que 0.34 y en la segunda en aquellos que sean menores de 0.34. Estas se denominan pruebas de un extremo, ya que los valores de interés se encuentran en cualquier dirección a partir de 0.34. La tercera alterativa se conoce como prueba de dos extremos, ya que los valores de interés se encuentran en cualquier dirección a partir de 0.34. Nótese que se han formulado las hipótesis de manera tal que el signo de igualdad (=) siempre aparezca en la hipótesis nula, mientras que los signos (<) y (>) aparecen en la hipótesis alternativa para pruebas de un extremo. La hipótesis alternativa para pruebas de dos extremos siempre contiene el signo de no es igual (≠).La elección entre una prueba de uno o de dos extremos se encuentra determinada por lo que el estadístico le interese encontrar. 3.2 REGLAS DE DECISIÓN 66
  67. 67. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ Al comienzo de un experimento deben formularse dos hipótesis que tienen la característica de ser opuestas entre sí. Después deberá formularse una proposición con respecto a qué evidencia llevará a pensar que la hipótesis alternativa es verdadera. Esta proposición recibe el nombre de regla de decisión. Cuando la evidencia apoya a la hipótesis alternativa se dice que “se rechaza la hipótesis nula”. Cuando la evidencia no apoya a la hipótesis alternativa, entonces se dice que “no es posible rechazar la hipótesis nula”. 3.3 ERRORES ESTADÍSTICOS Cuando se prueba una hipótesis nula, lo que se está tratando de decidir es si ésta es falsa o verdadera. Sin embargo, ya que la prueba estadística de hipótesis se basa en la información proporcionada por una muestra y no es posible tener la seguridad completa de que la decisión sea correcta, entones, en realidad, se encaran cuatro posibles situaciones. 3.3.1. H0 es verdadera y la información proporcionada por la muestra conduce a decidir que ésta es verdadera. 3.3.2. H0 es verdadera, pero la información proporcionada por la muestra conduce a decidir, incorrectamente, que ésta es falsa. 3.3.3. H0 es falsa y la información proporcionada por la muestra conduce a decidir, de manera correcta, que ésta es falsa. 3.3.4. H0 es falsa, pero la información proporcionada por la muestra conduce a decidir, en forma errónea, que ésta es verdadera. En la primera y terceras situaciones, se ha tomado una decisión correcta. En la segunda situación se rechaza una hipótesis nula que es verdadera. Esto se conoce como error de tipo I. En la última situación no se rechaza una hipótesis nula que es falsa. Los profesionales de la estadística llaman a eso error de tipo II. La tabla siguiente proporciona un resumen de estos dos tipos de errores. No se rechaza H0 Se rechaza H0 H0 es verdadera Correcto Error de tipo I 67
  68. 68. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ H0 es falsa Error de tipo II Correcto Se utilizará la primera letra del alfabeto griego, alfa (α), para presentar la probabilidad de cometer un error de tipo I. De manera similar, beta (β), representará la probabilidad de cometer un error de tipo II. 3.4 POTENCIA DE UNA PRUEBA Los estadísticos hacen referencia al valor de la expresión 1 - β como la potencia de una prueba. Esta es una medida de lo buena que es una prueba para rechazar una hipótesis nula que es falsa. Mientras más “poderosa” sea una prueba, es decir mientras más cercano a uno sea el valor de 1 - β será mayor la probabilidad de rechazar una hipótesis nula que sea falsa. Una parte importante de la teoría estadística trata el problema de encontrar una regla de decisión que haga que una prueba, de hipótesis sea lo más poderosa posible para cualquier valor dado de α. El trabajo teórico original en esta área fue desarrollado por J. Neyman y E. S. Pearson, en la década 1930 - 1940. 3.5 PROCEDIMIENTOS ESTADÍSTICOS EN LA INVESTIGACIÓN En el campo de la salud pública sólo mediante procedimientos estadísticos podrá conocerse la composición y principales características de la población que se va a servir, los cambios que acontecen en ella, los riesgos a que está sometida y las necesidades que presenta. La planificación de las actividades de la salud pública, el control de los programas que se están desarrollando y la evaluación final de su rendimientos y eficiencia sólo podrá llevarse a cabo mediante procedimientos estadísticos. En tal sentido la estadística es tan imprescindible para el trabajo de la salud pública, como lo es la contabilidad en las actividades del Comercio y la Industria. El procedimiento que seguiremos en este trabajo comprende varios pasos; las cuales será aplicadas en su orden. 68
  69. 69. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ 3.5.1 Formación de la Hipótesis de Nulidad (Ho). Es una hipótesis de diferencias nulas; es formulada por lo común con la intención expresa de ser rechazada. Si se rechaza, puede aceptarse entonces la hipótesis alterna (H1), la cuál es la aseveración operacional de hipótesis de investigación del ser experimentado. 3.5.2 Elección de una prueba estadística (con su modelo estadístico asociado) para probar Ho. De las pruebas capaces de usarse con un diseño de investigación dado, hay que escoger aquella cuyo modelo se aproxima más a las condiciones de la investigación y cuyos requisitos satisfacen las medidas usadas en la investigación. 3.5.3 Especificación del nivel de significancia ( ∝ ) y del tamaño de la muestra (N) 3.5.4 Encuentro (o suposición) de la distribución muestral de la prueba estadística conforme a Ho. 3.5.5 Sobre los resultados obtenidos hasta a hora se toma o se define la región de rechazo. 3.5.6 Calculamos el valor de la prueba estadística con los datos obtenidos de la (s) muestra (s). Sí el valor desciende a la región de rechazo Ho, debe rechazarse; si el valor cae fuera de la región derechazo, Ho no puede rechazarse al nivel de significación escogido. 3.6 DIFERENCIA ENTRE LAS PRUEBAS PARAMÉTRICAS Y NO PARAMÉTRICAS Aunque en cada caso, el interés se enfoca en estimar o probar una hipótesis; una prueba estadística Paramétrica, es aquella cuyo modelo especifica ciertas condiciones acerca de los parámetros de la población de la que se obtuvo la muestra investigada, que no se prueba ordinariamente, sino se supone que se mantienen. La significación de los resultados de una prueba paramétrica depende la validez de estas suposiciones. Las pruebas paramétricas también requieren de los puntajes analizados sean productos de una medición que por lo menos tenga la fuerza de una escala de intervalo 69
  70. 70. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ Una prueba estadística no paramétricas es aquella cuyo modelo no especifica las condiciones de los parámetros de la población de la que se saco la muestra. Hay algunas suposiciones que se asocian con la mayorías de las pruebas estadísticas no paramétricas: observaciones independientes y variables de continuidad básica; pero estas suposiciones son pocas y muchas más débiles que las asociada con las pruebas paramétricas. Además, las no paramétricas se aplican a datos de una escala ordinal, y algunos a los de una escala nominal. 70
  71. 71. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ 3.6.1 Ventajas de las Pruebas Estadísticas No Paramétricas (i) Permiten la prueba de hipótesis que no son afirmaciones acerca de valores de parámetros de población. (ii) Puede usarse pruebas no Paramétrica cuando se desconoce la forma de la población muestreada; aunque algunas pruebas no paramétricas supongan identidad de forma de dos o más distribuciones de población. En ciertos casos, las pruebas no paramétricas suponen que la distribución de base es continua, suposición que comparten las pruebas paramétricas. (iii) Sí los tamaños de las muestras son tan pequeños como N=6, no hay alternativa no paramétrica a menos que se conozcan exactamente la naturaleza de la distribución de la población. (iv) Hay pruebas estadísticas no paramétricas adicionadas para observaciones hechas en poblaciones diferentes. Ninguna prueba paramétrica puede manejar tales datos sin exigirnos suposiciones aparentemente irreales. ( v) Las pruebas estadísticas no paramétricas son útiles tanto para datos inherentes a los rangos como datos cuyos puntajes aparentemente numéricos tiene fuerza de rango. ( vi) Los métodos no paramétricos son útiles para los datos simplemente clasificatorios, medidos en una escala nominal y son estos métodos más fáciles en relación con el cálculo y como consecuencia, se aplican con mayor rapidez que los procedimientos paramétricos. 3.6.2 Desventajas de las Pruebas Estadísticas No Paramétricas (i) El uso de procedimientos no paramétricos con datos que pueden manejarse con un procedimiento paramétricos conduce a un desperdicio de datos. (ii) Hasta el momento (al menos no conocemos) no hay métodos no paramétricos para probar las interacciones dentro del modelo de análisis de varianza. (iii) La aplicación de algunas de las pruebas no paramétricas puede ser laboriosa para muestras grandes. 71
  72. 72. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ 3.6.3 ¿Cuando se deben usar las Estadísticas no Paramétricas? Los procedimientos no paramétricos proporcionan alternativas útiles y en muchas situaciones únicas, como las siguientes: (i) Cuando la hipótesis que se va a verificar no incluye un parámetro de población. (ii) Cuando los datos consisten en conteo o rangos de frecuencias, más bien que en medidas tales como: estatura, peso, puntajes de pruebas etc. ( iii) Cuando no se hacen las suposiciones necesarias para la aplicación válida de un procedimiento paramétrico. (iv) Cuando se necesitan rápidamente los datos o información, que con el uso de procedimientos paramétricos sólo se conseguirán después de un período relativamente largo. EL TAMAÑO DE LA MUESTRA. Muchas veces nos cuestionamos acerca del tamaño que debe tener una muestra y, sin embargo, es éste un aspecto de gran importancia. Dado un nivel de confianza α , denominamos error de estimación, denotado por E a la máxima diferencia que permitir, con nivel de confianza 100(1 - α ) %, entre el parámetro desconocido y el estadístico utilizado como estimador. FORMULAS PARA CALCULAR EL TAMAÑO DE LA MUESTRA: 1.0 ERROR MAXIMO DE ESTIMACIÓN: E = n σ αΖ 2 E = 12 − − Ζ N nN n σ α Los valores de mayor uso para Ζ 2α son 1.645 para confiabilidad del 90%, 1.96 para 95% y 2.575 para una confiabilidad del 99%. 2.0 TAMAÑO DE LA MUESTRA 72
  73. 73. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ n = E Z 2 2 2 2 σα n = ( ) σ σ α α 22 2 2 2 1 2 2 ZE Z N N +− 3.0 ERROR MAXIMO PARA PROPORSIÓN: Cuando no se conoce p se toma p= 0.50 E = ( ) n pp Z −1 2 α 4.0 TAMAÑO DE LA MUESTRA PARA PROPORSIÓN: n = ( ) E ppZ 2 12 2 −α n = ( ) ( ) ( )ppN N ZE ppZ −+− − 11 2 2 2 2 2 1 α α 73
  74. 74. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ 3.7. LA PRUEBA BINOMIAL Es una de las pruebas que se encuentra con más frecuencia en la estadística aplicada. La prueba se obtiene de un proceso conocido como Ensayo de Bernoulli, en honor del matemático suizo James Bernoulli (1.654 - 1.705), quien realizo importantes contribuciones en el campo de la probabilidad. Cuando un sólo ensayo de algún proceso o experimento puede conducir sólo a uno de dos resultados mutuamente exclusivos, tales como muerto o vivo, enfermo o saludable, masculino o femenino, el ensayo se conoce como ensayo de Bernoulli . DATO: La prueba consiste del resultado de N ensayos independientes. Cada resultado es uno u otro; “ clase 1” ó “ clase 2” pero no ambas ; el número de observaciones en la clase 1 es n1 , y el número de observaciones en la clase 2 es n2 = N - n1 ; por tanto N = n1+n2. SUPOSICIONES: Se fundamenta esta prueba en las siguientes suposiciones (i) Cada una de las “n” observaciones se puede clasificar según tenga o no la característica de interés. (ii) Las “n” observaciones son mutuamente independientes (iii) La probabilidad p de tener la característica de interés permanece constante en todo el procedimiento de muestreo. HIPÓTESIS: Hay muchas situaciones en que un investigador desea verificar la hipótesis nula de que, en alguna población de interés, la proporción (porcentajes) de sujetos que tienen determinada característica es igual a algún valor p. Por ejemplo, un investigador en probar una hipótesis nula relacionada con la proporción de estudiantes del bachillerato que fuman, o la proporción de víctimas del cáncer que sobreviven durante cinco años o más, etc. La hipótesis nula puede tener una hipótesis alterna bilateral o una de las dos posibles hipótesis alterna unilaterales. Es decir, siendo po alguna constante especifica 0 ≤ po ≤ 1: (i) Prueba Bilateral o de Dos Colas 74
  75. 75. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ Ho : p = po H1 : p ≠ po (ii) Prueba Unilateral o de Una Cola. Ho : p ≤ po H1 : p > po (iii) Prueba Unilateral o de Una Cola Ho : p ≥ po H1 : p < po PRUEBA ESTADÍSTICA Un experimento de Bernoulli puede resultar en un éxito con una probabilidad p y en un fracaso con una probabilidad q = 1 - p . Entonces la prueba tendrá una distribución de probabilidades de la variable aleatoria ( V.a ) binomial X, el número de éxito en n experimentos independientes, es: b ( x ; n , p ) = n Cx. px . qn - x , con X = 0,1,2,....n La medida (µ ) y la varianza ( ∂² ) de la prueba binomial b( x ; n , p ) están dadas por : µ = np y ∂² = npq Estamos interesados en la probabilidad del resultado de la “clase 1”. Permitiremos que la prueba estadística T sea el número de veces del resultado es “ clase 1 “ ; esto es : T = n1 REGLA DE DECISIÓN: Dependiendo en que hipótesis sea probada i , ii, iii las reglas de decisión son diferentes : 75
  76. 76. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ (i) Prueba de Dos Colas: La región crítica de tamaño α corresponde a las 2 colas de la prueba binomial con parámetros Po y N donde el tamaño de la cola superior es de α1 y el tamaño de la cola inferior es α2 y α1 + α2 = α . Esto es en la tabla binomial para el valor particular de Po y N encontramos el número t1 tal que p ( y < t1 ) = α1 y encontramos el número t2 tal que p ( y > t2 ) = α2 o su equivalente p ( y ≤ t2 ) = 1 - α 2. Donde y es una variable aleatoria binomial con parámetros Po y N. 76
  77. 77. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ Región aceptación Región rechazo Región rechazo t1 y t2 Los valores de α1 y α2 pueden ser aproximadamente iguales el uno al otro. Entonces rechazamos Ho si T excede a t2 ( T > t2 ) o si T es menor o igual a t1 ( T ≤ t1 ), en caso contrario aceptamos Ho. (ii) Prueba de Una sola Cola : Ya que para valores grandes de T indicaremos que ∝ es falso, la región critica de tamaños ∝ consiste para todos los valores de T Mayores que t donde t es el número obtenido de la tabla binomial , usando po y N tales que p ( y > t ) = ∝ o su equivalente p ( y ≤ t ) = 1- ∝ donde Y tiene distribución binomial con parámetros Po y N Rechazamos Ho si T > t ; aceptamos Ho si T ≤ t. Región rechazo t (iiii) Prueba de Una sola Cola : En este caso para pequeños valores de T indican que Ho es falso, la región crítica de tamaño ∝ consiste para todos valor de T ≤ t donde t es obtenida de la tabla binomial usando Po y N a si que : p ( y ≤ t ) = ∝ donde Y tiene una distribución binomial con parámetros Po y N. rechazamos Ho si T ≤ t , en otro caso aceptamos Ho 77
  78. 78. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ Región rechazo t PROCEDIMIENTOS: Brevemente, estos son los pasos para el uso de la prueba binomial: (i) Se determina N, el número total de casos observados preferiblemente (N ≤ 25). (ii) Se determina las frecuencias de ocurrencia observando en cada una de las dos categorías o “clases” (iii) Se escoge el método para encontrar la probabilidad de ocurrencia conforme a Ho de los valores observados, o valores aún más extremos. EJEMPLO ILUSTRATIVO. Por registro tomado por el S.S.S. (Servicio Seccional de Salud del Chocó) en el programa E.T.V. de epidemiología se sabe que en Quibdó existieron en 1.995, 21267 casos censados con 91.584 habitantes de los cuáles se toma una muestra de sangre a 10.957 habitante. Saliendo Positivo (Malaria) 2.648 casas y 8.309 habitantes Negativos. Si denotamos los Positivos como clase 1 entonces Po= 0.24 ; puesto que Po = 2.648/10.957 = 0.24= 24%. HIPÓTESIS Ho : Po = 0.24 Hi : Po ≠ 0.24 Como n = 8.309 +2.648 la región crítica de tamaño ∝ = 0.05 aproximadamente puede obtener usando la aproximación para muestra grande al final de la tabla, así la región crítica corresponde para todos los valores T ≤ t1 , donde t1 = nPo + W 0.025 npo po( )1− con ∝ = 0.05 , entonces ∝ / 2 = 0.025; W0.025 = ± 1.96 78
  79. 79. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ t1= ( 10.957) (0.24) + ( - 1.96 ) 10957 024 076( . )( . ) = 2542 t2 = ( 10.957) (0.24) + 1.96 10957 024 076( . )( . ) = 2717 El valor de T obtenido es 2648 en este experimento por lo tanto la Ho es aceptada dado que t1 < T < t2. 3.8 LA PRUEBA DE LOS SIGNOS. La prueba de los signos es justamente la prueba binomial con Po = ½. El uso de esta prueba se remonta a 1.710 y por lo tanto tal vez es el método más antiguo. Es una de las pruebas no paramétricas mas sencillas de utilizar, su nombre proviene del hecho de que se basa en la dirección (o signos de más y menos) de un par de observaciones y no en su magnitud numérica. Es particularmente útil cuando la medición cuantitativa es imposible o no es práctica, pudiendo aún haber cierto orden entre los miembros de cada pareja, es usada esta prueba para dos poblaciones que tienen la misma mediana, puede ser utilizada también para tendencia en una serie de medidas ordinales o como una prueba para correlación. DATOS : Consiste del resultado de observar una muestra aleatoria bidimensional, ( x1, y1 ) , ( x2 , y2 ) , ........ , ( xi , yi ) , .......... ( xn , yn ) , en donde hay n pares de observaciones. Dentro de cada par ( xi , yi ) una composición es hecha y la pareja es clasificada como “ + “ ( más) o “ - “ ( menos ). Sí xi > yi la diferencia se denota con un “ +” Sí xi < yi la diferencia será denotado con un “ - ” . Sí xi = yi eliminará el par de las muestras y se reduce el tamaño de la misma. SUPOSICIONES: Tal vez la aplicación más frecuente de la prueba de los signos es la verificación de la hipótesis nula de que la diferencia de las medidas es 0 (cero). 79
  80. 80. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ Supongamos que designamos un conjunto de puntajes con X y otros conjuntos de puntajes comprendidos en la población relacionando con Y Las muestras de tamaño N de cada conjuntos de puntajes producirá pares de observaciones , que se pueden designar : ( X1 , X2 ) , ( X2 , y2 ) , ...( Xi , yi ) , ........... ( Xn, yn ) : (i) Las variables aleatorias bidimensionales ( Xi , yi ), i = 1,2,....,n son mutuamente independiente . (ii) La escala de medida es por la mayor ordinal dentro de cada par. Esto es cada pareja ( Xi , yi ), puede determinar un “ + “ ( más) , un “ - “ ( menos ) “o “ en pares “ . (iii) Las parejas ( Xi , Yi ) son internamente consistentes en que sí P ( +) > P ( - ) para una pareja ( Xi , Yi ) entonces P ( + ) > P ( -1 ) para todas las parejas; lo mismo sucede para P ( +) < P ( - ) y P ( +) = P ( -). HIPÓTESIS: (i) Prueba Bilateral Ho : P ( Xi < Yi ) = P ( Xi > Y1 ) ∀i Hi : P ( Xi < Yi ) < P ( Xi > Yi ) ∀i ó P ( Xi < Yi ) > P ( Xi > Yi ) ∀i (ii) Prueba Unilateral Ho : P ( Xi < Yi ) ≤ P ( Xi > Yi ) ∀i Hi : P ( Xi < Yi ) > P ( Xi > Yi ) ∀i (iii) Prueba Unilateral Ho : P ( Xi < Yi ) ≥ P ( Xi > Y1 ) ∀i Hi : P ( Xi < Yi ) < P ( Xi > Yi ) ∀i Es de anotar que la prueba de los signos es insesgada y consistente cuando se prueba las hipótesis de arriba. 80
  81. 81. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ La prueba es usada también para probar la siguiente contraparte en cuyo caso no es insesgada ni consistente. (i) Prueba Bilateral: interpretamos la hipótesis nula como “ Xi y Yi “ , tomando el mismo parámetro : Ho : E ( Xi) = E ( Yi) ∀i Hi : E ( Xi) ≠ E ( Yi) ∀i Similarmente puede hacerse la prueba para la mediana ( med) Ho : Med ( Xi) = Med ( Yi) ∀i Hi : Med (Xi) ≠ Med ( Yi) ∀i (ii) Prueba Unilateral: La hipótesis nula puede ser considerada para indicar que los valores de Xi tienden hacer mayores que los valores de yi ó viceversa. Por lo tanto: Ho : E ( Xi ) ≥ E ( Yi ) ∀i Hi : E ( Xi) < E ( Yi) ∀i (ii) Prueba Unilateral: Ho : E ( Xi ) ≤ E ( Yi ) ∀i Hi : E ( Xi) > E ( Yi) ∀i PRUEBA ESTADÍSTICA La estadística para esta prueba denotada por T , es el número de signos “ más “ ( +) entre las N pares . Dado que bajo Ho cada par constituye un ensayo independiente con una probabilidad para el signo “ + “ de 0.5 , la estadística T tiene una distribución binomial con P = 0.5 . T : Nº de parejas ( Xi , Yi ) en la cuál Xi > Yi T : Nº de “ +” REGLA DE DECISIÓN 81
  82. 82. MODULO DE ESTADÍSTICA II - ALBERTO QUINTO JIMÉNEZ Es prioritario que se elimine todas las parejas empatadas y se tome a N como todas las parejas no empatadas , es decir , N = Nº total de “ + “ y “ - “ α Representará el nivel de significancia aproximado. La regla de decisiones siguiente depende de la hipótesis a probar. ( i) Bilateral : Para N ≤ 20 se usa la Tabla Binomial con el valor aproximado para N y con P = 0.5 . Seleccionando en la tabla un valor al rededor de α/ 2 y lo llamaremos α1. El valor de Y corresponde a α1 es llamado t. La región crítica de tamaño 2α corresponde al valor de T ≤ t o T ≥ n - t . Rechazamos Ho si T ≤ t o si T ≥ n - t al nivel de significancia 2α1 en otro caso aceptamos Ho. Para n > 20 se usará la aproximación: t = ½ ( n + W α/2 n ) Donde W α/2 es obtenida de la tabla si α = 0.05 entonces W α/2 = (- 1.996) y la anterior ecuación seria aproximadamente t = n/2 - √ n (ii) Unilateral : Para grandes valores de T indica que un más “ +” es probable que un menos “ - ” como dice H1 ; así la región crítica correspondiente a valores de T ≥ n-t, donde t es hallado por medio de la tabla con P = 0.5 y n , y es aproximadamente igual a α1 . El valor correspondiente a α1 es t. Para n > 20 puede encontrarse por la aproximación t = ½ ( n + W α n ). Ho es rechazado al nivel de significancia α1 ( o α si el valor en la tabla es exacto ) si T ≥ n - t . 82

×