Probabilidad y estadistica_basica

11.524 visualizaciones

Publicado el

1 comentario
12 recomendaciones
Estadísticas
Notas
Sin descargas
Visualizaciones
Visualizaciones totales
11.524
En SlideShare
0
De insertados
0
Número de insertados
3
Acciones
Compartido
0
Descargas
507
Comentarios
1
Recomendaciones
12
Insertados 0
No insertados

No hay notas en la diapositiva.

Probabilidad y estadistica_basica

  1. 1. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLPROBABILIDAD Y ESTADÍSTICA BÁSICAPARA INGENIEROSCon el soporte de para cálculos y gráficos estadísticosMATLAB®Luis Rodríguez Ojedalrodrig@espol.edu.ecInstituto de Ciencias MatemáticasEscuela Superior Politécnica del Litoral, ESPOLGuayaquil, Ecuador2007MATLAB®marca registrada de The Math Works, IncIng. Luis Rodríguez Ojeda, MSc.
  2. 2. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLCONTENIDO1 Introducción 71.1 Objetivo de la Estadística 81.2 Origen de la Estadística 81.3 Definiciones básicas 81.4 Desarrollo de un proyecto estadístico 92 Estadística descriptiva 112.1 Recopilación de datos 112.2 Descripción de conjuntos de datos 112.3 Tabla de distribución de frecuencia 122.4 Representación gráfica de conjuntos de datos 152.4.1 Histograma 152.4.2 Polígono de frecuencia 162.4.3 Ojiva 162.4.4 Gráficos de frecuencia con formas especiales 172.5 Medidas de tendencia central 202.5.1 Media muestral 202.5.2 Moda muestral 202.5.3 Mediana muestral 202.6 Medidas de dispersión 212.6.1 Rango 212.6.2 Varianza muestral 212.6.3 Desviación estándar muestral 222.7 Medidas de posición 222.7.1 Cuartiles 222.7.8 Deciles 232.7.9 Percentiles 232.8 Coeficiente de variación 232.9 Fórmulas para datos agrupados 262.10 Instrumentos gráficos adicionales 302.10.1 Diagrama de caja 302.10.2 Diagrama de puntos 302.10.3 Diagrama de Pareto 302.10.4 Diagrama de tallo y hojas 312.11 Muestras bivariadas 342.11.1 Correlación 352.11.2 Coeficiente de correlación lineal 352.11.3 Matriz de varianzas y covarianzas 362.11.4 Matriz de correlación 363 Fundamentos de la teoría de la probabilidad 403.1 Experimento estadístico 403.2 Espacio muestral 403.3 Eventos 413.4 Sigma-álgebra 413.5 Técnicas de conteo 423.6 Permutaciones 443.6.1 Permutaciones con todos los elementos 453.6.2 Arreglo circular 453.6.3 Permutaciones con elementos repetidos 453.7 Combinaciones 473.8 Probabilidad de eventos 503.8.1 Probabilidad de los elementos de un evento 52Ing. Luis Rodríguez Ojeda, MSc.2
  3. 3. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL3.9 Axiomas de probabilidad de eventos 523.10 Probabilidad condicional 563.11 Eventos independientes 593.12 Regla multiplicativa de la probabilidad 603.13 Probabilidad total 643.14 Fórmula de Bayes 664 Variables aleatorias discretas 684.1 Distribución de probabilidad 694.2 Distribución de probabilidad acumulada 714.3 Valor esperado 744.3.1 Valor esperado de expresiones 754.3.2 Propiedades del valor esperado 764.3.3 Corolarios 764.4 Varianza 774.4.1 Fórmula alterna para calcular la varianza 784.4.2 propiedades de la varianza 784.4.3 Corolarios 784.5 Momentos 804.5.1 Momentos alrededor del origen 804.5.2 Momentos alrededor de la media 804.5.3 Coeficientes 804.5.4 Valores referenciales 814.5.5 Equivalencia entre momentos 814.6 Función generadora de momentos 814.6.1 Obtención de momentos 814.6.2 Propiedad de unicidad 834.7 Teorema de Chebyshev 835 Distribuciones de probabilidad discretas 865.1 Distribución discreta uniforme 865.1.1 Media y varianza 865.2 Distribución de Bernoulli 875.3 Distribución binomial 875.3.1 Parámetros y variable 895.3.2 Distribución de probabilidad acumulada 895.3.3 Gráfico de la distribución binomial 905.3.4 Media y varianza 915.4 Distribución binomial negativa 945.4.1 Media y varianza 955.5 Distribución geométrica 955.5.1 Media y varianza 955.6 Distribución hipergeométrica 965.6.1 Media y varianza 975.7 Aproximación de la distribución hipergeométrica 98con la distribución binomial5.8 Distribución de Poisson 1015.8.1 Media y varianza de la distribución de Poisson 1025.9 Aproximación de la distribución binomial mediante la 102distribución de Poisson6 Variables aleatorias continuas 1046.1 Función de densidad de probabilidad 1046.2 Función de distribución 1056.3 Media y varianza 1086.3.1 Propiedades de la media y la varianza 108Ing. Luis Rodríguez Ojeda, MSc.3
  4. 4. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL6.3.2 Valor esperado de expresiones con una variable 109aleatoria continua6.4 Momentos y función generadora de momentos 1096.5 Teorema de Chebyshev 1107 Distribuciones de probabilidad continuas 1117.1 Distribución discreta uniforme 1117.1.1 Media y varianza 1117.1.2 Función de distribución de probabilidad 1127.2 Distribución normal 1147.2.1 Distribución normal estándar 1157.2.2 Estandarización de la distribución normal 1177.2.3 Valores referenciales de la distribución normal 1197.3 Aproximación de la distribución binomial con 119la distribución normal estándar7.4 Distribución gamma 1237.4.1 Media y varianza 1247.5 Distribución exponencial 1257.5.1 Media y varianza 1267.5.2 Una aplicación de la distribución exponencial 1277.6 Distribución de Weibull 1307.6.1 Media y varianza 1307.7 Razón de falla 1317.8 Distribución beta 1317.8.1 Media y varianza 1327.9 Distribución de Erlang 1337.9.1 Media y varianza 1337.10 Distribución ji-cuadrado 1337.10.1 Media y varianza 1337.11 Distribución empírica acumulada 1378 Distribuciones de probabilidad conjunta 1398.1 Caso discreto bivariado 1398.1.1 Distribución de probabilidad conjunta 1398.1.2 Distribución de probabilidad acumulada 1398.1.3 Distribuciones de probabilidad marginal 1408.1.4 Distribuciones de probabilidad condicional 1428.1.5 Variables aleatorias discretas independientes 1438.2 Caso discreto trivariado 1448.3 Caso continuo bivariado 1478.3.1 Densidad de probabilidad conjunta 1478.3.2 Distribución de probabilidad acumulada conjunta 1478.3.3 Densidades de probabilidad marginal 1488.3.4 Densidades de probabilidad condicional 1498.3.5 Variables aleatorias continuas independientes 1508.4 Caso continuo trivariado 1528.5 Distribución multinomial 1558.5.1 Media y varianza 1558.6 Distribución hipergeométrica multivariada 1568.7 Media para variables aleatorias conjuntas bivariadas 1598.7.1 Casos especiales 1608.8 Covarianza para variables aleatorias conjuntas bivariadas 1608.8.1 Signos de la covarianza 1628.8.2 Matriz de varianzas y covarianzas 1648.8.3 Coeficiente de correlación lineal 1658.8.4 Matriz de correlación 166Ing. Luis Rodríguez Ojeda, MSc.4
  5. 5. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL8.9 Media y varianza para variables aleatorias conjuntas trivariadas 1668.10 Propiedades de las variables aleatorias conjuntas 1719 Distribuciones de muestreo 1739.1 Distribución de muestreo de la media muestral 1749.1.1 Corrección de la varianza 1759.2 Teorema del límite central 1769.3 La distribución T 1789.3.1 Gráfico de la distribución T 1789.4 La distribución ji-cuadrado 1809.4.1 Gráfico de la distribución ji-cuadrado 1809.5 Distribución F 1829.5.1 Gráfico de la distribución F 1829.6 Estadísticas de orden 1849.6.1 Densidad de probabilidad de las estadísticas de orden 18410 Estadística inferencial 18810.1 Inferencia estadística 18810.2 Métodos de inferencia estadística 18810.2.1 Estimación puntual 18810.2.2 Estimación por intervalo 18910.2.3 Prueba de hipótesis 18910.3 Propiedades de los estimadores 18910.4 Inferencias relacionadas con la media 19710.4.1 Estimación puntual (muestras grandes) 19710.4.2 Tamaño de la muestra (muestras grandes) 19910.4.3 Estimación por intervalo (muestras grandes) 20010.4.4 Intervalos de confianza unilaterales (muestras grandes) 20110.4.5 Estimación puntual (muestras pequeñas) 20310.4.6 Estimación por intervalo (muestras pequeñas) 20510.5 Prueba de hipótesis 20810.5.1 Prueba de hipótesis relacionada con la media 209(muestras grandes)10.5.2 Prueba de hipótesis relacionada con la media 213(muestras pequeñas)10.5.3 Valor-p de una prueba de hipótesis 21510.5.4 Cálculo del error tipo I 21610.5.5 Cálculo del error tipo II 21710.5.6 Curva característica de operación 21810.5.7 Potencia de la prueba 21810.6 Inferencias relacionadas con la proporción (muestras grandes) 22710.6.1 Estimación puntual 22710.6.2 Estimación por intervalo 22810.6.3 Prueba de hipótesis 22910.7 Inferencias relacionadas con la varianza 23210.7.1 Intervalo de confianza 23210.7.2 Prueba de hipótesis 23310.8 Inferencias relacionadas con la diferencia de dos medias 23610.8.1 Estimación puntual e intervalo de confianza 236(muestras grandes)10.8.2 Prueba de hipótesis (muestras grandes) 23810.8.3 Intervalo de confianza (muestras pequeñas) 24010.8.4 Prueba de hipótesis (muestras pequeñas) 24210.7 Inferencias para la diferencia entre dos proporciones 246(muestras grandes)10.7.1 Intervalo de confianza 247Ing. Luis Rodríguez Ojeda, MSc.5
  6. 6. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL10.7.2 Prueba de hipótesis 24710.8 Inferencias para dos varianzas 24910.8.1 Intervalo de confianza 24910.8.2 Prueba de hipótesis 25010.9 Prueba para la diferencia de medias con muestras pareadas 25210.9.1 Prueba de hipótesis 25210.10 Tablas de contingencia 25510.10.1 Prueba de hipótesis 25610.11 Pruebas de bondad de ajuste 25910.11.1 Prueba ji-cuadrado 25910.11.2 Prueba de Kolmogorov-Smirnov 26310.12 Análisis de varianza 26710.12.1 Tabla ANOVA 26810.12.2 Prueba de hipótesis 26811 Regresión lineal simple 27111.1 Recta de mínimos cuadrados 27311.2 Coeficiente de correlación 27411.3 Análisis del modelo de regresión lineal simple 27511.4 Análisis de varianza 27611.5 Coeficiente de determinación 27711.6 Tabla ANOVA 27811.7 Prueba de dependencia lineal del modelo 27811.8 Estimación de la varianza 27911.9 Inferencias con el modelo de regresión lineal 27911.10 Inferencias acerca de la pendiente de la recta 28011.10.1 Intervalo de confianza 28011.10.2 Prueba de hipótesis 28011.11 Inferencias para la intercepción de la recta 28111.11.1 Intervalo de confianza 28111.11.2 Prueba de hipótesis 28211.12 Prueba de la normalidad del error 28212 Regresión lineal múltiple 28712.1 Método de mínimos cuadrados 28812.2 Método de mínimos cuadrados para k = 2 28812.3 Regresión lineal múltiple en notación matricial 28912.4 Análisis de varianza 29212.5 Coeficiente de determinación 29312.6 Tabla ANOVA 29312.7 Prueba de dependencia lineal del modelo 29412.8 Estimación de la varianza 29412.9 Matriz de varianzas y covarianzas 29512.10 Inferencias con el modelo de regresión lineal 29612.10.1 Estadísticos para estimación de parámetros 29612.10.2 Intervalos de confianza 29612.10.3 Prueba de hipótesis 29712.11 Prueba de la normalidad del error 298Anexos1 Alfabeto griego 3022 Tabla de la distribución normal estándar 3033 Tabla de la distribución T 3054 Tabla de la distribución ji-cuadrado 3065 Tabla de la distribución F 3076 Tabla para la prueba de Kolmogorov-Smirnov 3087 Descripción de los utilitarios DISTTOOL y RANDTOOL 309Ing. Luis Rodríguez Ojeda, MSc.6
  7. 7. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLPROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROSCon el soporte de para cálculos y gráficos estadísticosMATLAB®1 INTRODUCCIÓNEsta obra es una contribución dedicada a los estudiantes que toman un primer curso deProbabilidad y Estadística a nivel universitario en las carreras de ingeniería. El pre-requisito es elconocimiento del cálculo diferencial e integral y alguna experiencia previa con el programaMATLAB para aprovechar el poder de este instrumento computacional como soporte para loscálculos y gráficos estadísticos.El contenido se basa en la experiencia desarrollada en varios años impartiendo el curso deEstadística para estudiantes de ingeniería de la ESPOL, y especialmente en el curso enmodalidad a distancia que ofrece el Instituto de Ciencias Matemáticas como una opción para losestudiantes que por dificultades en el horario de clases no pueden tomar los cursos en el horarioregular.Esta obra contiene todo el material del curso de Estadística para las carreras de ingeniería en laESPOL con muchos ejemplos desarrollados basados en temas propuestos en exámenesrecientes, sin embargo solo pretende ser el segundo texto para esta materia pues el primero estápor concluir bajo la responsabilidad del MSc. Gaudencio Zurita profesor principal de esta cátedra.Esta obra es un aporte para que los estudiantes aprecien el uso de un instrumentocomputacional moderno y flexible que en forma integradora puede ser usado como soportecomún para todos los cursos básicos de matemáticas, incluyendo Álgebra Lineal, CálculoDiferencial e Integral, Ecuaciones Diferenciales, Análisis Numérico, y ahora también Estadística.Para el manejo estadístico MATLAB dispone de un amplio repertorio de funciones especiales.Todos los cálculos en esta obra, incluyendo el manejo matemático simbólico, fueron realizadoscon estas funciones, asimismo los gráficos estadísticos. Sin embargo por el alcance del curso nose utilizaron las funciones más importantes de este paquete y que en cursos especializados deestadística se deberían aprovechar. En este sentido la obra es una introducción al uso de esteextraordinario instrumento computacional.MATLAB tiene un sistema de ayuda y documentación extenso. Al final de esta obra se incluye ladescripción de dos instrumentos computacionales interactivos para experimentar con modelos deprobabilidad y con la generación de muestras aleatorias.El segundo objetivo principal de esta obra es contribuir al desarrollo de textos virtuales en laESPOL, de tal manera que puedan ser usados frente a un computador pero que también puedanimprimirse totalmente o en partes, reduciendo costos y el uso de papel. El texto ha sidocompilado en formato pdf. El tamaño del texto en pantalla es controlable, contiene dos índicesdinámicos para simplificar la navegación y facilidades para agregar y borrar digitalmenteresaltadores de texto, comentarios, notas, enlaces, revisiones, búsqueda por contenido, etc.Finalmente, debo agradecer a la ESPOL por facilitar a sus profesores desarrollar actividadesacadémicas, y mencionar que esta obra tiene derechos de autor pero es de libre distribución.Luis Rodríguez OjedaInstituto de Ciencias MatemáticasEscuela Superior Politécnica del Litoral, ESPOLGuayaquil, EcuadorIng. Luis Rodríguez Ojeda, MSc.7
  8. 8. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL1.1 OBJETIVO DE LA ESTADÍSTICAEl objetivo fundamental de la estadística es analizar datos y transformarlos en información útilpara tomar decisiones.1.2 ORIGEN DE LA ESTADÍSTICAEl origen de la Estadística se remonta a épocas en las que los gobernantes requerían técnicaspara controlar a sus propiedades y a las personas.Posteriormente, el desarrollo de los juegos de azar propició el estudio de métodos matemáticospara su análisis los cuales con el tiempo dieron origen a la Teoría de la Probabilidad que hoy esel sustento formal de la Estadística.El advenimiento de la informática ha constituido el complemento adecuado para realizar estudiosestadísticos mediante programas especializados que facilitan enormemente el tratamiento ytransformación de los datos en información útil.La Estadística ha alcanzado un nivel de desarrollo muy alto y constituye actualmente el soportenecesario para todas las ciencias y para la investigación científica, siendo el apoyo para tomardecisiones en un entorno de incertidumbre.Es importante resaltar que las técnicas estadísticas deben usarse apropiadamente para que lainformación obtenida sea válida.1.3 DEFINICIONES PRELIMINARESESTADÍSTICACiencia inductiva que permite inferir características cualitativas y cuantitativas de un conjuntomediante los datos contenidos en un subconjunto del mismo.POBLACIÓNConjunto total de individuos u objetos con alguna característica que es de interés estudiar.MUESTRASubconjunto de la población cuya información es usada para estudiar a la poblaciónVARIABLEAlguna característica observable de los elementos de una población y que puede tomardiferentes valores.DATOEs cada valor incluido en la muestra. Se lo puede obtener mediante observación o mediciónPARÁMETROEs alguna característica de la población en estudio y que es de interés conocer.EXPERIMENTO ESTADÍSTICOEs un proceso que se diseña y realiza para obtener observaciones.VARIABLE ALEATORIAEs una variable cuyo valor es el resultado de un experimento estadísticoIng. Luis Rodríguez Ojeda, MSc.8
  9. 9. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLESPACIO MUESTRALConjunto de todos los posibles resultados que se pudiesen obtener de un experimentoestadísticoMODELODescripción simbólica o física de una situación o sistema que se desea estudiarMODELO DETERMINÍSTICORepresentación exacta de un sistema. Permite obtener respuestas precisasEjemplo: una ecuación matemática de la cual se obtiene un resultado para algunos valoresasignados a las variables.MODELO PROBABILISTICORepresentación de un sistema que incluye componentes aleatorios. Las respuestas obtenidas seexpresan en términos de probabilidad.Ejemplo: un modelo para predecir el comportamiento de las colas que forman las personas frentea una estación de servicio.ESTADÍSTICA DESCRIPTIVATécnicas para recopilar, organizar, procesar y presentar datos obtenidos en muestras.ESTADÍSTICA INFERENCIALTécnicas para obtención de resultados basados en la información contenida en muestras.INFERENCIA ESTADÍSTICAEs la extensión a la población de los resultados obtenidos en una muestra1.4 DESARROLLO DE UN PROYECTO ESTADÍSTICODefinición EstadísticaDescriptivaEstadísticaInferencialProblema ResultadosEn forma resumida, se describen los pasos para resolver un problema usando las técnicasestadísticasPROBLEMAEs una situación planteada para la cual se debe buscar una solución.DEFINICIÓNPara el problema propuesto deben establecerse los objetivos y el alcance del estudio a serrealizado considerando los recursos disponibles y definiendo actividades, metas y plazos. Sedebe especificar la población a la cual está dirigido el estudio e identificar los parámetros deinterés así como las variables que intervienen.Se deben formular hipótesis y decidir el nivel de precisión que se pretende obtener en losresultados. Deben elegirse el tamaño de la muestra y las técnicas estadísticas ycomputacionales que serán utilizadas.Ing. Luis Rodríguez Ojeda, MSc.9
  10. 10. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLESTADÍSTICA DESCRIPTIVAEs el uso de las técnicas para obtener y analizar datos, incluyendo el diseño de cuestionarios encaso de ser necesarios. Se debe usar un plan para la obtención de los datos.ESTADÍSTICA INFERENCIALSon las técnicas estadísticas utilizadas para realizar inferencias estadísticas que permiten validarlas hipótesis propuestas.RESULTADOSLos resultados obtenidos deben usarse para producir información que sea útil para la toma dedecisiones.NOTA IMPORTANTELa metodología de diseño en otros ámbitos de la ciencia e ingeniería usa la retroalimentaciónpara corregir las especificaciones con las que se ejecutan las actividades, hasta que losresultados obtenidos concuerden con las especificaciones y requerimientos iniciales.Sin embargo, el uso de retroalimentación en la resolución de un problema estadístico podríainterpretarse como un artificio para modificar los datos o la aplicación de las técnicas estadísticaspara que los resultados obtenidos concuerden con los requerimientos e hipótesis formuladasinicialmente. En este sentido, usar retroalimentación no sería un procedimiento ético.PREGUNTASConteste en no más de dos líneas de texto cada pregunta1) ¿En que situaciones las técnicas estadísticas constituyen un soporte importante?2) ¿Cual es el aporte de la informática para el uso de las técnicas estadísticas?3) ¿Por que hay que tener precaución en el uso de los resultados estadísticos?4) ¿Cual es la diferencia entre población y muestra?5) ¿Cual es la característica principal de un modelo probabilístico?6) ¿Cual es el objetivo de realizar una inferencia estadística?7) ¿Está de acuerdo con el esquema propuesto para realizar un proyecto estadístico?8) ¿Está de acuerdo con la interpretación dada para la retroalimentación en la resolución de unproblema estadístico?Ing. Luis Rodríguez Ojeda, MSc.10
  11. 11. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL2 ESTADÍSTICA DESCRIPTIVAEs el estudio de las técnicas para recopilar, organizar y presentar de datos obtenidos en un estudioestadístico para facilitar su análisis y aplicación.2.1 RECOPILACIÓN DE DATOSFuentes de datos1) Investigación en registros administrativos: INEC, Banco Central, Cámaras de laProducción, Universidades, etc. para obtener índices de empleo, índice de precios, datosde salud, datos de eficiencia, etc.2) Obtención de datos mediante encuestas de investigación Ej. Estudios de mercado.Estudios de preferencia electoral, etc3) Realización de experimentos estadísticosCriterios para diseñar una encuesta de investigación1) Definir el objetivo del estudio2) Definir la población de interés3) Determinar el tamaño de la muestra4) Seleccionar el tipo de muestreo5) Elegir temas generales6) Elaborar el formulario para la encuesta: Preguntas cortas, claras y de opciones.7) Realizar pruebas8) Realizar la encuestaTipos de datosLos resultados que se obtiene pueden ser1) Datos cualitativos: corresponden a respuestas categóricasEj. El estado civil de una persona2) Datos cuantitativos: corresponden a respuestas numéricasEj. La edad en años.Los datos cuantitativos pueden ser1) Discretos: Se obtienen mediante conteos2) Continuos: Se obtienen mediante mediciones2.2 DESCRIPCIÓN DE CONJUNTOS DE DATOSLos datos obtenidos se los puede representar de diferentes formas:1) Tabularmente.2) Gráficamente3) Mediante númerosSi la muestra contiene pocos datos, se los puede representar directamente, pero si el número dedatos es grande conviene agruparlos para simplificar su análisisIng. Luis Rodríguez Ojeda, MSc11
  12. 12. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL2.3 TABLA DE DISTRIBUCIÓN DE FRECUENCIAEs un dispositivo para agrupación de datos y facilitar su interpretación.Recomendaciones para construir la Tabla de Frecuencia1) Identificar la unidad de medida de los datos2) Obtener el rango de los datos, RR = mayor valor – menor valor3) Seleccionar el numero de clases (o intervalos) k, para agrupar los datos.Sugerencia para elegir kSean n: número de datosk: Número de clasesn kMenos de 50 5 a 7Entre 50 y 100 6 a 10Entre 100 y 250 7 a 12Mas de 250 10 a 204) Obtener la amplitud de las clases,Amplitud = R/kSe puede redefinir la amplitud, el número de clases y los extremos de cada clase de talmanera que las clases tengan la misma amplitud, incluyan a todos los datos y los valoresen los extremos de las clases sean simples5) Realizar el conteo de datos para obtener la frecuencia en cada claseNotaciónn: número de datosk: número de clasesfi: frecuencia de la clase i, i=1, 2, 3, …, kfi/n: frecuencia relativa de la clase iFi: frecuencia acumulada de la clase iFi = f1+f2+f3+…+fiFi/n: frecuencia acumulada relativa de la clase imi : marca de la clasei (es el centro de la clase i)Los resultados se los organiza en un cuadro denominado Tabla de FrecuenciaEjemplo.- Los siguientes 40 datos corresponden a una muestra del tiempo que se utilizó paraatender a las personas en una estación de servicio:3.1 4.9 2.8 3.64.5 3.5 2.8 4.12.9 2.1 3.7 4.12.7 4.2 3.5 3.73.8 2.2 4.4 2.95.1 1.8 2.5 6.22.5 3.6 5.6 4.83.6 6.1 5.1 3.94.3 5.7 4.7 4.65.1 4.9 4.2 3.1Obtener la tabla de frecuenciaIng. Luis Rodríguez Ojeda, MSc12
  13. 13. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLSolución1) Precisión: un decimal2) Rango: R = mayor valor – menor valor = 6.2 – 1.8 = 4.43) Número de clases: k=64) Amplitud: R/k = 0.7333..Por simplicidad se redefine la amplitud como 1 y se usan números enteros para losextremos de las clases.5) Conteo de los datos (puede hacerse en un solo recorrido de los datos con la ayuda decuadritos para conteo (de 5 en 5)Clase Intervalo Frecuencia1 [1, 2) 12 [2, 3) 93 [3, 4) 114 [4, 5) 125 [5, 6) 56 [6, 7) 2n = 40Tabla de FrecuenciaClaseiIntervalo[a, b)Marcade clasemFrecuenciafFrecuenciarelativaf/nFrecuenciaacumuladaFFrecuenciaacumuladarelativaF/n1 [1, 2) 1.5 1 0.025 1 0.0252 [2, 3) 2.5 9 0.225 10 0.2503 [3, 4) 3.5 11 0.275 21 0.5254 [4, 5) 4.5 12 0.300 33 0.8255 [5, 6) 5.5 5 0.125 38 0.9506 [6, 7) 6.5 2 0.050 40 1.000EJERCICIOS1) Conteste las siguientes preguntas en no más de dos líneas de textoa) En las fuentes de recopilación de datos no se ha mencionado el uso de internet.¿Cualesson las ventajas y peligros de su uso?b) Al diseñar el formulario de una encuesta de investigación. ¿Por que se prefieren preguntascon opciones para elegir?c) El número telefónico de una persona. ¿Es un dato cualitativo o cuantitativo?d) El dinero es un dato cuantitativo, ¿Discreto o continuo?2) Con los resultados obtenidos y descritos en la tabla de frecuencia del ejemplo desarrolladoen esta sección, conteste las siguientes preguntasa) ¿Cuántas personas requirieron no más de 4 minutos para ser atendidas?b) ¿Cuántas personas requirieron entre 2 y 5 minutos?c) ¿Cuántas personas requirieron al menos 4 minutos?d) ¿Cuál es la duración que ocurre con mayor frecuencia?3) Construya la tabla de frecuencia para una muestra aleatoria con datos del costo porconsumo de electricidad en una zona residencial de cierta ciudad.96 171 202 178 147 102 153 1297 127 82157 185 90 116 172 111 148 213 130 165141 149 206 175 123 128 144 168 109 16795 163 150 154 130 143 187 166 139 149108 119 183 151 114 135 191 137 129 158Ing. Luis Rodríguez Ojeda, MSc13
  14. 14. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLIng. Luis Rodríguez Ojeda, MScMATLABConstrucción de la tabla de frecuenciasVector con los datos>> x=[3.1 4.9 2.8 3.6 4.5 3.5 2.8 4.1 2.9 2.1 3.7 4.1 2.7 4.2 3.5 3.7 3.8 2.2 4.4 2.9...5.1 1.8 2.5 6.2 2.5 3.6 5.6 4.8 3.6 6.1 5.1 3.9 4.3 5.7 4.7 4.6 5.1 4.9 4.2 3.1];>> m=[1.5 2.5 3.5 4.5 5.5 6.5]; Vector con las marcas de clase>> f=hist(x,m) Obtención de las frecuencias en las marcas de clasef =1 9 11 12 5 2>> fr=f/40 Frecuencias relativasfr =0.0250 0.2250 0.2750 0.3000 0.1250 0.0500>> F=cumsum(f) Frecuencias acumuladasF =1 10 21 33 38 40>> Fr=F/40 Frecuencias acumuladas relativasFr =0.0250 0.2500 0.5250 0.8250 0.9500 1.000014
  15. 15. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL2.4 REPRESENTACIÓN GRÁFICA DE CONJUNTOS DE DATOSEn esta sección revisamos algunos dispositivos frecuentemente usados para resaltarvisualmente las características de grupos de datos.2.4.1 HISTOGRAMAEs la manera más común de representar gráficamente la distribución de frecuencia de los datos.Se lo construye dibujando rectángulos cuya base corresponde a cada intervalo de clase, y sualtura según el valor de la frecuencia. Puede ser la frecuencia absoluta o la frecuencia relativa.Ejemplo. Construya el histograma para el ejemplo de la unidad anterior. Use los valores de lafrecuencia absoluta:Tabla de FrecuenciaClase IntervaloMarcade claseFrecuenciaFrecuenciarelativaFrecuenciaacumuladaFrecuenciarelativaacumulada1 [1, 2) 1.5 1 0.025 1 0.0252 [2, 3) 2.5 9 0.225 10 0.2503 [3, 4) 3.5 11 0.275 21 0.5254 [4, 5) 4.5 12 0.300 33 0.8255 [5, 6) 5.5 5 0.125 38 0.9506 [6, 7) 6.5 2 0.050 40 1.000HistogramaEl histograma permite dar una primera mirada al tipo de distribución de los datos:1) Si las alturas de las barras son similares se dice que tiene distribución tipo “uniforme”2) Si las alturas son mayores en la zona central se dice que tiene forma tipo “campana” ypuede ser simétrica o asimétrica, con sesgo hacia el lado positivo o al lado negativo3) Si hay barras muy alejadas del grupo, se dice que son datos atípicos. Probablementeestos datos se deben a errores de medición y se los puede descartar pues nopertenecen al grupo que se desea caracterizar.Ing. Luis Rodríguez Ojeda, MSc.15
  16. 16. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL2.4.2 POLÍGONO DE FRECUENCIAEs una manera de representar el perfil de la distribución de los datos. Se obtiene uniendomediante segmentos de recta los puntos (marca de clase, frecuencia)Para cerrar el polígono se puede agregar un punto a cada lado con frecuencia 0.Polígono de frecuencia para el ejemplo dado:2.4.3 OJIVAEste gráfico se usa para representar la frecuencia acumulada, absoluta o relativa. Se lo obtieneuniendo segmentos de recta que se extienden entre los extremos de las clases y usando losvalores de la frecuencia acumulada.Ojiva para el ejemplo dado:La ojiva permite responder preguntas tipo “cuantos datos son menores que”Ejemplo. ¿Cuantos datos tienen un valor menor a 4.5?Respuesta: aproximadamente 27 datosIng. Luis Rodríguez Ojeda, MSc.16
  17. 17. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL2.4.4 GRÁFICOS DE FRECUENCIA CON FORMAS ESPECIALESLos gráficos pueden tomar otros aspectos usando barras, colores, efectos tridimensionales,sombreado, etc. o usando una representación tipo pastelDiagrama de barrasDiagrama de barras con efecto tridimensionalDiagrama tipo pastelIng. Luis Rodríguez Ojeda, MSc.17
  18. 18. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLEJERCICIOSSe tiene una muestra aleatoria con datos del costo por consumo de electricidad en una zonaresidencial de cierta ciudad.96 171 202 178 147 102 153 1297 127 82157 185 90 116 172 111 148 213 130 165141 149 206 175 123 128 144 168 109 16795 163 150 154 130 143 187 166 139 149108 119 183 151 114 135 191 137 129 158Use los resultados de la tabla de frecuencia y dibuje a mano los siguientes gráficos.a) Histograma con las frecuencias relativasb) Polígono de Frecuenciasc) OjivaMATLABObtención de gráficos. Los dibujos obtenidos se muestran en las páginas anterioresVector con los datos>> x = [3.1 4.9 2.8 3.6 4.5 3.5 2.8 4.1 2.9 2.1 3.7 4.1 2.7 4.2 3.5 3.7 3.8 2.2 4.4 2.9...5.1 1.8 2.5 6.2 2.5 3.6 5.6 4.8 3.6 6.1 5.1 3.9 4.3 5.7 4.7 4.6 5.1 4.9 4.2 3.1];Vector con las marcas de clase>> m=[1.5 2.5 3.5 4.5 5.5 6.5];Graficación del histograma>> hist(x, m);>> grid on CuadrículasGraficación del polígono de frecuencias>> mp=[0.5 m 7.5]; Se agrega un punto con frecuencia cero a los lados>> f = hist(x, m); Obtención de las frecuencias en la m marcas de clase>> fp=[0 f 0];>> clf>> plot(mp,fp,o) Dibujo de los puntos en un nuevo gráfico>> hold on Mantener el gráfico anterior>> plot(mp,fp) Trazado de las líneas del polígono>> grid on CuadrículasGraficación de la ojiva>> c=[1 2 3 4 5 6 7]; Vector con los extremos de las seis clases>> F=cumsum(f); Vector con las frecuencias acumuladas>> Fo=[0 F]; Se agrega un punto a la izquierda con frecuencia cero>> clf>> plot(c,Fo,o) Dibujo de los puntos en un nuevo gráficoIng. Luis Rodríguez Ojeda, MSc.18
  19. 19. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLIng. Luis Rodríguez Ojeda, MSc.>> hold on Para superponer el siguiente gráfico>> plot(c, Fo) Trazado de las líneas de la ojiva>> grid onGráfico de diagrama de barras con color verde>> clf>> bar(f,’g’)Gráfico de diagrama de barras, horizontal con efecto tridimensional, color rojo>> clf>> bar3h(f,’r’)Gráfico tipo pastel>> clf>> f=hist(x,m);>> pie(f)19
  20. 20. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLMEDIDAS DESCRIPTIVAS2.5 MEDIDAS DE TENDENCIA CENTRALSon números que definen cual es el valor alrededor del que se concentran los datos uobservaciones. Se indican a continuación los más utilizados.2.5.1 MEDIA MUESTRALSi X1, X2, ... , Xn representan a los datos, entonces se tiene:Definición: Media muestraln1 2 nii 1x x ... x 1X xn n =+ + += = ∑Ejemplo. Si los datos son 2, 6, 11, 8, 11, 4, 7, 5Entonces X = (2+6+11+8+11+4+7+5)/8 = 6.75La media muestral es simple y de uso común. Representa el promedio aritmético de los datos.Sin embargo, es sensible a errores en los datos. Un dato erróneo puede cambiarsignificativamente el valor de la media muestral. Para evitar este problema, se puede ignorar unpequeño porcentaje de los datos más grandes y más pequeños de la muestra antes de calcularla media muestralEjemplo. Si los datos son 2, 6, 11, 8, 11, 4, 7, 5, 90Entonces X = (2+6+11+8+11+4+7+5 + 90)/9 = 16Un sólo dato cambió significativamente el valor de la media con respecto al ejemplo anterior2.5.2 MODA MUESTRALEs el valor que ocurre con mayor frecuencia en una muestra. Puede ser que no exista la moda ytambién es posible que exista más de una moda.Definición: Moda muestralModa muestral: Mo es el valor que más veces se repiteEjemplo. Si los datos son 2, 6, 11, 8, 11, 4, 7, 5Entonces Mo = 112.5.3 MEDIANA MUESTRALEs el valor que está en el centro de los datos ordenadosSean X1, X2, ... , Xn los datosX(1), X(2), ... , X(n) los datos ordenados en forma crecienteEl subíndice entre paréntesis significa que el dato X(i) está en la posición i en el grupo ordenado.Ing. Luis Rodríguez Ojeda, MSc.20
  21. 21. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLDefinición: Mediana muestral=x~n 1( )2n n( ) ( 1)2 2X , si n es impar1(X X ),si n es par2++⎧⎪⎪⎨+⎪⎪⎩Ejemplo: Si los datos son 2, 6, 11, 8, 11, 4, 7, 5Los datos ordenados: 2, 4, 5, 6, 7, 8, 11, 11, entonces =x~ 1(6 7) 6.52+ =Las medidas de tendencia central no son suficientes para describir de manera precisa elcomportamiento de los datos de una muestra. Se necesitan otras medidas.2.6 MEDIDAS DE DISPERSIÓNSon números que proveen información adicional acerca del comportamiento de los datos,describiendo numéricamente su dispersión.2.6.1 RANGOEs la diferencia entre el mayor valor y el menor valor de los datos de la muestra.Definición: RangoR = X(n) – X(1), en donde x(i) es el dato ordenado ubicado en la posición iEjemplo. Si los datos son 2, 6, 11, 8, 11, 4, 7, 5Entonces el rango es: R = 11 - 2 = 92.6.2 VARIANZA MUESTRALEsta medida se basa en la cuantificación de las distancias de los datos con respecto al valor dela mediaDefinición: Varianza muestraln2i2 i 1(X X)Sn 1=−=−∑Fórmula para calcular la varianzan n2 2i i2 i 1 i 1n X ( X )Sn(n 1)= =−=−∑ ∑Fórmula alterna para calcular la varianzaEl motivo que en el denominador se escriba n – 1 en lugar de n (que parece natural), sejustifica formalmente en el estudio de la estadística inferencial.Ambas fórmulas son equivalentes y se lo puede demostrar mediante desarrollo de las sumatoriasIng. Luis Rodríguez Ojeda, MSc.21
  22. 22. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLEjemplo. Si los datos son 2, 6, 11, 8, 11, 4, 7, 5 y se tiene que = 6.75XEntonces la varianza esS2=2 2(2 6.75) (6 6.75) ... (5 6.75)7− + − + + − 2= 10.21432.6.3 DESVIACIÓN ESTÁNDAR MUESTRALEs la raíz cuadrada positiva de la variancia. La desviación estándar muestral o desviación típicao error muestral, está expresada en las misma unidad de medición que los datos de la muestraDefinición: Desviación estándar muestral= + 2S SEjemplo. Calcule la desviación estándar para el ejemplo anterior.Si la varianza es S2= 10.2143, entonces, la desviación estándar esS = 2S 10.2143= = 3.1962.7 MEDIDAS DE POSICIÓNSon números que dividen al grupo de datos ordenados, en grupos de aproximadamente igualcantidad de datos con el propósito de resaltar su ubicación.2.7.1 CUARTILESSon números que dividen al grupo de datos en grupos de aproximadamente el 25% de los datosPrimer Cuartil (Q1)A la izquierda de Q1 están incluidos 25% de los datos (aproximadamente)A la derecha de Q1 están el 75% de los datos (aproximadamente)Segundo Cuartil (Q2)Igual que la mediana divide al grupo de datos en dos partes, cada una con el 50% de los datos(aproximadamente)Tercer Cuartil (Q3)A la izquierda de Q3 están incluidos 75% de los datos (aproximadamente)A la derecha de Q3 están el 25% de los datos (aproximadamente)Ejemplo. Suponer que una muestra contiene 40 datos ordenados:X(1), X(2), ... , X(40). Calcular Q1, Q2, Q3Q1: 25% de 40 = 10Por lo tanto: Q1 = (X(10) + X(11))/2Q2: 50% de 40 = 20 es igual a la medianaQ2 = (X(20) + X(21))/2Q3: 75% de 40 = 30Q3 = (X(30) + X(31))/2Ing. Luis Rodríguez Ojeda, MSc.22
  23. 23. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL2.7.2 DECILESSon números que dividen al grupo de datos en grupos de aproximadamente 10% de los datosPrimer Decil (D1)A la izquierda de D1 están incluidos 10% de los datos (aproximadamente)A la derecha de D1 están el 90% de los datos (aproximadamente)Segundo Decil (D2)A la izquierda de D2 están incluidos 20% de los datos (aproximadamente)A la derecha de D2 están el 80% de los datos (aproximadamente)Etc.Ejemplo. Suponer que una muestra contiene 40 datos ordenados:X(1), X(2), ... , X(40). Calcular D1D1: 10% de 40 = 4Por lo tanto: D1 = (X(4) + X(5))/22.7.3 PERCENTILES (O PORCENTILES)Son números que dividen al grupo de datos en grupos de aproximadamente 1% de los datosPrimer Percentil (P1)A la izquierda de P1 están incluidos 1% de los datos (aproximadamente)A la derecha de P1 están el 99% de los datos (aproximadamente)Segundo Percentil (P2)A la izquierda de P2 están incluidos 2% de los datos (aproximadamente)A la derecha de P2 están el 98% de los datos (aproximadamente)Etc.Ejemplo. Suponer que una muestra contiene 400 datos ordenados:X(1), X(2), ... , X(400). Calcular P1, P82P1: 1% de 400 = 4Por lo tanto: P1 = (X(4) + X(5))/2 (Percentil 1)P82: 82% de 400 = 328 (Percentil 82)P82 = (X(328) + X(329))/22.8 COEFICIENTE DE VARIACIÓNEs un número que se usa para cara comparar la variabilidad de los datos de diferentes grupos.Es una medida adimensional definida de la siguiente maneraDefinición: Coeficiente de variaciónV =SXEjemplo: Para un grupo de datos X = 20, S = 4, entonces v = 4/20 = 0.2 = 20%Para un segundo grupo X = 48, S = 6, entonces v = 6/48 = 0.125 = 12.5%Se concluye que el primer grupo tiene mayor variabilidad (respecto a su media)Ing. Luis Rodríguez Ojeda, MSc.23
  24. 24. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLEJERCICIOS1) Demuestre mediante propiedades de las sumatoria que2nin ni 12 2i ii 1 i 1x(x x) xn== =⎛ ⎞⎜ ⎟⎝ ⎠− = −∑∑ ∑Esto demuestra la equivalencia entre las dos fórmulas definidas para calcular la varianza.2) Se tiene una muestra aleatoria con datos del costo por consumo de electricidad en una zonaresidencial de cierta ciudad.96 171 202 178 147157 185 90 116 172141 149 206 175 12395 163 150 154 130108 119 183 151 114Calcule X , , Sx~ 2, S, Q1, Q3, R, D1, D53) Se tienen los siguientes datos de la cantidad de barriles por día que producen 45 pozospetroleros en un campo: cantidad mínima: 52; cantidad máxima 247; primer cuartil 87; mediana163; tercer cuartil 204. Grafique la Ojiva con la mayor precisión que le sea posible.4) Respecto al problema anterior. Una compañía está interesada en comprar solamente lospozos que produzcan mas de 100 barriles por día y pagará $150000 por cada uno. ¿Cuanto lecostaría la inversión aproximadamente?MATLABFórmulas para estadística descriptiva>> x=[2 6 11 8 11 4 7 5]; Vector con los datos de una muestra>> xb=mean(x) Media aritméticaxb =6.7500>> m=median(x) Medianam =6.5000>> x=0:1:100; Vector con los primeros 100 números naturales>> xb=mean(x) Media aritméticaxb =50>> x=[x 1000]; Vector con un valor grande agregado al final>> xb=mean(x) Media aritméticaxb =59.3137>> xb=trimmean(x,10) Media aritmética omitiendo 5% de datos en cada ladoxb =50.5000>> x=[2 6 11 8 11 4 7 5]; Vector con los datos de una muestra>> r=range(x) Rango de los datosr =9Ing. Luis Rodríguez Ojeda, MSc.24
  25. 25. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLIng. Luis Rodríguez Ojeda, MSc.>> a=min(x) El menor valora =2>> b=max(x) El mayor valorb =11>> s2=var(x) Varianza muestrals2 =10.2143>> s=std(x) Desviación estándar muestrals =3.1960>> rq=iqr(x) Rango intercuartilrq =5>> q1=prctile(x,25) Primer cuartil (percentil 25)q1 =4.5000>> q3=prctile(x,75) Tercer cuartil (percentil 75)q3 =9.5000>> y=sort(x) Datos ordenados en forma crecientey =2 4 5 6 7 8 11 11>> x=rand(1,400); Vector con una fila de 400 números aleatorios>> d7=prctile(x,70) Decil 7 (percentil 70)d7 =0.7013>> p82=prctile(x,82) Percentil 82p82 =0.833525
  26. 26. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL2.9 FÓRMULAS PARA DATOS AGRUPADOSSi los datos de una muestra están disponibles en una tabla de frecuencia, se pueden usarfórmulas para calcular las medidas estadísticas descriptivas, en forma aproximadaSuponer que se dispone de la tabla de frecuencia con valores que se indican en forma simbólica:Clase Intervalo Marca f F f/n F/n1 [L1, U1] m1 f1 F1 f1/n F1/n2 [L2, U2] m2 f2 F2 f2/n F2/n. . . . . . . . . . . . . . . . . . . . .k [Lk, Uk] mk fk Fk fk/n Fk/nDefinición: Media de datos agrupadosX =ki ii 11m fn =∑n número de datosk número de clasesmi marca de la clase i (es el centro del intervalo de la clase)fi frecuencia de la clase iDefinición: Varianza de datos agrupadosk2 2i ii 11S f (m X)n 1 == −−∑n número de datosk número de clasesmi marca de la clase i (es el centro del intervalo de la clase)fi frecuencia de la clase iDefinición: Mediana para datos agrupadosi 1iinF2X L Af−−= +i intervalo en el que se encuentra la medianaLi Límite inferior del intervalo in Número de observacionesFi-1 Frecuencia acumulada del intervalo anterior al intervalo ifi frecuencia del intervalo iA Amplitud de la claseDefinición: Moda para datos agrupadosaia sfMo L Af fΔ= +Δ + Δi intervalo en el que se encuentra la modaLi Límite inferior del intervalo iΔfa Exceso de la frecuencia sobre la clase inferior inmediataΔfs Exceso de la frecuencia sobre la clase superior inmediataA Amplitud de la claseMo no es un dato real pero se supone que sería el dato más frecuenteIng. Luis Rodríguez Ojeda, MSc.26
  27. 27. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLDefinición: Medidas de posición para datos agrupadosi 1j iinj( ) F4Q L Af−−= + , j = 1, 2, 3 cuartilesi intervalo en el que se encuentra el primer cuartilLi Límite inferior del intervalo in Número de observacionesFi-1 Frecuencia acumulada del intervalo anterior al intervalo ifi frecuencia del intervalo iA Amplitud de la claseEjemplo: La tabla de frecuencia siguiente contiene los datos del número de artículos vendidos porun almacén en 50 días, agrupados en 6 clasesClase Intervalo Marca f F f/n F/n1 [10, 20) 15 2 2 0.04 0.042 [20, 30) 25 10 12 0.2 0.243 [30, 40) 35 12 24 0.24 0.484 [40, 50) 45 14 38 0.28 0.765 [50, 60) 55 9 47 0.18 0.946 [60, 70) 65 3 50 0.06 1Calcule la media, varianza, mediana, moda y los cuartilesMediaX =ki ii 11m fn =∑ =1[(15)(2) (25)(10) ... (65)(3)] 40.450+ + + =Varianzak2 2i ii 11S f (mn 1 == −−∑ X)= 2 2 21[2(15 40.4) 10(25 40.4) ... 3(65 40.4) ] 164.1249− + − + + − =MedianaPara usar la fórmula debe localizarse la clase en la cual está la medianaSiendo n = 50, la mediana es el promedio entre los datos X(25), X(26)Estos datos se encuentran en la clase 4, por lo tanto344nF2X L Af−= +5024240 1014−= + = 40.71ModaEl intervalo en el que se considera que se encuentra la moda corresponde a la clase con mayorfrecuencia, En el ejemplo, sería la clase 4a4a sfMo L Af fΔ= +Δ + Δ240 10 42.852 5= + =+(es una valor supuesto para la moda)Ing. Luis Rodríguez Ojeda, MSc.27
  28. 28. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLPrimer CuartilQ1 corresponde a la observación X(13). Este dato se encuentra en la clase 3, por lo tanto21 33n1( ) F4Q L Af−= +501( ) 12430 10 30.4112−= + =Para comparar, anotamos los datos originales de los cuales se obtuvo la tabla de frecuencia:37 48 48 57 32 63 55 34 48 3632 47 50 46 28 19 29 33 53 6849 26 20 63 20 41 35 38 35 2523 38 43 43 45 54 58 53 49 3236 45 43 12 21 55 50 27 24 42Los mismos datos pero ordenados en forma creciente12 19 20 20 21 23 24 25 26 2728 29 32 32 32 33 34 35 35 3636 37 38 38 41 42 43 43 43 4545 46 47 48 48 48 49 49 50 5053 53 54 55 55 57 58 63 63 68Con los cuales se obtuvieron directamente los siguientes resultadosX = 40.16S2= 169.81X = 41.5Q1 = 32Mo = 32, 43, 48 (trimodal)Ejemplo. Se dispone de los siguientes datos incompletos en una tabla de frecuenciaClase Intervalo Marca f F f/n F/n1 [1, 2) 12 63 0.254 0.75 8 0.96 0.057Completar la tabla de frecuenciaSoluciónSe escriben directamente los intervalos, marcas de clase y algunos valores de frecuenciaClase Intervalo Marca f F f/n F/n1 [1, 2) 1.5 1 12 [2, 3) 2.5 5 63 [3, 4) 3.5 0.254 [4, 5) 4.5 0.75 [5, 6) 5.5 8 0.2 0.96 [6, 7) 6.5 0.05 0.957 [7, 8) 7.5 0.05 1Ing. Luis Rodríguez Ojeda, MSc.28
  29. 29. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLPara continuar usamos la siguiente relación contenida en la tabla: 8/n = 0.2De donde se obtiene que n = 40. Conocido el valor de n, se puede continuar desde arribaClase Intervalo Marca f F f/n F/n1 [1, 2) 1.5 1 1 0.025 0.0252 [2, 3) 2.5 5 6 0.125 0.153 [3, 4) 3.5 0.25 0.404 [4, 5) 4.5 0.3 0.75 [5, 6) 5.5 8 0.2 0.96 [6, 7) 6.5 0.05 0.957 [7, 8) 7.5 0.05 1Finalmente, con la definición de frecuencia relativa se puede completar la tablaClase Intervalo Marca f F f/n F/n1 [1, 2) 1.5 1 1 0.025 0.0252 [2, 3) 2.5 5 6 0.125 0.153 [3, 4) 3.5 10 16 0.25 0.404 [4, 5) 4.5 12 28 0.3 0.75 [5, 6) 5.5 8 36 0.2 0.96 [6, 7) 6.5 2 38 0.05 0.957 [7, 8) 7.5 2 40 0.05 1Calcular la media, varianza, mediana, moda y el primer cuartilCon las fórmulas correspondientes se pueden calcular las medidas descriptivas indicadas igualque en el ejercicio anteriorEJERCICIOSSe dispone de los siguientes datos incompletos en una tabla de frecuenciaClase Intervalo Marca f F f/n F/n1 22 0.253 [15, 20) 14 0.645 366 0.9757Se conoce además que la media calculada con los datos agrupados es 19.7a) Complete la tabla de frecuenciab) Calcule la media, varianza, mediana, moda y el tercer cuartilSugerencia: Al colocar los datos en la tabla quedarán dos incógnitas en la columna f.Con la fórmula del dato adicional dado X se obtiene otra ecuación con las mismas incógnitas.Estas dos ecuaciones son lineales y luego de resolverlas se puede continuar llenando la tabla.Ing. Luis Rodríguez Ojeda, MSc.29
  30. 30. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL2.10 INSTRUMENTOS GRÁFICOS ADICIONALES2.10.1 DIAGRAMA DE CAJAEs un dispositivo gráfico que se usa para expresar en forma resumida, algunas medidasestadísticas de posición:El diagrama de caja describe gráficamente el rango de los datos, el rango intercuartílico (Q3 – Q1)los valores extremos y la ubicación de los cuartiles. Es una representación útil para comparargrupos de datos. Por ejemplo se resalta el hecho que el 50% de los datos está en la regióncentral entre los valores de los cuartiles Q1 y Q32.10.2 DIAGRAMA DE PUNTOSSi la cantidad de datos es pequeña, (alrededor de 20 o menos), se los puede representarmediante puntos directamente sin resumirlos en intervalos.2.10.3 DIAGRAMA DE PARETOEs un gráfico útil para identificar los efectos importantes de un proceso y las causas que losoriginan. La Ley de Pareto dice que de cualquier conjunto de eventos que pueden asociarse aun suceso, solamente unos pocos contribuyen en forma significativa mientras que los demás sonsecundarios. Generalmente hay únicamente 2 o 3 causas que explican mas de la mitad de lasocurrencias del suceso.Procedimiento para construir el diagrama de Pareto1) Categorice los datos por tipo de problema2) Determine la frecuencia y ordene en forma decreciente3) Represente la frecuencia relativa con barras4) Superponga la ojiva de la frecuencia relativa acumulada5) Determine cuales son las causas mas importantes que inciden en el suceso de interésEjemploUn fabricante ha realizado un conteo de los tipos de defectos de sus productos y ha registradosu frecuencia. Los resultados se resumen en el siguiente cuadroTipo de Defecto Frecuencia Frecuenciarelativa (%)FrecuenciaacumuladaFrecuenciaacumuladarelativa (%)A 66 0.33 66 0.33B 44 0.22 110 0.55C 34 0.17 144 0.72D 20 0.10 164 0.82E 14 0.07 178 0.89F 12 0.06 190 0.95G 10 0.05 200 1.00Representar los datos con un Diagrama de ParetoIng. Luis Rodríguez Ojeda, MSc.30
  31. 31. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLDiagrama de ParetoSe puede observar que más del 70% de los defectos de producción corresponden a los tipos A,B y C. Con esta información, una decisión adecuada sería asignar recursos para solucionarestos tipos de problemas pues son los que ocurren con mayor frecuencia.2.10.4 DIAGRAMA DE TALLO Y HOJASEs un dispositivo utilizado cuando la cantidad de datos es pequeña. Permite describir ladistribución de frecuencia de los datos agrupados pero sin perder la información individual de losdatos.La longitud de cada fila ayuda a visualizar la frecuencia, en forma parecida a un histograma peroal mismo tiempo se pueden observar individualmente los datos.Se construye escribiendo verticalmente las primera(s) cifra(s) de los datos (tallo) y escribiendolas restantes cifras horizontalmente (hojas)Ejemplo. Los siguientes datos corresponden a la cantidad de artículos defectuosos producidosen una fábrica en 20 días:65, 36, 59, 84, 79, 56, 28, 43, 67, 36, 43, 78, 37, 40, 68, 72, 55, 62, 22, 82Dibuje el diagrama de tallo y hojasSe elige la cifra de las decenas como tallo y la cifra de las unidades como las hojas:Tallo Hojas2 2 83 6 6 74 0 3 35 5 6 96 2 5 7 87 2 8 98 2 4Ing. Luis Rodríguez Ojeda, MSc.31
  32. 32. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLEJERCICIOS1) Dibuje un diagrama de caja para los siguientes datos1.42 1.26 1.10 1.33 1.411.00 1.34 1.18 1.41 1.251.35 1.21 1.81 1.65 1.182) Dibuje un diagrama de Pareto con los siguientes datos46 4 26 15 52 2 53) Realice un diagrama de tallo y hojas con los siguientes datos8.3 4.5 9.5 1.4 8.6 7.6 4.4 6.2 9.5 6.4 2.4 3.5 1.8 4.9 4.04.6 6.1 8.7 3.1 6.0 1.7 6.2 2.4 5.8 5.0 4.6 5.4 9.4 3.4 4.03.0 4.1 2.8 3.9 5.0 7.2 3.0 1.1 4.4 4.6 7.1 6.6 7.2 2.8 2.6MATLABDibujar un diagrama de Pareto para los siguientes datos>> x = [66 44 34 20 14 12 10]; Vector con los datos>> nombres = {A B C D E F,G}; Nombres para los componentes en el diagrama>> pareto(x, nombres) Dibujar el diagrama de Pareto>> grid on Agregar cuadrículasEl dibujo resultante se muestra en la página anteriorDibujar un diagrama de caja>> x = [0.1 1.7 2.3 4.4 4.5 4.8 6.0 6.1 7.3 7.6 7.9 8.2 8.9 9.2 9.5]; Vector con datos>> boxplot(x) Diagrama de cajaIng. Luis Rodríguez Ojeda, MSc.32
  33. 33. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLIng. Luis Rodríguez Ojeda, MSc.>> boxplot(x, 1, , 0) Diagrama de cajahorizontal, con muesca33
  34. 34. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL2.11 MUESTRAS BIVARIADASEs común tener que estudiar muestras con datos que miden dos características, siendo deinterés determinar si hay alguna relación entre las dos variables.Para visualizar la relación entre los datos de una muestra bivariada, es útil graficarlos en unarepresentación que se denomina diagrama de dispersión.EjemploSe tiene una muestra de las calificaciones de 10 estudiantes de los exámenes parcial y final.ExamenParcial60 74 66 34 60 66 57 71 39 57ExamenFinal72 82 75 46 73 74 70 82 60 61Dibuje el diagrama de dispersión.Sean X: Calificación del primer parcial (variable independiente)Y: Calificación del examen final (variable dependiente)Se observa que los datos están relacionados con una tendencia lineal con pendiente positivaIng. Luis Rodríguez Ojeda, MSC.34
  35. 35. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL2.11.1 CORRELACIÓNSe usa el término correlación para describir la relación entre los datos de muestras bivariadas.Gráficos para apreciar la correlación entre dos variablesEjemplo.- Se puede decir que los datos en el ejemplo anterior tienen correlación lineal positiva2.11.2 COEFICIENTE DE CORRELACION LINEALEs una definición para cuantificar el grado de correlación lineal entre las variables. Es unamedida adimensional útil para comparar variables con unidades de medida diferentes. Primerode establecen algunas definiciones impotantesSeanX, Y: Variables muestralesn: Tamaño de la muestraX, Y : Media aritmética de X, Y, respectivamenteSX, SY: Desviaciones estándar muestralesSXY: Covarianza muestralDefinicionesMedias aritméticas muestralesnii 11X Xn == ∑ ,nii 11Yn == Y∑Varianzas muestralesn2 2X ii 11S (x x)n 1 == −−∑ ,n2 2Y ii 11S (y y)n 1 == −−∑Covarianza muestralnXY i ii 11S (x x)(yn 1 == −−∑ y)−Ing. Luis Rodríguez Ojeda, MSC.35
  36. 36. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLDefinición: Coeficiente de correlación linealXYX YSrS S= , -1 ≤ r ≤ 1Si r está cercano a 1, entonces X y Y tienen correlación lineal positiva fuerteSi r está cercano a -1, entonces X y Y tienen correlación lineal negativa fuerteSi r está cercano a 0, entonces X y Y no están correlacionadas linealmente, o es muy débilEs importante que se mida la correlación entre variables cuya asociación tenga algún sentidoAsmismo, si las variables no están correlacionadas linealmente, pudiera ser que si lo esténmediante una relación no lineal2.11.3 MATRIZ DE VARIANZAS Y COVARIANZASEs una representación ordenada de las varianzas y las covarianzas entre las variablesSi se usa la notación11 XX X, S S= = XYXY22 XX Y, S S= =Definición: Matriz de varianzas y covarianzas1 1 2i j2 1 22X X XX X 2X X XS SSS S⎡ ⎤⎡ ⎤ ⎢ ⎥=⎣ ⎦ ⎢ ⎥⎣ ⎦Es una matriz simétrica2.11.4 MATRIZ DE CORRELACIONEs una representación ordenada de los coeficientes de correlación de cada variable con la otravariable y consigo misma.Si se usa la notación11 XX X, S S= =22 XX Y, S S= =i ji jX XijX XSrS S= coeficiente de correlación lineal entre Xi y XjDefinición: Matriz de correlación1,1 1,2ij2,1 2,2r rrr r⎡ ⎤⎡ ⎤ = ⎢ ⎥⎣ ⎦⎣ ⎦Es una matriz simétrica. Los valores en la diagonal principal son iguales a 1Las definiciones de matriz de varianzas-covarianzas y matriz de correlación, puedenextenderse directamente a más variablesIng. Luis Rodríguez Ojeda, MSC.36
  37. 37. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLIng. Luis Rodríguez Ojeda, MSC.EjemploSe tienen una muestra de las calificaciones de 10 estudiantes del primer parcial y del segundoparcial.PrimerParcial60 74 66 34 60 66 57 71 39 57SegundoParcial72 82 75 46 73 74 70 82 60 61Encuentre el coeficiente de correlación lineal e interprete el resultadoSoluciónSean:X: Calificación del primer parcialY: Calificación del segundo parcialnii 11 1x x (60 74 66 34 60 66 57 71 39 57) 58.4n 10== = + + + + + + + + + =∑n2 2 2 2 2X ii 11 1s (x x) [(60 58.4) (74 58.4) ... (57 58.4) ] 166.4889n 1 9== − = − + − + + − =−∑2x Xs s 166.4889 12.9031= = =nii 11 1y y (72 82 75 46 73 74 70 82 60 61) 69.5n 10== = + + + + + + + + + =∑n2 2 2 2 2Y ii 11 1s (y y) [(72 69.5) (82 69.5) ... (61 69.5) ] 121.8333n 1 9== − = − + − + + − =−∑2Y Ys s 121.8333 11.0378= = =nXY i ii 11S (x x)(y y)n 11[(60 58.4)(72 69.5) (74 58.4)(82 69.5) ...9(57 58.4)(61 69.5)] 134.1111== − −−= − − + − − ++ − − =∑Coeficiente de correlaciónXYX YS 134.1111r 0.9416S S (12.9031)(11.0378)= = =El resultado indica que la correlación es fuertemente positivaEscriba las matrices de varianzas-covarianzas y de correlación.Sean 11 XX X, S S= = XY22 XX Y, S S= =Matriz de varianzas-covarianzas1 1 2i j2 1 22X X XX X 2X X XS S 166.4889 134.1111S134.1111 121.8333S S⎡ ⎤ ⎡ ⎤⎡ ⎤ ⎢ ⎥= = ⎢ ⎥⎣ ⎦ ⎢ ⎥ ⎣ ⎦⎣ ⎦37
  38. 38. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLMatriz de correlacióni ji jX XijX XSr , sustituyendo los valores respectivos se obtieneS S=Con la definición:1,1 1,2ij2,1 2,2r r 1 0.9416rr r 0.9416 1⎡ ⎤ ⎡ ⎤⎡ ⎤ = =⎢ ⎥ ⎢ ⎥⎣ ⎦⎣ ⎦⎣ ⎦EJERCICIOSLos siguientes datos representan el tiempo, en horas, de entrenamiento de los trabajadores deuna empresa, y el teimpo que tardaron, en minutos, en realizar la actividad encomendadaExamenParcial10 5 12 8 6 8 4 10ExamenFinal9 12 8 10 13 11 12 8a) Dibuje el diagrama de dispersión e indique que tipo de correlación parecen tener las variablesX y Yb) Escriba la matriz de varianzas y covarianzasc) Escriba la matriz de correlaciónd) Calcule el coeficiente de correlación e interprete el resultadoIng. Luis Rodríguez Ojeda, MSC.38
  39. 39. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLIng. Luis Rodríguez Ojeda, MSC.MATLABVectores con datos de dos variables>> x=[60 74 66 34 60 66 57 71 39 57];>> y=[72 82 75 46 73 74 70 82 60 61];Diagrama de dispersión. El gráfico aparece en la primera página de esta sección>> scatter(x,y,k)>> grid onMatriz de varianzas y covarianzas>> v=cov(x,y)v =166.4889 134.1111134.1111 121.8333Matriz de correlación>> r=corrcoef(x,y)r =1.0000 0.94160.9416 1.0000Varianza, covarianza y coeficiente de correlación:>> vx = v(1,1) Varianza de Xvx =166.4889>> vy = v(2,2) Varianza de Yvy =121.8333>> vxy = v(2,1) Covarianza de X, Yvxy =134.1111>> rxy = r(2,1) Coeficiente de correlación de X, Yrxy =0.9416>> v=diag(cov(x,y)) Vector con las varianzas (es la diagonal de la matriz)v =166.4889121.8333>> s=sqrt(diag(cov(x,y))) Vector con las desviaciones estándars =12.903111.037839
  40. 40. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL3 FUNDAMENTOS DE LA TEORÍA DE LA PROBABILIDADEn esta unidad se escriben algunas definiciones necesarias para fundamentar el estudio de lateoría de la probabilidad.3.1 EXPERIMENTO ESTADÍSTICOEs un procedimiento que se realiza con el propósito de obtener observaciones para algúnestudio de interés. Un experimento requiere realizar pruebas o ensayos para obtener resultados.Un experimento estadístico tiene las siguientes características1. Se conocen todos los resultados posibles antes de realizar el experimento estadístico.2. No se puede predecir el resultado de cada ensayo realizado (propiedad de aleatoriedad)3. Debe poderse reproducir o repetir el experimento en condiciones similares.4. Se puede establecer un patrón predecible a lo largo de muchas ejecuciones del experimento.Esta propiedad se denomina regularidad estadística.Ejemplos1) Lanzar un dado y observar el resultado obtenido.2) Medir la altura de una persona3) Observar el tipo de defecto de un artículo producido por una fábrica3.2 ESPACIO MUESTRALEl espacio muestral, representado con la letra S, es el conjunto de todos los resultados posiblesde un experimento. Cada elemento de S se denomina punto muestral.Según la naturaleza del experimento, los puntos muestrales pueden determinar que S seadiscreto o continuo.S es discreto si sus elementos pueden ponerse en correspondencia con los números naturales.En este caso S puede se finito o infinito.S es continuo si los resultados corresponden a algún intervalo de los números reales. En estecaso S es infinito por definición.EjemplosExperimento: Lanzar un dado y observar el resultadoEspacio muestral: S={1, 2, 3, 4, 5, 6]Propiedades de S: discreto y finitoExperimento: Elegir al azar dos artículos de un lote y observar la cantidad de artículosdefectuososEspacio muestral: S={0, 1, 2}Propiedades de S: discreto y finitoExperimento: Lanzar un dado y contar la cantidad de intentos hastaobtener como resultado el 6Espacio muestral: S={1, 2, 3, . . .}Propiedades de S: discreto e infinitoExperimento: Medir el peso en gramos de un artículo elegido al azarEspacio muestral: S={x | x>0, x∈R}Propiedades de S: continuo (infinito por definición)Ing. Luis Rodríguez Ojeda, MSc.40
  41. 41. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL3.3 EVENTOSUn evento es algún subconjunto del espacio muestral S. Se usan letras mayúsculas para denotareventos.Ejemplo:Experimento: Lanzar un dado y observar el resultadoEspacio muestral: S = {1, 2, 3, 4, 5, 6]Sea el evento de interés: A: el resultado es un número parEntonces: A = {2, 4, 6}DefinicionesEvento nulo: No contiene resultadosEvento simple: Contiene un solo resultadoEventos excluyentes: Eventos que no contienen resultados comunes3.4 σ-ALGEBRAEl soporte matemático natural para el estudio de las propiedades de los eventos es la Teoría deConjuntos. Pero existe un álgebra formal específica para su estudio denominada σ-algebra(sigma álgebra).σ-algebra A es una colección no vacía de subconjuntos de S tales que1) S ∈ A2) Si A ∈ A, entonces AC∈ A3) Si A1, A2, ... ∈ A, entonces ∈∞= AU i1i AEn resumen σ-algebra A incluye a S, a sus subconjuntos y es cerrada con respecto a laoperación de unión de conjuntos.Ing. Luis Rodríguez Ojeda, MSc.41
  42. 42. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL3.5 TÉCNICAS DE CONTEOEn esta sección revisamos algunas fórmulas básicas para conteo de elementos de conjuntos conlas cuales, en las siguientes unidades, se podrá asignar valores de probabilidad a eventos.Definción: Principio básico del conteoSi un conjunto tiene n elementos y otro conjunto tiene m elementos, entoncesexisten nxm formas diferentes de tomar un elemento del primer conjunto y otroelemento del segundo conjunto.Ejemplo: Para ir de su casa a la universidad un estudiante debe ir primero a una estaciónintermedia de transferencia:Sean A: Casa del estudianteB: Estación intermedia de transferenciaC: UniversidadSuponga que hay tres líneas de buses para ir de A a B y que desde B para llegar a C, puedeusar el bus de la universidad o el carro de un amigo.¿De cuantas formas diferentes puede ir de su casa a la universidad?Respuesta. Sean 1, 2, 3 las líneas de buses de A a B, y 4, 5 las formas de ir de B a C.Representemos las diferentes opciones mediante un diagrama de árbol.Para ir de A a B hay 3 formas diferentes y para ir de B a C, hay 2 formas diferentes.Por lo tanto, para ir de A a C hay 3x2 = 6, formas diferentes.El conjunto de resultados posibles para este experimento es:S = {(1, 4), (1, 5), (2, 4), (2, 5), (3, 4), (3, 5)}Ejemplo. ¿Cuantos números de placas diferentes pueden existir en la provincia del Guayas?Respuesta. Cada número de placa tiene la siguiente estructura:G (letra) (letra) (dígito) (dígito) (dígito)Hay 26 letras diferentes (sin incluir ñ) y 10 dígitos diferentes. Si no importa repetir letras o dígitosen cada placa, el total es: 26 x 26 x 10 x 10 x 10 = 676000Ing. Luis Rodríguez Ojeda, MSc.42
  43. 43. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLEjemplo. Un grupo de 10 personas debe elegir a su directiva; presidente, secretario, tesorero.Todos pueden ser elegidos, pero una persona no puede tener más de un cargo. ¿De cuantasmaneras diferentes puede realizarse la elección?RespuestaPara elegir presidente hay 10 formas diferentesPara elegir secretario quedan 9 formas diferentesPara elegir tesorero quedan 8 formas diferentesPor el principio básico del conteo, hay 10 x 9 x 8 = 720 formas diferentes de realizar la elección.EJERCICIOS1) Un taller de mantenimiento tiene tres técnicos: A, B, C. Cierto día, dos empresas X, Yrequieren un técnico cada una. Describa el conjunto de posibles asignaciones si cada técnicopuede ir solamente a una empresa.2) En el ejercicio anterior, suponga que el mismo técnico debe ir primero a la empresa X y luegoa la empresa Y. Describa el conjunto de posibles asignaciones.3) Hay tres paralelos para el curso de Cálculo Diferencial y tres paralelos para Algebra Lineal.Un estudiante desea tomar ambos cursos. Escriba el conjunto de posibles asignaciones.4) En un curso preuniversitario los exámenes solían contener 20 preguntas y cada una concinco opciones. ¿De cuantas formas diferentes se podía contestar el examen?Ing. Luis Rodríguez Ojeda, MSc.43
  44. 44. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL3.6 PERMUTACIONESSon los arreglos diferentes que se pueden hacer con los elementos de un conjunto.En estos arreglos se debe considerar el orden de los elementos incluidos.Suponga un conjunto de n elementos diferentes, del cual se toma un arreglo de r elementos.Si se incluye un elemento en cada arreglo, la cantidad de arreglos diferentes que se obtiene es:n (Cualquiera de los n elementos puede ser elegido)Si se incluyen 2 elementos en cada arreglo, la cantidad de arreglos diferentes que se obtiene esn(n-1) (Para elegir el segundo elemento quedan n – 1 disponibles)Si se incluyen 3 elementos en cada arreglo, la cantidad de arreglos diferentes que se obtiene esn(n-1)(n-2) (Para elegir el tercer elemento quedan n – 2 disponibles). . .Si se incluyen r elementos en cada arreglo, la cantidad de arreglos diferentes que se obtiene esn(n-1)(n-2). . .(n-r+1) (Para elegir el elemento r quedan n – r + 1 disponibles)Con eso se puede escribir la fórmula general para la cantidad de permutaciones:Definición: Número de permutacionesNúmero de permutaciones con n elementos de un conjunto del cual se tomanarreglos conteniendo r elementosnPr = n(n-1)(n-2). . .(n-r+1)Ejemplo. Un grupo de 10 personas debe elegir a su directiva; presidente, secretario, tesorero.Todos pueden ser elegidos, pero una persona no puede tener más de un cargo. ¿De cuantasmaneras diferentes puede realizarse la elección?. Use la fórmula (7.1)Respuesta. Los arreglos posiles son permutaciones pues el orden en cada uno si es de interés.Por lo tanton =10, r =3, 10P3 = 10x9x8 = 720La fórmula de permutaciones se puede expresar en notación factorial completando el producto::Definición: Fórmula alterna para calcular el número de permutacionesnPr = n(n-1)(n-2). . .(n-r+1)n(n 1)(n 2)...(n r 1)(n r)(n r 1)...(2)(1) n!(n r)(n r 1)...(2)(1) (n r)!− − − + − − −= =− − − −Ing. Luis Rodríguez Ojeda, MSc.44
  45. 45. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLCASOS ESPECIALES3.6.1 PERMUTACIONES CON TODOS LOS ELEMENTOSDefinición: Permutaciones con todos los elementos de un conjuntonPn !n!0!n)!nn(!n==−= , n: Cantidad de elementos del conjuntoEjemplo: ¿Cuantos arreglos diferentes se pueden hacer colocando en una hilera 5 lápices decolores?Respuesta: Son permutaciones con todos los elementos: 5P5 = 5! = 1203.6.2 ARREGLO CIRCULARSuponga un grupo conteniendo n elementos diferentes. Un arreglo circular es una permutacióncon todos los elementos del grupo. Para que cada arreglo sea diferente, uno de los elementosdebe mantenerse fijo y los otros pueden cambiar el orden.Definición: Número de permutaciones en un arreglo circularSi n es el número total de elementos, la cantidad de arreglos diferentes es: (n-1)!Ejemplo: ¿De cuantas formas diferentes pueden colocarse 5 personas alrededor de una mesa?Respuesta: 4! = 243.6.3 PERMUTACIONES CON ELEMENTOS REPETIDOSSi del total de n elementos, n1 fuesen repetidos, entonces los arreglos tendrían formas idénticascuando se considera el orden de los n1 elementos repetidos. Existen n1! formas de tomar los n1elementos repetidos, por lo tanto, la cantidad de permutaciones se reduciría en n1!Definición: Cantidad de permutaciones con n elementos de los cuales n1 son repetidos!n!n1Este razonamiento, puede extenderse cuando hay maá grupos de elementos repetidosSean: n: Cantidad total de elementosn1: Cantidad de elementos repetidos de un tipon2: Cantidad de elementos repetidos de otro tipoSe debe cumplir que n1 + n2 = nIng. Luis Rodríguez Ojeda, MSc.45
  46. 46. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLDefinición: Permutaciones con dos tipos de elementos repetidosn elementos de los cuales n1 son de un tipo y n2 son de otro tipo!n!n!n21Ejemplo: En una caja hay 3 botellas de vino tinto y 2 de vino blanco. Las botellas de cada unode los dos tipos de vino tienen la misma marca y forma. ¿De cuantas formas diferentes puedencolocarse en una hilera las 5 botellas?Respuesta: Son permutaciones con elementos repetidos con n=5, n1=3, n2=2,103!!2!5=La fórmula se puede generalizar a más grupos con elementos repetidosDefinición: Permutaciones con n elementos y k grupos con elementos repetidosSean n: total de elementos distribuidos en k gruposn1: Número de elementos repetidos de tipo 1n2: Número de elementos repetidos de tipo 2..nk: Número de elementos repetidos de tipo kSiendo n1 + n2+ … +nk = nCantidad de arreglos diferentes que se pueden obtener!n...!n!nn!k21.Ejemplo. ¿Cuántos arreglos diferentes pueden hacerse con las letras de la palabraMATEMÀTICA?n=10.n1=2 (repeticiones de la letra M)n2=3 (repeticiones de la letra A)n3=2 (repeticiones de la letra T)las otras letras ocurren una sola vezRespuesta:10!2! 3! 2! 1! 1! 1!= 151200Ing. Luis Rodríguez Ojeda, MSc.46
  47. 47. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL3.7 COMBINACIONESSon los arreglos que se pueden hacer con los elementos de un conjunto. El orden de loselementos en cada arreglo no es de interés. Cada arreglo se diferencia únicamente por loselementos que contiene.Sean n: Cantidad de elementos del conjuntor: Cantidad de elementos en cada arregloSe usa la notación nCr, o , o para denotar la cantidad de combinaciones de tamaño rque se pueden realizar con los n elementos distintos de un conjuntonrC ⎟⎟⎠⎞⎜⎜⎝⎛rnPara obtener la fórmula del número de combinaciones, consideremos la fórmula de laspermutaciones. Debido a que en las combinaciones no interesa el orden de los elementos encada arreglo, es equivalente a tener permutaciones con elementos repetidos:Definición: Número de combinacionesConjunto con n elementos del cual se toman arreglos conteniendo r elementosnCrn rP n! n(n 1)(n 1)...(n r 1)r! (n r)! r! r!− − − += = =−Ejemplo. Un bar dispone de 10 frutas diferentes de las cuales se pueden elegir tres para unbatido. ¿De cuantas maneras diferentes puede hacerse la elección?Respuesta: Son combinaciones pues el orden de las frutas no es de interés.n=10, r=3, ⇒ 10C310!1207! 3!= =Ejemplo. En un grupo de 15 personas, 7 leen la revista A, 5 leen la revista B y 6 ningunarevista. Encuentre la cantidad de personas que leen al menos una revistaRespuesta. Para el cálculo puede usarse una representación gráfica de conjuntos, pero unarepresentación tabular facilita hallar el número de elementos de cada evento.Primero se colocan en el cuadro los datos (color negro). y luego se completa el cuadro con losvalores faltantes (color azul). Para los cálculos se ha seguido el orden indicado en el dibujo.Ing. Luis Rodríguez Ojeda, MSc.47
  48. 48. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLDel cuadro se obtiene directamente que4 leen A, únicamente2 leen B, únicamente3 leen A y BPor lo tanto, 9 personas leen al menos una revistaCantidad de formas diferentes de elegir cuatro personas que al menos lean una revista49!5! !=Respuesta: 9C4 = 126Cantidad de formas diferentes de elegir 4 personas de tal manera que 2 solamente lean A, 1solamente B, y 1 no lea revistas.Respuesta:Cantidad de formas diferentes de elegir 2 de las que solamente leen A: 4C2 = 6Cantidad de formas diferentes de elegir 1 de las que solamente leen B: 2C1 = 2Cantidad de formas diferentes de elegir 1 de las que no leen revistas: 6C1 = 6Por el principio básico del conteo el resultado final es: 6 x 2 x 6 = 72EJERCICIOS1) Una caja contiene cinco libros de Matemáticas y una segunda caja contiene 4 libros de Física.¿De cuantas maneras diferentes se puede tomar un libro para materia? a) si todos los libros sondiferentes, b) si los libros de cada materia son iguales2) Para un proyecto se requiere dos ingenieros y tres técnicos. Si hay cuatro ingenieros y cincotécnicos disponibles. ¿De cuantas maneras se puede hacer la elección?3) Una caja contiene 6 baterías de las cuales 2 son defectuosas. ¿De cuantas maneras sepueden tomar tres baterías de tal manera que solamente haya una defectuosa?4) En un grupo de 60 estudiantes, 42 están registrados en Análisis Numérico, 38 en Estadísticay 10 no están registrados en ninguna de estas dos materias. ¿Cuantos están registradosúnicamente en Estadística? ¿Cuantos están registrados en Estadística pero no en AnálisisNumérico?5) El cable de seguridad de una bicicleta tiene un candado que contiene 4 discos. Cada discotiene seis números. Si probar cada combinación toma cinco segundos, determine el tiempomáximo que le tomará a una persona encontrar la clave para quitar el cable de seguridad quesujeta a la bicicletaIng. Luis Rodríguez Ojeda, MSc.48
  49. 49. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLIng. Luis Rodríguez Ojeda, MSc.MATLAB>> c = nchoosek(9,4) Cálculo de 9C4c = 126>> r = factorial(5) Factorial de 5r = 120>> x=[2 3 5 7]; Conjunto de 4 elementos>> lista=combnk(x,3) Lista de combinaciones de 3 elementoslista =2 3 52 3 72 5 73 5 7>> n=length(lista) Número de combinacionesn = 4>> x=[3 5 7]; Conjunto de tres elementos>> lista=perms(x) Lista de permutacioneslista =7 5 37 3 55 7 35 3 73 5 73 7 5>> x = {Juan, Pedro, Pablo}; Conjunto con tres elementos>> lista=combnk(x,2) Lista de combinaciones de 2 elementoslista =Juan PedroJuan PabloPedro Pablo49
  50. 50. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL3.8 PROBABILIDAD DE EVENTOSEl valor de la probabilidad de un evento es una medida de la certeza de su realizaciónSea A un evento, entonces P(A) mide la probabilidad de que el evento A se realiceP(A)=0 es la certeza de que no se realizaráP(A)=1 es la certeza de que si se realizaráP(A)=0.5 indica igual posibilidad de que se realice o no se realice.Asignación de valores de probabilidad a eventos1) EmpíricaEs la proporción de veces que un evento tuvo el resultado esperado respecto al total deintentos realizados.Ejemplo. Se han realizado 20 ensayos en un experimento en condiciones similares. Cuatroensayos tuvieron el resultado esperado. Entonces, la probabilidad que en el siguiente ensayose obtenga el resultado esperado es aproximadamente: 4/20=0.2=20%2) Mediante modelos matemáticosPara muchas situaciones de interés puede definirse un modelo matemático para determinar laprobabilidad de eventos. Algunos de estos modelos son estudiados en este curso, tanto paravariables discretas como continuas.3) Asignación clásicaSu origen es la Teoría de Juegos. El valor de probabilidad de un evento es la cantidad deresultados que están asociados al evento de interés, respecto del total de resultados posibles(espacio muestral). Esta forma de asignar probabilidad es de uso frecuente.Definición: Asignación clásica de probabilidad a eventosSean S: Espacio muestralA: Evento de interés .Si N(S) y N(A) representan su cardinalidad (número de elementos)Entonces la probabilidad del evento A es:N(A)P(A)N(S)=.Ejemplo. Calcule la probabilidad que al lanzar una vez un dado y una moneda se obtenga unnúmero impar y selloSi c, s representan los valores cara y sello de la moneda, entonces el espacio muestral es:S = {(1,c),(2,c),(3,c),(4,c),(5,c),(6,c),(1,s),(2,s),(3,s),(4,s),(5,s),(6,s)}Mientras que el evento de interés es: A = {(1,s),(3,s),(5,s)}Repuesta: P(A) = N(A)/N(S) = 3/12 = 1/4 = 0.25 = 25%Ejemplo. En un grupo de 15 personas, 7 leen la revista A, 5 leen la revista B y 6 ningunarevista.Encuentre la probabilidad que al elegir al azar una persona, ésta lea al menos una revistaRespuesta: Representación tabular de datos:Leen B No leen BLeen A 3 4 7No leen A 2 6 85 10 15Ing. Luis Rodriguez Ojeda, MSc.50
  51. 51. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL4 únicamente leen A2 únicamente leen B3 leen A y BPor lo tanto, 9 personas leen al menos una revistaSeanE: Evento que la persona elegida al azar lea al menos una revistaS: Incluye todas las formas diferentes para elegir una personaEntoncesP(E) = N(E)/N(S) = 9/15 = 0.6La probabilidad que al elegir al azar tres personas, dos lean ambas revistas y una no learevistas.Respuesta:SeanE: Evento que dos personas lean ambas revistas y una no lea revistasS: Incluye todas las formas diferentes de elegir tres personasN(S) = 15C3 = 455Cantidad de formas diferentes de elegir 2 de las 3 que leen ambas3C2 = 3Cantidad de formas diferentes de elegir 1 de las 6 que no leen revistas6C1 = 6Por el Principio Básico del Conteo, la cantidad de elementos en el evento EN(E) = 3 x 6 = 18Por lo tantoP(E) = N(E)/N(S) = 18/455 = 0.0396 = 3.96%Ejemplo. Suponga que se ha vendido una serie completa de las tablas del Peso Millonario.Calcule la probabilidad que al comprar una tabla usted sea el único ganador del premio.Respuesta:Sea S: conjunto de tablas del Peso Millonario (cada tabla es diferente y contiene 15 númerosdiferentes elegidos al azar entre los enteros del 1 al 25),N(S) = 25C15 = 3268760 (cantidad de tablas diferentes que se generan)E: evento de tener la tabla premiada (solamente hay una tabla premiada)P(E) = N(E)/N(S) = 1/3268760 ≅ 0.0000003 (cercano a cero)Para tomar una idea de lo pequeño que es este número imagine cual sería su chance de sacarel premio si en una caja hubiesen 1000 tablas entre las que está la tabla ganadora. Usted debeelegir al azar la tabla ganadora. Es muy poco probable que acierte.Ahora suponga que en en una bodega hay 3268 cajas, cada una con 1000 tablas. Primerousted debe elegir al azar la caja que contiene la tabla ganadora, y luego de esta caja elegir alazar la tabla ganadora. Concluimos que su chance de obtener el premio en verdad es un sueñoIng. Luis Rodriguez Ojeda, MSc.51
  52. 52. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL3.8.1 PROBABILIDAD DE LOS ELEMENTOS DE UN EVENTOCada uno de los elementos de un evento tiene el mismo valor de probabilidadDefinición: Probabilidad de eventos simplesSean S: Espacio muestral, con N puntos muestralesEi: Evento simple (contiene un solo punto muestral)Entonces para cada evento simpleP(Ei) = 1/N, i = 1, 2, 3, ..., N .Por lo tanto .1EPN1ii =∑=)(Si un evento A contiene k puntos muestrales, entoncesP(A)=k (1/N)Ejemplo. Al lanzar un dado, ¿Cual es la probabilidad que al lanzarlo salga un número par?Respuesta: S = {1, 2, 3, 4, 5, 6}A = {2, 4, 6} (evento de interés)P(A) = P(E1) + P(E2) + P(E3) = 3 (1/6) = 0.5Ejemplo. Suponga que un dado está desbalanceado de tal manera que se conoce que laprobabilidad que salga el número 6 es el doble que los otros números. ¿Cual es la probabilidadque al lanzarlo salga un número par?Respuesta: En este ejempl los puntos muestrales no tienen el mismo la misma probabilidad1/6.Sea x, probabilidad que salga alguno de los números 1, 2, 3, 4, 5. Por lo tanto, la probabilidadque salga el número 6 es el doble, 2xEntonces x + x + x + x + x + 2x = 1 ⇒ x = 1/7Sean A: Evento que salga un número par, A = {2, 4, 6}Ei: Evento simple correspondiente a cada resultado iP(A) = P(E2) + P(E4) + P(E6) = 1/7 + 1/7 + 2/7 = 4/73.9 AXIOMAS DE PROBABILIDAD DE EVENTOSEn esta sección se introduce la formalidad matemática para la teoría de la probabilidad deeventos.Sea S: Espacio muestral (suponer discreto y finito)E: Evento de SP(E): Probabilidad del evento Eℜ: Conjunto de los realesP es una función que asocia a cada evento E de S un número realP: S → ℜ ,E→P(E) dom P = S, rg P = [0, 1]P es una función de probabilidad y cumple los siguientes axiomas1) P(E) ≥ 02) P(S) = 13) E1, E2 ∈ S ∧ E1 ∩ E2 = ∅ ⇒ P(E1 ∪ E2) = P(E1) + P(E2)Ing. Luis Rodriguez Ojeda, MSc.52
  53. 53. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLEl tercer axioma establece que si dos eventos son mutuamente excluyentes entonces laprobabilidad del evento unión de estos eventos es la suma de las probabilidades de cadaevento. Esta propiedad se puede extender a más eventos.Algunas propiedades de eventos con demostraciones basadas en los axiomas1) (∅) = 0 Probabilidad de un evento nuloDemostración: S = S∪∅ eventos excluyentes⇒ P(S) = P(S) + P(∅) por el axioma 3⇒ 1 = 1 + P(∅) por el axioma 2⇒P(∅) = 02) P(Ec) = 1 – P(E) Probabilidad del evento complementoDemostración: S = E∪Eceventos excluyentes⇒P(S) = P(E) + P(Ec) por el axioma 3⇒1 = P(E) + P(Ec) por el axioma 2⇒P(Ec) = 1 – P(E)3) Sean A, B eventos de S, tales que A ⊂ B, entonces P(A) ≤ P(B)Demostración: Si A está incluido en B se puede escribirB = A ∪ (AC∩ B) eventos excluyentesP(B) = P(A) + P(AC∩ B) por el axioma 3P(B) ≥ P(A) por el axioma 14) Sea A un evento cualquiera de S, entonces 0 ≤ P(A) ≤ 1Demostración ⊂ A ⊂ S∅P( ∅ ) ≤ P(A) ≤ P(S) por la propiedad 30 ≤ P(A) ≤ 1 por la propiedad 1 y axioma 25) P(A∩Bc) = P(A – B) = P(A) – P(A∩B)Demostración: A = (A – B)∪(A∩B) eventos excluyentes⇒P(A) = P(A – B) + P(A∩B) axioma 3⇒P(A – B) = P(A) –- P(A∩B)6) P(A∪B) = P(A) + P(B) – P(A∩B) Regla aditiva de la probabilidadDemostración: A∪B = (A – B)∪(A∩B)∪(B – A) eventos excluyentes⇒P(A∪B) = P(A – B) + P(A∩B) + P(B – A) axioma 3⇒P(A∪B) = P(A – B) + P(A∩B) + P(B – A) + P(A∩B)– P(A∩B)con la propiedad 5⇒P(A∪B) = P(A) + P(B) – P(A∩B)Ejemplo. En un grupo de 15 personas, 7 leen la revista A, 5 leen la revista B y 6 ningunarevista. Encuentre la probabilidad que al elegir al azar una persona, ésta lea al menos unarevistaRespuesta: Representación tabular para los datos:Leen B No leen B4 únicamente leen A2 únicamente leen B3 leen A y BEntonces, 9 personas leen al menos una revistaLeen A 3 4 7No leen A 2 6 85 10 15Ing. Luis Rodriguez Ojeda, MSc.53
  54. 54. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLUsamos ahora las reglas de la probabilidad de eventos para resolver este problemaSean los eventosA: la persona elegida al azar lea la revista AB: la persona elegida al azar lea la revista BA∪B: la persona elegida al azar lee al menos una revistaPor lo tanto P(AUB) = P(A) + P(B) - P(A∩B) = 7/15 + 5/15 – 3/15 = 9/15 = 0.6Ejemplo. Sean A, B eventos de S, tales queP(A) = 0.35, P(Bc) = 0.27, P(Ac∩B) = 0.59Calculea) P(A∩B)b) P(A∪B)c) P(A∪Bc)d) P(Ac∪Bc)RespuestaUna representación tabular de los valores de probabilidad facilita los cálculos.B BcA 0.14 0.21 0.35Ac0.59 0.06 0.650.73 0.27 1Cada respuesta se la obtiene directamente de la tabla:a) P(A∩B) = 0.14b) P(A∪B) = P(A) + P(B) - P(A∩B) = 0.35 + 0.73 - 0.14 = 0.94c) P(A∪Bc) = P(A) + P(Bc) – P(A∩Bc) = 0.35 + 0.27 – 0.21 = 0.41d) P(Ac∪Bc) = P(Ac) + P(Bc) – P(Ac∩Bc)= 0.65 + 0.27 – 0.06 = 0.86LAS PROPIEDADES PUEDEN EXTENDERSE A MÁS EVENTOSSean A, B, C, tres eventos del espacio muestral SDefinicionesSi A, B, C son eventos mutuamente excluyentes,P(A∪B∪C) = P(A) + P(B) + P(C)Si A, B, C son eventos cualesquieraP(A∪B∪C) = P(A) + P(B) + P(C) - P(A∩B) - P(A∩C) - P(B∩C) + P(A∩B∩C)Ing. Luis Rodriguez Ojeda, MSc.54
  55. 55. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLEJERCICIOS1) En una fábrica hay cinco motores, de los cuales tres están defectuosos. Calcule laprobabilidad que al elegir dos motores al azar,a) Ambos estén en buen estadob) Solamente uno esté en buen estadoc) Al menos uno esté en buen estado2) En un grupo de 60 estudiantes, 42 están registrados en Análisis Numérico, 38 enEstadística y 10 no están registrados en ninguna de estas dos materias. Calcule la probabilidadque al elegir entre los 60 algún estudiante al azar,a) Esté registrado únicamente en Estadísticab) Esté registrado en ambas materias3) Sean A, B eventos cualesquiera de un espacio muestral.Si P(A)=0.34, P(B)=0.68, P(A∩B)=0.15, calculea) P(A∪B)b) P(A∩Bc)c) P(Ac∪Bc)4) En una encuesta en la ciudad se ha hallado queLa probabilidad que una familia tenga TV es 0.7La probabilidad que una familia tenga reproductor de DVD es 0.4La probabilidad que una familia tenga TV pero no tenga reproductor de DVD es 0.36Calcule la probabilidad que una familia tenga ni TV ni reproductor de DVDa) Use una representación tabularb) Use únicamente reglas de probabilidadIng. Luis Rodriguez Ojeda, MSc.55
  56. 56. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL3.10 PROBABILIDAD CONDICIONALLa probabilidad de un evento puede depender o estar condicionada a la probabilidad de otroevento.Ejemplo. Un experimento consiste en lanzar una vez un dado y una moneda.Si c, s representan los valores cara y sello de la moneda, entonces el espacio muestral S es:S = {(1,c),(2,c),(3,c),(4,c),(5,c),(6,c),(1,s),(2,s),(3,s),(4,s),(5,s),(6,s)}Sea el evento de interés, A: obtener el número 5 y selloEntonces P(A) = 1/12 ≅ 0.0833Ahora, suponga que luego de lanzar el dado y la moneda, nos informan que el número deldado fue impar. ¿Cual es la probabilidad del evento A dado el evento indicado?Sea B este evento conocido: B = {(1,c),(3,c),(5,c),(1,s),(3,s),(5,s)}Entonces, la probabilidad del evento A dado el evento B, es 1/6 ≅ 0.1667Definición: Probabilidad condicionalSean A, B eventos de SLa probabilidad condicional del evento A dado el evento B se escribe P(A|B) y es:P(A B)P(A | B) , P(B) 0P(B)∩= ≠Para justificar esta importante fórmula, suponga que S contiene solo dos eventos, A y B.En la siguiente tabla se ha escrito simbólicamente el número de elementos de cada evento,siendo N el total de elementos del espacio muestralB BcA n1 n2Acn3 n4NEntonces,111 31 3nn P(A B)NP(A | B)n nn n P(B)N∩= = =++P(A|B) es una función de probabilidad pues cumple los axiomas anteriormente expuestos.Ejemplo.- Use la fórmula de la probabilidad condicional para el ejemplo anterior,A∩B = {(5, s)} ⇒P(A B) 1/12P(A | B) 1/6P(B) 6/12∩= = =Ing. Luis Rodríguez Ojeda, MSc.56
  57. 57. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLIng. Luis Rodríguez Ojeda, MSc.Ejemplo. Las enfermedades A y B son comunes entre las personas de una región. Supongaconocido que 10% de la población contraerá la enfermedad A, 5% la enfermedad B, y 2%ambas enfermedades.Encuentre la probabilidad que cualquier personaa) Contraiga al menos una enfermedadb) Contraiga la enfermedad A pero no Bc) Contraiga la enfermedad A dado que ya contrajo Bd) Contraiga la enfermedad B dado que no contrajo Ae) Contraiga ambas enfermedades dado que ya contrajo al menos una.Para facilitar el cálculo completamos el cuadro de probabilidades, siendo A y Blos eventos que corresponden a contraer las enfermedades A y B respectivamenteB BcA 0.02 0.08 0.10Ac0.03 0.87 0.900.05 0.95 1Ahora se puede expresar cada pregunta en forma simbólica y obtener la respuestadirectamente de cuadroRespuestasa) P(A∪B) = P(A) + P(B) – P(A∩B) = 0.1 + 0.05 – 0.02 = 0.13 = 13%b) P(A∩Bc) = 0.08 = 8%c) P(A|B) = P(A∩B)/P(B) = 0.02/0.05 = 0.4 = 40%d) P(B|Ac) = P(B∩Ac)/P(Ac) = 0.03/0.9 = 0.3 = 30%e) P(A∩B)|P(A∪B)=P[(A∩B) ∩ (A∪B)]/P(A∪B)=P(A∩B)/P(A∪B) = 0.02/0.13 = 0.1538Ejemplo. En una empresa hay 200 empleados, de los cuales 150 son graduados, 60 realizantrabajo administrativo. De estos últimos, 40 son graduados. Si se toma al azar un empleado,encuentre la probabilidad que,a) Sea graduado y no realiza trabajo administrativo.b) Sea graduado dado que no realiza trabajo administrativo.c) No sea graduado dado que realiza trabajo administrativoPara facilitar el cálculo completamos el cuadro con la cantidad de elementos de cada eventoque los representamos con:G: el empleado es graduadoA: el empleado realiza trabajo administrativoA AcG 40 110 150Gc20 30 5060 140 200Como antes, los datos faltantes se los ha completado con color azulAhora se puede expresar cada pregunta en forma simbólica y obtener la respuestainmediatamenteRespuestasa) P(G∩Ac) = 110/200 = 0.55b) P(G|Ac) = P(G∩Ac)/P(Ac) = (110/200) / (140/200) = 110/140 = 0.7857c) P(Gc|A) = P(Gc∩A)/P(A) = (20/200) / (60/200) = 20/60 = 0.333357
  58. 58. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLEJERCICIOS1) Sean los eventos A, B tales que P(A)=0.4, P(B)=0.3, P(A∩B)=0.1, encuentrea) P(A|B)b) P(B|A)c) P(A|A∪B)d) P(A|A∩B)e) P(A∩B|A∪B)2) En un club de amigos, 10 practican tenis, 7 practican fútbol, 4 practican ambos deportes ylos restantes 5 no practican algún deporte. Si se elige una de estas personas al azar, calcule laprobabilidad que,a) Al menos practique un deporteb) No practique tenisc) Practique tenis y no practique fútbold) Practique tenis dado que no practica fútbol3) En una granja se tiene que la probabilidad que un animal tenga la gripe aviar es 0.3. Laprobabilidad que la reacción a una prueba sea negativa para un animal sano es 0.9, y que seapositiva para un animal enfermo es 0.8a) Calcule la probabilidad que para un animal elegido al azar, el examen sea positivob) Calcule la probabilidad que el animal elegido al azar esté enfermo, dado que elexamen fue positivoIng. Luis Rodríguez Ojeda, MSc.58
  59. 59. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL3.11 EVENTOS INDEPENDIENTESSean A y B eventos cualesquiera de un espacio muestral S, se dice que A y B sonindependientes si P(A|B) = P(A) y P(B|A) = P(B), es decir que el evento A no depende delevento B y el evento B no depende del evento ALo anterior es equivalente a la siguiente definiciónDefinición: Eventos independientesA y B son eventos independientes si P(A∩B) = P(A) P(B)Demostración:De la definición de probabilidad condicional,P(A|B) = P(A∩B)/P(B), P(B)≠0Si A y B son independientes: P(A|B) = P(A).Sustituir en la fórmula de probabilidad condicional:P(A) = P(A∩B)/P(B)De donde se despeja P(A∩B)Ejemplo. Calcule la probabilidad que el último dígito de un número de cinco dígitos elegido alazar, sea 7 y el penúltimo dígito del mismo número sea 5Sean los eventosA: el último digito es 7B: el penúltimo dígito es 5Cada evento no está relacionado con el otro: son independientes, por lo tanto,P(A∩B) = P(A) P(B) = 0.1 x 0.1 = 0.01Ejemplo. En una caja hay 10 baterías de las cuales 4 están en buen estado. Se repite dosveces el siguiente ensayo: extraer una batería al azar, revisar su estado y devolverla a lacaja. Encuentre la probabilidad que en ambos intentos se obtenga una batería en buen estado.Sean los eventosA: la primera batería está en buen estadoB: la segunda batería está en buen estadoAl devolver la batería a la caja, el evento A no afecta al evento B, por lo tanto sonindependientes: P(A∩B) = P(A) P(B) = 0.4 x 0.4 = 0.16Calcule la probabilidad que en los dos intentos se obtenga al menos una batería en buenestadoCon la conocida fórmula aditiva de probabilidad,P(A∪B) = P(A) + P(B) – P(A∩B) = 0.4 + 0.4 – 0.16 = 0.64Ing. Luis Rodríguez Ojeda, MSc.59
  60. 60. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLPregunta. Suponer que A, B son eventos no nulos, mutuamente excluyentes, de un espaciomuestral S. ¿Son A y B independientes?Si A, B son eventos no nulos, P(A)>0, P(B) >0 ⇒ P(A) P(B) >0Pero siendo A y B excluyentes, A∩B = ∅ ⇒ P(A∩B) = 0Por lo tanto, A y B no pueden ser independientes pues P(A∩B) ≠ P(A) P(B)También, se tiene que si A, B son excluyentes: P(A|B)=P(A∩B)/P(B) = 0Pero si A, B son independientes se debe cumplir: P(A|B) = P(A)Por lo tanto A, B no pueden ser independientesPregunta. Si A, B son eventos no nulos e independientes, ¿son excluyentes?Si A, B son eventos independientes y no nulos: P(A∩B) = P(A) P(B) > 0Pero P(A∩B) > 0 ⇒ A∩B ≠ ∅Por lo tanto A, B no pueden ser excluyentesNOTA: Ambos enunciados son lógicamente equivalentesSean, p: A y B son excluyentes, q: A y B son independientesp ⇒ ⎤q ≡ q ⇒ ⎤pLa definición de independencia entre eventos puede extenderse a más eventosDefinición: Eventos independientes para más eventosSi A, B, C son eventos mutuamente independientes, entoncesP(A∩B∩C) = P(A) P(B) P(C) .3.12 REGLA MULTIPLICATIVA DE LA PROBABILIDADSean A, B eventos no nulos cualquiera de S, entoncesDefinición: Regla multiplicativa de la probabilidadP(A∩B) = P(A) P(B|A)Esta fórmula se la obtiene directamente despejando P(A∩B) de la definición de ProbabilidadCondicionalEjemplo. En una caja hay 10 baterías de las cuales 4 están en buen estado. Se extraen al azardos baterías sin devolverlas a la caja. Encuentre la probabilidad que,a) Ambas estén en buen estadob) Solamente una esté en buen estadoc) Al menos una esté en buen estadod) Ninguna esté en buen estadoSean los eventosA: La primera batería está en buen estadoB: La segunda batería está en buen estadoa) La probabilidad que ambas estén en buen estado es P(A∩B), pero los eventos A yB no son independientes pues B depende del resultado de A. Entonces con lafórmula anteriorP(A∩B) = P(A) P(B|A) =4 3( )( )10 9= 2/15 =0.1333Ing. Luis Rodríguez Ojeda, MSc.60
  61. 61. PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOLLa probabilidad de éxito del evento A es 4/10. Para el evento B es 3/9, dado que Aes favorable, pues quedan 3 baterías en buen estado del total de 9 bateríasb) La probabilidad que una batería esté en buen estado y la otra en mal estado:P(A∩Bc) + P(Ac∩B) = P(A)P(Bc|A) + P(Ac)P(B|Ac)= (4/10)(6/9) + (6/10)(4/9) = 12/15 = 0.5333Los eventos en los que solamente la primera batería esté en buen estado o quesolamente la segunda batería esté en buen estado son excluyentes, por lo que susprobabilidades se suman.c) La probabilidad que al menos una esté en buen estado. Usando los resultadocalculados en a) y b):P(A∪B) = P(A∩B)∪P(A∩Bc)∪P(Ac∩B) = 2/15 + 8/15 = 2/3 =0.6666Equivale a decir que ambas estén en buen estado o que solamente una esté enbuen estado y siendo eventos excluyentes, sus probabilidades se sumand) La probabilidad que ninguna esté en buen estadoP((A∪B)c) = 1 – P(A∪B) = 1 – 2/3 = 1/3 = 0.3333Es lo contrario de que al menos una esté en buen estado.El ejemplo anterior también puede resolverse con las fórmulas de conteo conocidasa) A: evento que ambas baterías están en buen estadoN(A): cantidad de formas de sacar 2 en buen estado de las 4 existentes:N(S): cantidad de formas de sacar 2 baterías del total de 10 bateríasP(A) = N(A) / N(S) = 4C2 / 10C2 = 2/15b) A: Evento en el que una batería está en buen estado y la otra esté en mal estado.Este evento incluye las formas de sacar una batería en buen estado de las 4existente: 4C1, y una en mal estado de las 6 existentes: 6C1P(A) = 4C1 6C1 / 10C2 = 8/15c) A: ambas baterías en buen estadoB: solamente una batería en buen estadoA y B son eventos excluyentes, por lo tantoP(A∪B) = P(A) + P(B) = 2/15 + 8/15 = 10/15 = 2/3La regla multiplicativa puede extenderse a más eventos.Definición: Regla multiplicativa de la probabilidad para más eventosSean A, B, C eventos cualesquiera de S, entoncesP(A∩B∩C) = P(A) P(B|A) P(C|A∩B) .Ing. Luis Rodríguez Ojeda, MSc.61

×