SlideShare una empresa de Scribd logo
1 de 114
Descargar para leer sin conexión
APUNTE: HERRAMIENTAS DE EXCEL
PARA ESTADÍSTICA
PROFESORES: ÁLVARO TOLEDO SAN MARTÍN
INÉS VICENCIO PARDO
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
APUNTE: HERRAMIENTAS DE EXCEL
PARA ESTADÍSTICA
CÁTEDRA: ESTADÍSTICA I – ESTADÍSTICA APLICADA
2015
PROFESOR: ÁLVARO TOLEDO SAN MARTÍN
Licenciado en Matemáticas, Estadístico y
Magíster en Estadística de la Pontificia
Universidad Católica de Chile.
Coordinador de Estadística del
Departamento de Matemática y Física ,
Universidad Bernardo O´Higgins. Atiende
las cátedras de Estadística I y Estadística
II, Matemática Básica, Álgebra y Cálculo I
de la Universidad Bernardo O`Higgins
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
APUNTE: HERRAMIENTAS DE EXCEL
PARA ESTADÍSTICA
CÁTEDRA: ESTADÍSTICA I – ESTADÍSTICA APLICADA
2015
PROFESORA: INÉS VICENCIO PARDO
Profesora de Matemática y Computación,
Universidad de Santiago de Chile. Magíster
en Estadística Pontificia Universidad
Católica de Chile.
Coordinadora de Matemática y Álgebra del
Departamento de Matemática y Física ,
Universidad Bernardo O´Higgins. Atiende
las cátedras de Estadística I y Estadística II,
Matemática Básica, Álgebra y Cálculo I.
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 5
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
CONTENIDO
PRESENTACIÓN.................................................................................................................................... 7
1. Activación de la herramienta de análisis de datos de MS Office Excel. ...................................... 8
2. Confección de Tabla de frecuencias con función tabla dinámica.............................................. 10
2.1 Despliegue de opciones en Tabla Dinámica ........................................................................ 12
3. Estadística Descriptiva con la función Análisis de datos............................................................ 14
4. Construcción de un Histograma. ............................................................................................... 20
4.1 Una aplicación de medidas descriptivas.............................................................................. 27
4.2 EJERCICIOS PROPUESTOS, TEMA: TABLAS DE FRECUENCIAS, ESTADÍSTICA DESCRIPTIVA E
HISTOGRAMA................................................................................................................................ 37
5. Tablas de contingencia .............................................................................................................. 39
5.1 ESQUEMA RESUMEN DE CONSTRUCCIÓN DE TABLA DE CONTINGENCIA........................... 46
6. Probabilidades y Teorema de Bayes.......................................................................................... 47
6.1 ESQUEMA RESUMEN CON PROBLEMAS DE PROBABILIDADES Y TEOREMA DE BAYES ....... 56
6.2 EJERCICIOS PROPUESTOS, TEMA: TABLA DE CONTINGENCIA, PROBABILIDADES Y TEOREMA
DE BAYES ....................................................................................................................................... 58
7. La opción “Generación de números aleatorios” de la herramienta Análisis de datos de MS
Excel. ................................................................................................................................................. 75
7.1 “Anexo de distribuciones” de la opción “Generación de números aleatorios” de la
herramienta Análisis de datos de MS Excel. ................................................................................. 78
7.1.1 Distribución discreta:.................................................................................................... 79
7.1.2 Distribución Uniforme: ................................................................................................. 81
7.1.3 Distribución Normal:..................................................................................................... 82
7.1.4 Distribución de Bernoulli: ............................................................................................. 83
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 6
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
7.1.5 Distribución Binomial:................................................................................................... 84
7.1.6 Distribución Poisson: .................................................................................................... 86
7.1.7 Frecuencia Relativa:...................................................................................................... 87
8. Distribuciones de probabilidad Discreta.................................................................................... 89
8.1. Probabilidad con distribución Binomial.............................................................................. 90
8.2. Probabilidad con distribución Binomial Inversa. ................................................................ 91
8.3. Probabilidad con distribución Hipergeométrica................................................................. 91
8.4. Probabilidad con Distribución de Poisson. ......................................................................... 92
8.1 EJERCICIOS PROPUESTOS, TEMA: NÚMEROS ALEATORIOS Y VARIABLE ALEATORIA
DISCRETA....................................................................................................................................... 94
9. Distribuciones de probabilidad Continua .................................................................................. 95
9.1. Probabilidad con distribución Exponencial......................................................................... 96
9.2. Probabilidad con distribución Normal................................................................................ 97
9.3. Distribución Normal Inversa. .............................................................................................. 97
9.1 EJERCICIOS PROPUESTOS, TEMA: NÚMEROS ALEATORIOS Y VARIABLE ALEATORIA
CONTINUA..................................................................................................................................... 99
10. Tablas bivariadas continuas y cálculo de probabilidades...................................................... 100
10.1 ESQUEMA RESUMEN TABLA BIVARIADA PARA DATOS CONTINUOS............................... 112
10.2 EJERCICIOS PROPUESTOS, TEMA: TABLA BIVARIADA CONTINUA ................................... 113
CONCLUSIÓN................................................................................................................................... 114
BIBLIOGRAFÍA.................................................................................................................................. 115
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 7
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
PRESENTACIÓN
Dentro del ámbito de la Estadística como ciencia aplicada, un estudiante de Ingeniería debe adquirir
conocimientos que abarcan temas de análisis descriptivo de variables, problemas de probabilidad,
estimación de modelos probabilístico y simulación de distribuciones de probabilidad, además de la
inferencia estadística y el estudio de modelos estadísticos multivariados.
El propósito de este material de apoyo es proveer al estudiante de Ingeniería (y de otras carreras) los
conocimientos aplicados en software para desarrollar y comprender los contenidos del curso Estadística I
(Estadística Aplicada) impartido por el Departamento de Matemática y Física para la Facultad de Ingeniería y
Administración. El software a utilizar será Microsoft Excel. Se ha seleccionado Excel dado que es un
programa de uso masivo que cuenta con las herramientas básicas suficientes para realizar tablas, gráficos,
análisis de dados y que nuestro futuro profesional Ingeniero sin duda, podrá utilizar en el campo laboral.
La organización de este documento sigue el orden de un programa de Estadística Matemática habitual y que
es similar al orden de los contenidos que se tratan el curso de Estadística I (Estadística Aplicada). Incluye en
un principio los pasos para activar la herramienta “Análisis de datos” que dispone Excel para Estadística,
luego, se concentra el documento en el análisis descriptivos de datos y el análisis gráfico, luego, ejemplifica
el cálculo de probabilidad abarcando hasta el importante Teorema de Bayes, para luego, entrar en el análisis
de las variables aleatorias discretas y continuas haciendo énfasis en la capacidad de Excel para realizar
simulaciones de este tipo de variables. Finalmente se complementa con la construcción de tablas bivariadas
para datos continuos (y discretos) como extensión al caso de variables cualitativas.
Este material es de carácter inédito, pues corresponde a la recolección de cursos y experiencias de análisis
en el software Excel realizada por los autores en distintos cursos de estadística realizados en distintas casas
de estudio. Algunos de los problemas propuestos se recopilaron de textos de Estadística que son citados
habitualmente en la bibliografía de un curso formal de Estadística Matemática.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 8
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
1. Activación de la herramienta de análisis de datos de MS Office Excel.
Para la activación de la herramienta análisis de datos de Excel, realice los siguientes pasos:
Abra una hoja de Excel
Haga “click” en la pestaña de “Archivo” ubicada en la parte superior izquierda de la hoja de Excel.
Figura 1: Ubicación de la opción archivo en planilla Excel
Se desplegará un menú en el costado izquierdo de la hoja.
Figura 2: Ubicación de “Opciones” en la planilla Excel
En el menú haga “click” en “Opciones”
Se desplegará la siguiente ventana, de la cual debe seleccionar la opción “complementos”, luego haga “click”
en “herramientas para análisis” y finalmente “click” en “ir”.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 9
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 3. Esquema de pasos para seleccionar la herramienta de análisis del menú complementos.
En la ventana siguiente debe hacer “click” en la opción “herramienta para análisis” y luego aceptar.
Figura 4. Ventana de complementos.
La herramienta de análisis de datos ha sido activada. Para visualizarla se debe ir a la opción “Datos” de la
barra superior de la hoja de Excel. En la parte final aparecerá activada la opción “Análisis de datos”.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 10
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 5. Visualización de la herramienta de análsis de datos .
2. Confección de Tabla de frecuencias con función tabla dinámica
La siguiente tabla dinámica, será confeccionada con la base de datos dado.xlsx
1
, la cual representa el
resultado obtenido del lanzamiento en 100 oportunidades de un dado equilibrado.
Figura 6. Ubicación de función Tabla dinámica
1. Ir a la opción “Insertar”, en la parte superior de la planilla Excel que contiene los datos a trabajar.
2. Seleccionar la opción “Tabla dinámica”.
1
Base de datos disponible en la página web del Departamento de Matemática y Física.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 11
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 7. Ingreso de datos en función tabla dinámica.
3. Ingresar los datos en la opción “Tabla o rango”. Cabe destacar que por defecto Excel usará el dato
ubicado en la primera fila como el título de la tabla dinámica.
4. Por defecto las opciones de la tabla dinámica aparecerán en la hoja de trabajo actual, pero es
posible indicar que aparezcan en una hoja nueva.
5. Hacer “click” en “Aceptar”
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 12
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
2.1 Despliegue de opciones en Tabla Dinámica
Figura 8. Opciones Tabla Dinámica.
3. En el recuadro “Seleccionar campos para agregar al informe” desplazar el campo con el nombre de la
variable (N°caraDado) hasta el recuadro “Etiqueta de fila”.
Figura 9. Ilustración de construcción de tabla dinámica.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 13
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
4. Luego, en el recuadro “valores” hacer “click” sobre la opción por defecto “Suma de N°caraDado”, y
seleccionar la opción “configuración de campo de valor”.
Figura 10. Menú configuración “Campo de Valor”
5. Cambiar la opción “Suma” por la opción “Cuenta”.
6. Hacer “click” en “Aceptar”.
Figura 11. Tabla dinámica
Con esto se ha generado una tabla de frecuencias absolutas para la variable de estudio N°caraDado, la cual,
resume la cantidad de veces que se obtuvo cierta cara del dado.
Por ejemplo, la cara del dado con el valor 1, se obtuvo 22 veces de los 100 lanzamientos.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 14
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
3. Estadística Descriptiva con la función Análisis de datos.
El objetivo de este video es mostrar el uso de la herramienta Análisis de Datos para la obtención de
estadísticas descriptivas y confección de un histograma de frecuencias.
Primero debemos seleccionar el menú de DATOS y hacer ““click”” en la herramienta “Análisis de Datos”
Figura 12. Selección de opción análisis de datos.
Cabe notar que cuando se utiliza un programa estadístico para los cálculos de estadísticos descriptivos, no es
necesario confeccionar tablas de frecuencias.
Las tablas de frecuencias serán de utilidad para la confección de gráficos y para presentar resumen de la
información en el informe final.
Para nuestro ejemplo utilizaremos la información que tenemos de las estaturas de 100 personas, disponibles
en el archivo “Ejemplo descriptivas.xlsx
2
”.
Abrimos el archivo y tenemos:
2
Base de datos disponible en la página web del Departamento de Matemática y Física.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 15
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 13. Base de datos “Ejemplo descriptivas.xlsx”.
Con esta base de datos mostraremos lo que entrega la herramienta “Análisis de Datos” en su opción,
“Estadísticas Descriptivas”.
Vamos al menú DATOS, hacemos ““click”” en “Análisis de Datos”, posteriormente hacemos ““click”” en la
opción Estadísticas Descriptivas y finalmente ““click”” en aceptar.
Figura 14. Opción Estadísticas Descriptivas.
Se despliega el siguiente cuadro:
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 16
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 15. Ventana de ingreso de datos.
En esta ventana debemos ingresar el rango de datos que analizaremos, en este caso serán la columna donde
se encuentran las estaturas de las 100 personas, si se incluye en el rango de entrada el nombre de la
variable, entonces se debe marcar la opción “Rótulos en la primera fila”.
Figura 16. Ingreso de datos.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 17
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Para las opciones de salida, marcaremos la opción Rango de Salida, y le indicamos una celda contigua a la
columna de datos, por ejemplo la D1, entonces los resultados que nos entregue Excel quedarán a partir de
esta celda.
También si se estima por orden, podemos optar por dejar los resultados en una nueva hoja.
Marcamos Resumen de estadísticas y Aceptar.
Figura 17. Resumen de estadísticas.
Excel nos entrega el listado de estadísticas descriptivas para la Variable Estatura
Figura 18. Salida computacional de la opción análisis de datos.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 18
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Las estaturas están medidas con dos decimales que indican los centímetros, podemos entonces dejar las
estadísticas descriptivas que obtuvimos también con dos decimales, esto facilitará la interpretación.
Seleccionamos el rango de los valores de las medidas y con el botón derecho seleccionamos “Formato de
celdas”.
Figura 19. Opciones de presentación de datos.
Y luego seleccionar formato número, “posición de decimales”: 2, y Aceptar
Figura 20. Modificar decimales de la salida de datos.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 19
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Queda la siguiente presentación:
Figura 21. Resumen de estadísticas con dos decimales.
Las interpretaciones de las medidas de tendencia central son las siguientes:
Media:
- La media o promedio de las estaturas de las 100 personas es 1,60 metros, un metro y sesenta centímetros.
Mediana:
- El 50% de las personas con menores estaturas miden a lo más 1,61 metros , un metro y 61 centímetros,
también podemos decir que el 50% de las personas más altas miden más de 1,61 metros.
Moda:
- Lo más frecuente en estas 100 personas es que midan aproximadamente 1,49 metros.
Por otra parte la Desviación Estándar, que es la raíz cuadrada de la varianza, nos da una aproximación del
promedio de las desviaciones de los datos respecto de su media.
En nuestro ejemplo la desviación estándar es de 0,15 metros, es decir 15 cm, por lo que podemos decir que
los datos tienen una desviación promedio aproximada respecto de los datos de 15 cm. Si tuviésemos las
edades de otro grupo de personas, entonces podríamos comparar homogeneidad entre ellos, a menor
desviación estándar entonces los datos son más homogéneos (datos más cercanos a promedio, menor
dispersión de los datos)
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 20
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
4. Construcción de un Histograma.
Veamos ahora la construcción del histograma de frecuencia para los datos disponibles en la planilla
“Ejemplo descriptivas”.
Vamos al menú DATOS, hacemos ““click”” en “Análisis de Datos”, posteriormente hacemos ““click”” en la
opción Histograma y finalmente ““click”” en aceptar.
Figura 22. Función Histograma.
Al hacer ““click”” en Aceptar, nos muestra el siguiente Cuadro
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 21
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 23. Ventana de ingreso de datos .
Aquí en el “rango de entrada” seleccionamos los datos que tenemos de las estaturas, en la opción “Rango
de clase” no ingresaremos información, ya que queremos que el programa determine el número de clases
de nuestro Histograma, marcamos “rótulo”, seleccionamos un “rango de salida”, finalmente marcamos las
opciones “Porcentaje acumulado” , “Crear gráfico” y aceptamos.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 22
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 24. Opciones “Porcentaje acumulado” y “Crear gráfico (Histograma)”.
Excel nos entrega una tabla de frecuencias con los porcentajes acumulados de dichas frecuencias, asociados
a una clase que Excel determina, aquí el programa para las 100 estaturas determinó un resumen
construyendo 11 intervalos.
Figura 25. Salida computacional de opción “Histograma”.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 23
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
El histograma de frecuencias, además, muestra el gráfico de líneas con los porcentajes acumulados.
Para visualizar mejor, agrandamos el gráfico y nos posesionamos sobre las barras para cambiar el ancho de
estas, recordemos que la variable estaturas es continua y las barras se deben visualizar juntas formando un
polígono de frecuencias.
Hacemos “click” con el botón derecho del mouse sobre una de las barras, seleccionamos dar formato a
serie de datos
Figura 26. Opciones de formato.
Luego cambiamos el Ancho del intervalo, de 150% a 0% y presionamos Enter.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 24
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 27. Modificaciones al ancho del intervalo.
Con esta misma opción, seleccionamos ahora el ícono del balde que es para relleno y líneas, y hacemos
“click”.
Figura 28. Opciones de serie.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 25
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Luego elegimos un color negro para las líneas de las barras, cerramos la ventana.
Figura 29. Ingreso de nombre a histograma.
Lo único que falta es escribir un título adecuado y dar nombre al eje de las clases.
Hacemos “click” sobre el título y lo modificamos, escribiremos “Histograma de frecuencia de las Edades”, de
igual forma hacemos “click” sobre clase en el eje de las abscisas y lo modificamos, escribiremos allí “clase de
las edades”.
Tenemos finalizado el histograma de frecuencias.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 26
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 30. Histograma completo.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 27
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
4.1 Una aplicación de medidas descriptivas.
Una sociedad de Ingenieros consultores, decidió adquirir un nuevo Odómetro para tomar mediciones de
larga distancia, la decisión de hacer esta inversión fue necesaria dado que el que tienen actualmente ya
tiene 6 años de antigüedad y las últimas muestras de medición a un cierto punto que se han hecho con tal
instrumento, han tenido diferencias notorias.
La medición que la empresa entrega entre dos puntos es el promedio de las mediciones hechas en tres
días distintos y a distintas horas del día, esto para no tener sesgo por factores como clima, luminosidad o
interrupciones externas.
El nuevo instrumento es tecnológicamente más avanzado y de mayor precisión (menor margen de error,+/-
0,5% ), según lo que asegura la compañía que lo vendió.
La empresa además de empezar a utilizar el nuevo odómetro, sigue utilizando el antiguo, dado la gran
demanda de proyectos en los cuales sus servicios de medición han sido contratados.
Los ingenieros está consciente de la necesita contar con dos de estos instrumentos pero quieren tener
alguna evidencia de que las mediciones tomadas por el antiguo odómetro son realmente más inexactas
con respecto a su media, que las mediciones tomadas por el nuevo.
Para esto los ingenieros deciden, ya conociendo una distancia entre dos puntos de 61,5 metros, tomar dos
muestras donde se harán 10 mediciones de esta distancia conocida, (10 días distintos), cada una con los dos
odómetros respectivamente (en metros), con las que calcularan medidas descriptivas, principalmente para
comparar medidas de tendencia central y de dispersión.
Los resultados de estos cálculos ayudaran a tomar la decisión de desechar o seguir utilizando el antiguo
odómetro
Las medidas obtenidas se encuentran en el archivo “medidas_odometro.xlsx
3
” , abriendo el archivo ,
tenemos:
3
Base de datos disponible en la página web del Departamento de Matemática y Física.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 28
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 31. Base de datos “medidas_odometro.xlsx”.
Para los cálculos de las medidas de tendencia central, utilizaremos la herramienta de análisis de datos
“Estadísticas descriptivas.
En el menú principal, elegimos la opción “datos”, luego “Análisis de datos”, y “Estadística descriptiva
Figura 32. Opción Estadística Descriptiva.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 29
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Calculamos primero las estadísticas descriptivas de las mediciones hechas con el odómetro antiguo, en el
rango de entrada marcamos el rango donde están las medidas que se tomaron con el odómetro antiguo, de
la B2 a la B11, y en el rango de salida la celda F1, desde esa celda se desplegarán, los resultados y ACEPTAR
Figura 33. Ingreso de datos.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 30
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Hacemos doble “click” entre las columna F y G, para ajustar el tamaño de la columna F al contenido.
Tenemos entonces:
Figura 34. Desciptivos de Odómetro Antiguo.
El mismo procedimiento hacemos ahora para obtener las estadísticas descriptivas de las medidas tomadas
con el odómetro Nuevo, los ubicamos a partir de la celda I1 para poder tener una mirada conjunta de los
cálculos obtenidos, tenemos entonces:
Figura 35. Comparación de descriptivos de odómetros (Antiguo y Nuevo)
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 31
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Observado los resultados obtenidos, marcaremos con un color de relleno gris, las estadísticas relevantes
Figura 36. Comparación de algunos descriptivos.
Con respecto a las medias obtenidas, tenemos entre ellas una diferencia de 0,425 metros, es decir 42, 5 cm,
puede ser bastante dependiendo del contexto de la medición, y lo más importante que en relación al valor
exacto, el odómetro nuevo, entrega una media más cercana a la medida real que es 61,5.
Con respecto a la desviación estándar obtenida, claramente las medidas tomadas por el odómetro antiguo,
presentan una mayor dispersión entre ellas, esto puede generar una mayor diferencia entre los promedios
finales cuando se tomen sólo tres medidas.
Otro dato importante acá es el Rango, indicador también de dispersión de los datos, el rango que se dan en
las medidas tomadas por el odómetro antiguo es un metro superior con respecto a lo que presentan las
medidas tomadas por el odómetro nuevo.
Si observamos también el coeficiente de asimetría, nos podemos dar cuenta de que las mediciones tomadas
con el odómetro nuevo presentan una marcada asimetría negativa, esto quiere decir que los tatos en su
mayoría, se presentan superiores al promedio
Figura 37. Comparación de coeficientes de asimetría.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 32
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Ahora obtendremos los histogramas de frecuencias para visualizar mejor el comportamiento de los datos.
Usando la misma herramienta “Datos”, “Análisis de Datos” , “Histograma”
Figura 38. Confección de histogramas.
Para las medidas tomadas con el odómetro antiguo, el rango de entrada es desde la celda B2 a la B11, y el
rango de salida desde la celda F17, ACEPTAR
Figura 39. Ingreso de datos.
Excel para confeccionar el histograma de frecuencias, genera intervalos para agrupar las frecuencias, en este
caso generó cuatro intervalos, donde las marcas de clases se muestran a partir de la celda que indicamos
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 33
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
para la salida.
Figura 40. Salida de histograma 1.
Como las variables son continuas, corresponde ajustar el histograma con intervalos continuos, nos
posesionamos sobre las barras y haciendo clic con el botón derecho elegimos la opción “Dar formato a la
serie de datos”.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 34
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 41. Formato de serie de datos.
Y luego indicamos un 0% en el ancho del intervalo
Figura 42. Modificación del ancho del histograma.
Con la misma opción “Formato serie de datos”, ahora elegimos “Relleno y Líneas”, marcamos “línea sólida”,
color negro, para visualizar mejor las barras en el histograma
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 35
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 43. Resultado de la modificación del ancho del histograma.
En la gráfica se visualiza la asimetría negativa que daba el coeficiente de asimetría,-0,6527, mayores
frecuencias sobre el promedio.
Ahora repetimos los pasos anteriores para obtener el histograma de frecuencias para las medidas tomadas
con el odómetro nuevo
Nos queda:
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 36
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 44. Comparación de Histogramas de Odómetros.
La gráfica aquí se visualiza más simétrica con respecto al su promedio, y se corrobora con el coeficiente de
asimetría obtenido que es de 0,3266, que en este caso sería una leve asimetría positiva.
Con la información obtenida se puede concluir que de acuerdo a la diferencia que se presenta en el
promedio calculado por el odómetro antiguo respecto de la verdadera distancia y además respecto del
promedio más preciso entregado por el odómetro nuevo, más la mayor dispersión indicada tanto por la
desviación estándar, como por el rango de los datos de las mediciones obtenidas también por el odómetro
antiguo y la marcada asimetría negativa que se genera en la distribución de estos, se debería dar de baja el
odómetro antiguo y comprar otro nuevo.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 37
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
4.2 EJERCICIOS PROPUESTOS, TEMA: TABLAS DE FRECUENCIAS, ESTADÍSTICA DESCRIPTIVA E
HISTOGRAMA
1. Considere la base de datos “Examenes.xlsx”
4
la cual contiene información sobre el número de
preguntas que se realizaron en 17 exámenes de distintas disciplinas y la cantidad de alumnos que
rindieron el respectivo examen en cierta universidad.
Confecciones una tabla de frecuencias para la variable Exámenes . Ingrese el archivo Excel generado
en el buzón habilitado en la plataforma del laboratorio.
2. Considere la base de datos “Examenes.xlsx” la cual contiene información sobre el número de
preguntas que se realizaron en 17 exámenes de distintas disciplinas y la cantidad de alumnos que
rindieron el respectivo examen en cierta universidad.
Realice un resumen de descriptivos para la variable Exámenes. Ingrese el archivo Excel generado en
el buzón habilitado en la plataforma del laboratorio.
Preguntas independientes:
a. Indique el valor de la media.
b. Indique el valor de la moda.
c. Determine el valor de la desviación estándar (corregida)
d. Determine el coeficiente de variación.
e. Determine los cuartiles de la distribución de los datos.
f. Determine el rango intercuartil.
3. Considere la base de datos “Examenes.xlsx” la cual contiene información sobre el número de
preguntas que se realizaron en 17 exámenes de distintas disciplinas y la cantidad de alumnos que
rindieron el respectivo examen en cierta universidad.
Realice un histograma para la variable Exámenes. Ingrese el archivo Excel generado en el buzón
habilitado en la plataforma del laboratorio.
4. Considere la base de datos “Examenes.xlsx” la cual contiene información sobre el número de
preguntas que se realizaron en 17 exámenes de distintas disciplinas y la cantidad de alumnos que
rindieron el respectivo examen en cierta universidad.
Confecciones una tabla de frecuencias para la variable alumnos. Ingrese el archivo Excel generado
en el buzón habilitado en la plataforma del laboratorio.
4
Base de datos disponible en la página web del Departamento de Matemática y Física.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 38
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
5. Considere la base de datos “Examenes.xlsx
5
” la cual contiene información sobre el número de
preguntas que se realizaron en 17 exámenes de distintas disciplinas y la cantidad de alumnos que
rindieron el respectivo examen en cierta universidad.
Realice un resumen de descriptivos para la variable alumnos. Ingrese el archivo Excel generado en
el buzón habilitado en la plataforma del laboratorio.
Preguntas independientes:
a. Indique el valor de la mediana.
b. Indique el valor del coeficiente de asimetría.
c. Determine el valor de la desviación estándar (corregida)
d. Determine el coeficiente de variación.
e. Determine los cuartiles de la distribución de los datos.
f. Determine el rango intercuartil.
6. Considere la base de datos “Examenes.xlsx” la cual contiene información sobre el número de
preguntas que se realizaron en 17 exámenes de distintas disciplinas y la cantidad de alumnos que
rindieron el respectivo examen en cierta universidad.
Realice un histograma para la variable alumnos. Ingrese el archivo Excel generado en el buzón
habilitado en la plataforma del laboratorio.
5
Base de datos disponible en la página web del Departamento de Matemática y Física.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 39
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
5. Tablas de contingencia
El objetivo de este video es mostrar la forma de construir una tabla de contingencia a partir de una tabla
bivariada para dos variables cualitativas y que posteriormente servirá de base para la construcción de una
tabla de contingencia.
Recordemos que una tabla bivariada es aquella que resume las frecuencias absolutas conjuntas y
marginales, a partir de ellas se pueden obtener medidas de estadísticos marginales y condicionales, además
la tabla de contingencia resume la misma información pero en términos de probabilidades.
Abriremos el archivo “Ejemplo tabla contingencia”, que contiene la base de datos que utilizaremos, esta
base contiene dos variables que son: el “sexo” y el “nivel de estudios” de 20 personas.
Lo primero que haremos es construir la tabla bivariada, para estos utilizaremos una Tabla dinámica.
Tomando posición en cualquiera de las celdas donde se encuentran los datos, seleccionamos del menú la
opción insertar y posteriormente la opción Tablas dinámicas, (primera opción que aparece en el menú).
Figura 45. Base de datos “Ejemplo tabla contingencia.xlsx6
”
Aparecerá el siguiente cuadro:
6
Base de datos disponible en la página web del Departamento de Matemática y Física.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 40
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 46. Ingreso de matriz de datos.
Al habernos posicionado en una celda de los datos Excel toma por defecto los datos adyacentes que no
tienen celdas vacías y es lo que muestra marcado con las líneas punteadas y que además aparece como
rango de entrada en el recuadro. Cuando se trabaja con este tipo de tablas la base de datos no puede tener
celdas vacías.
En este recuadro también se solicita que se elija dónde queremos que esté la tabla, aquí seleccionaremos
una celda adyacente a los datos, a veces por orden los más conveniente será una nueva hoja.
Seleccionamos aceptar y se crea automáticamente la tabla dinámica, pero vacía
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 41
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 47. Pantalla de campos de tabla dinámica.
Excel muestra a la derecha las opciones de la tabla dinámica, agrega automáticamente los campos que
identificó de la base de datos, que son justamente los nombres de los rótulos de cada variables.
La tabla dinámica espera que le indiquemos cuales de estos campos incluiremos en ella. Como queremos
construir una tabla bivariada debemos incluir las dos variables, dejando una de ellas asociada a área de las
filas y la otra al área de las columnas.
Seleccionamos entonces ambas variables, por defecto la tabla dinámica las deja automáticamente
asociadas a las columnas, pero sólo dejamos ahí la variable “Nivel de Estudios” y arrastramos la variable
“Sexo”, hacia el área de las filas.
Figura 48. Ingreso de variables en filas y columnas.
Para que aparezcan el conteo de los datos debemos arrastrar nuevamente cualquiera de los dos campos a la
casilla “Valores”, para este ejemplo arrastraremos el campo Sexo.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 42
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 49. Tabla dinámica final.
En esta tabla de doble entrada podemos observar las frecuencias conjuntas absolutas y marginales.
Por ejemplo tenemos que 6 mujeres tienen un nivel de estudios Medio, también del total de las personas 10
son hombres y 10 son mujeres.
Ahora llevaremos esta tabla en términos de probabilidades, que es la tabla de contingencia.
Posicionándonos sobre la tabla dinámica construida, hacemos “click” sobre el botón derecho y elegimos la
opción, “Mostrar valores como” y luego % del total general.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 43
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 50. Modificación de valores en tabla dinámica.
La tabla queda ahora mostrando las frecuencias porcentuales conjuntas y marginales
Figura 51. Valores como porcentajes en tabla dinámica.
Finalmente posicionados nuevamente sobre la tabla, hacemos “click” con el botón derecho del Mouse y
elegimos la opción “Formato del número” y luego “número” y dos decimales.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 44
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 52. Modificación de valores a probabilidades.
La tabla queda ahora mostrando las probabilidades de ocurrencia condicionales y marginales.
Figura 53. Valores como probabilidades en tabla dinámica.
Ahora esta tabla de contingencia contiene las probabilidades conjuntas y marginales calculadas a partir de
las frecuencias conjuntas y marginales que teníamos en la tabla bivariada.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 45
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 54. Interpretación de algunos valores en tabla dinámica.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 46
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
5.1 ESQUEMA RESUMEN DE CONSTRUCCIÓN DE TABLA DE CONTINGENCIA
El objetivo de este video es mostrar la forma de construir una tabla de contingencia con la función
Tabla dinámica
Abriremos el archivo “Ejemplo tabla contingencia”, que contiene la base de datos que utilizaremos.
Esta base contiene dos variables que son: “género” y “nivel de estudios” de 20 personas.
1. Ir a la opción “Insertar”, en la parte superior de la planilla Excel que contiene los datos a
trabajar.
2. Seleccionar la opción “Tabla dinámica”.
3. Ingresar los datos en la opción “Tabla o rango”.
4. Por defecto las opciones de la tabla dinámica aparecerán en la hoja de trabajo actual, pero es
posible indicar que aparezcan en una hoja nueva.
5. Hacer “click” en “Aceptar”
6. En el recuadro “Seleccionar campos para agregar al informe” desplazamos el campo “nivel de
estudio” hasta el recuadro “Etiqueta de fila” y el campo “sexo” hasta el recuadro “Etiqueta de
columna”. Finalmente desplazar cualquiera de los campos hasta el recuadro “Valores”
7. Luego, en el recuadro “valores” hacer “click” sobre la opción por defecto “Suma de
N°caraDado”, y seleccionar la opción “configuración de campo de valores”.
8. Cambiar la opción “Suma” por la opción “Cuenta”.
9. Hacer “click” en “Aceptar”.
Ejemplos de lectura de la tabla:
En el estudio participaron 10 hombres y 10 mujeres.
4 individuos tienen un nivel de estudio “Básico”
3 individuos en el estudio son de sexo “masculino” y tiene un nivel de estudio “Medio”
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 47
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
6. Probabilidades y Teorema de Bayes
El objetivo de este video es estudiar la obtención de probabilidades condicionales y a través del el teorema
de Bayes.
Ya en el video 3, se estudió el cálculo de probabilidades simples, obtenidas las frecuencias marginales de una
tabla de contingencia. Recordemos también que la tabla de contingencia fue construida con una tabla
dinámica.
Rescatando la tabla de contingencia construida en el video 3, ahora la utilizaremos para obtener
probabilidades condicionales y aplicar el teorema de Bayes.
Las variables asociadas son “sexo” y “nivel de estudios” de 20 personas, construiremos el diagrama de árbol
para mostrar las probabilidades conjuntas y condicionales.
Lo primero que haremos es escribir las probabilidades conjuntas como la probabilidad de la intersección de
los eventos
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 48
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 55. Definición de eventos asociados a las variables de estudio.
Ahora utilizando la herramienta para escribir formulas, escribiremos las probabilidades conjuntas en
términos de la intersección de los eventos.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 49
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 56. Opción ingreso de ecuación en planilla Excel.
Entonces:
La probabilidad de que la persona tenga educación básica y sea de género femenino es igual a 0,1
La probabilidad de que la persona tenga educación media sea de género femenino es igual a 0,3
La probabilidad de que la persona tenga educación superior y sea de género femenino es igual a 0,1
De igual forma:
La probabilidad de que la persona tenga educación básica y sea de género masculino es igual a 0,1
La probabilidad de que la persona tenga educación media y sea de género masculino es igual a 0,15
La probabilidad de que la persona tenga educación superior y sea de género masculino es igual a 0,25
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 50
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 57. Ingreso de probabilidades con editor de ecuaciones.
Observemos que la suma de todas las probabilidades conjuntas es 1.
Comenzamos ahora a confeccionar el diagrama de árbol para representar las probabilidades condicionales.
Escribimos en una misma columna pero con separación de seis celdas, el recorrido de la variable sexo, es
decir Femenino y Masculino, y en la celda de abajo colocamos las probabilidades totales correspondientes, y
centramos el contenido de las celdas.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 51
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 58. Formato para ingreso de diagrama de árbol.
En la siguiente columna y celda por medio, colocamos los tipos de educación definidos en los eventos, estos
son EB, EM, ES, y los alineamos estos a la derecha.
Figura 59. Ingreso de probabilidades en para árbol de probabilidad.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 52
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Para dibujar las flechas del diagrama de árbol, usando del menú principal la opción “Insertar “y luego
elegimos la opción “formas”, y el icono de la flecha
Figura 60. Ingreso de “ramas” del árbol de probabilidad.
Dibujamos tres flechas para hacer el diagrama.
Figura 61. Árbol de probabilidades.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 53
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Una vez dibujadas las flechas, colocaremos en la columna siguiente, las probabilidades condicionales
asociada a cada evento, debemos recordar que cuando dos eventos son independientes se cumple que la
probabilidad de la intersección de ellos es igual a la multiplicación de las probabilidades de cada evento.
Dejando una columna de separación y nuevamente haciendo uso de la herramienta para escribir
ecuaciones, expresamos y obtenemos las probabilidades condicionales que corresponden a cada rama del
diagrama de árbol según la propiedad vista en clases.
Hacemos “click” en Insertar y luego ecuación, arrastramos el cuadro hasta la celda contigua a la primera
rama del árbol, y escribimos
“La probabilidad de que la persona tenga educación básica dado que es de género femenino es igual a la
probabilidad de que tenga educación básica y sea de género femenino dividido por la probabilidad de que la
persona sea de género femenino, esto es 0,1 dividido por 0,5, igual a 0,2”.
Conviene copiar las fórmulas y solo cambiar los eventos correspondientes. Con el botón derecho hacemos
“click” en copiar y luego pegamos frente a la segunda rama del árbol y así sucesivamente.
Ahora modificamos cada formula quedando:
La probabilidad de que la persona tenga educación media dado que es de género femenino es igual a la
probabilidad de que tenga educación media y sea de género femenino dividido por la probabilidad de que la
persona sea de género femenino, esto es 0,3 dividido por 0,5, igual a 0,6
Para la tercera rama:
La probabilidad de que la persona tenga educación superior dado que es de género femenino es igual a la
probabilidad de que tenga educación superior y sea de género femenino dividido por la probabilidad de que
la persona sea de género femenino, esto es 0,1 dividido por 0,5, igual a 0,2
De igual forma para la cuarta rama:
La probabilidad de que la persona tenga educación básica dado que es de género masculino es igual a la
probabilidad de que tenga educación básica y sea de género masculino dividido por la probabilidad de que la
persona sea de género masculino, esto es 0,1 dividido por 0,5, igual a 0,2
Para la quinta rama:
La probabilidad de que la persona tenga educación media dado que es de género masculino es igual a la
probabilidad de que tenga educación media y sea de género masculino dividido por la probabilidad de que la
persona sea de género masculino, esto es 0,15 dividido por 0,5, igual a 0,3
Y para la sexta rama:
La probabilidad de que la persona tenga educación superior dado que es de género masculino es igual a la
probabilidad de que tenga educación superior y sea de género masculino dividido por la probabilidad de que
la persona sea de género masculino, esto es 0,25 dividido por 0,5, igual a 0,5
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 54
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 62. Ejemplos de cálculo de probabilidad condicional.
Observemos acá que la suma de las probabilidades condicionales de los niveles de educación dado los
géneros Femenino y Masculino indistintamente, también suman uno.
Entonces podemos decir por ejemplo que:
La probabilidad de que una persona tenga un nivel de educación medio, dado que es de sexo femenino es
de un 60%
La probabilidad de que una persona tenga nivel de educación superior dado que es de sexo masculino es de
un 50%.
Veamos que pasa ahora si queremos responder a la pregunta:
¿Cuál es la probabilidad de que una persona sea mujer sabiendo que su nivel de educación es Básico?
La respuesta nos las da el teorema de Bayes.
Para poder calcular esta probabilidad necesitamos conocer la probabilidad total de tener Educación básica, y
esta es :
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 55
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
“P de EB, educación básica, es igual a P de EB inter F(femenino), más P de EB y M(masculino) y esto de
acuerdo a la propiedad de la probabilidad condicional, es igual a “P de F por P de EB dado F”, más “P de M
por P de EB dado F”
Una vez más utilizando la herramienta para escribir ecuaciones, escribiremos la probabilidad que deseamos
obtener
Elegimos insertar, ecuación y arrastramos la ecuación para responder la pregunta
Escribimos, probabilidad de que una persona sea de género femenino, sabiendo que tiene educación básica
es igual, seleccionamos en el menú superior herramientas de ecuaciones y luego fracción, en el numerador
colocamos la probabilidad conjunta “P de F inter EB, educación básica y en el denominador “P de ED,
educación básica”, que es la probabilidad de lo que está dado o conocido.
Y es igual a la probabilidad de que la persona sea de género femenino por la probabilidad de que tenga
estudios básicos sabiendo que es de género femenino, dividido por la probabilidad total de tener estudios
básicos.
Figura 63. Ejemplo de aplicación del teorema de Bayes.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 56
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
6.1 ESQUEMA RESUMEN CON PROBLEMAS DE PROBABILIDADES Y TEOREMA DE BAYES
En este video practicaremos el cálculo de probabilidad y el teorema de Bayes en base a la tabla de
contingencia creada en el video de Tablas de contingencia.
Primero, adaptaremos la tabla de contingencia a una tabla de probabilidades, para esto marcamos el
recuadro de la tabla dinámica y hacemos “click” con el botón derecho. De la lista de opciones
seleccionamos “Mostrar valores como” y elegimos “% del total general”, luego seleccionamos solo el
área de la tabla dinámica donde hay porcentajes y hacemos “click” con el botón derecho,
seleccionamos la opción “Formato de número” y luego elegimos “número” con esto logramos que
nuestra tabla de contingencia ahora sea una tabla de probabilidades.
Resolución de los problemas propuestos:
1. ¿Cuál es la probabilidad de que al seleccionar un individuo al azar este tenga un nivel de
estudio Básico?
Esta pregunta es una probabilidad marginal, la obtenemos directamente de la tabla de
probabilidades, específicamente en el total fila del nivel de estudio básico.
2. ¿Cuál es la probabilidad de que al seleccionar un individuo al azar este sea hombre y tenga
nivel de estudio Superior?
Esta pregunta es una probabilidad conjunta, la obtenemos directamente de la tabla de
probabilidades, específicamente en la intersección de “Hombre” y “Superior”.
3. Si se sabe que un individuo seleccionado al azar es mujer. ¿Cuál es la probabilidad de que tenga
un nivel de estudio Medio?
Esta pregunta está condicionada, se sabe que el individuo es mujer y lo que se pregunta es por la
probabilidad que tenga nivel de estudio Medio. Para resolverlo dividimos la probabilidad conjunta
de Mujer y nivel de estudio Medio, entre la probabilidad de que el individuo sea mujer.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 57
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
4. Si se sabe que un individuo seleccionado al azar tiene un nivel de estudio Medio,
¿Cuál es la probabilidad que sea Mujer?
Indicación: debe utilizar el resultado de la pregunta anterior
Esta pregunta puede ser resuelta igual que la pregunta anterior, pero utilizaremos el
teorema de Bayes tal como pide la indicación. Por lo que, multiplicaremos la
probabilidad obtenida en la pregunta anterior por la probabilidad de que el individuo sea
mujer, esto nos da la probabilidad conjunta de Mujer y nivel de estudio medio, luego, lo
dividimos por la probabilidad de que el individuo tenga un nivel de estudio Medio
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 58
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
6.2 EJERCICIOS PROPUESTOS, TEMA: TABLA DE CONTINGENCIA, PROBABILIDADES Y
TEOREMA DE BAYES
1. Considere la base de datos Favoritos.xlsx
7
la cual contiene información sobre 23 personas a las
cuales se les consultó respecto a color y mascota favoritos. Con los datos confecciones una tabla de
contingencia utilizando la función Tabla dinámica, luego ingrese el documento en el buzón
habilitado en la plataforma de laboratorio.
2. Considere la base de datos Favoritos.xlsx la cual contiene información sobre 23 personas a las
cuales se les consultó respecto a color y mascota favoritos. Con los datos confeccione una tabla de
probabilidades, luego ingrese el documento en el buzón habilitado en la plataforma de laboratorio.
Preguntas independientes en base a los datos Favoritos.xlsx:
3. ¿Cuál es la probabilidad que un individuo seleccionado al azar le guste el color rojo y su mascota
preferida sea un perro?
4. ¿Cuál es la probabilidad que un individuo seleccionado al azar le guste el color morado y su
mascota preferida sea un hámster?
5. ¿Cuál es la probabilidad que un individuo seleccionado al azar le guste el color negro?
6. ¿Cuál es la probabilidad que un individuo seleccionado al azar su mascota preferida sea un conejo?
7. Si se sabe que a una persona seleccionada al azar le gusta el color amarillo. ¿Cuál es la probabilidad
de que su mascota favorita sea un hámster?
8. Si se sabe que a una persona seleccionada al azar le gusta el color azul. ¿Cuál es la probabilidad de
que su mascota favorita sea un gato?
9. Si se sabe que una persona seleccionada al azar su animal favorito es un conejo . ¿Cuál es la
probabilidad de que su color favorito sea negro?
7
Base de datos disponible en la página web del Departamento de Matemática y Física.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 59
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
El caso es el siguiente:
Una Empresa minera adquirió instaló hace una un año una estación de monitoreo para medir la
concentración de material particulado en el aire, esta estación está programada para tomar mediciones
cada 8 hora y en caso de que la medición detecte que los niveles de polución superan los 150 µg/m³
(PM10), la alarma se activará automáticamente.
De sonar la alarma, la empresa debe parar la faena hasta lograr bajar los niveles de polución bajo el nivel
máximo permitido, de lo contrario se venir una inspección en ese momento, la empresa será multada.
Ya con un año de funcionamiento, la empresa minera ha detectado errores en el funcionamiento de la
estación de monitoreo, pero no tiene presupuestado la renovación de esta, por el alto costo de inversión.
Por lo anterior la empresa pide al departamento de prevención de riesgos que de acuerdo a los registros de
las mediciones tomadas por dicha estación en relación al funcionamiento de la alarma en los últimos 6
meses, determine por una parte
1. ¿Cuál es la probabilidad de que la empresa sea multada?
2. ¿Cuál es la probabilidad de la empresa detenga sus faenas sin haber sido necesario?
3. ¿Cuál es la probabilidad de que los trabajadores estén respirando aire con mucha polución sin tener
alerta ninguna?
4. ¿Cuál es la probabilidad de que la medida de parar las faenas esté bien aplicada, después de que se
activa la alarma?
La información antes pedida servirá como evidencia para tomar la decisión de quedarse con esta estación de
monitoreo o adquirir otra.
Para dar respuesta a los requerimientos de la gerencia se pueden obtener por una parte, preguntas 1 y 2,
calculando una probabilidad condicional y por otra parte, preguntas 3 y 4, utilizando el teorema de Bayes.
Veamos como:
Abrimos el archivo que contiene la base de datos Monitoreo_polucion.xlsx
8
Observamos que tenemos cuatro campos de información, que son, la Fecha, la hora, el nivel de polución y el
registro de si activó o no la alarma.
Para generar la tabla de contingencia no es adecuado usar la variable cuantitativa Nivel de polución dado
que se hará el conteo según categorías y estas no existen, por lo que será conveniente antes categorizarlas.
Recordemos que la empresa tiene establecido como norma, que los niveles de polución P10, no pueden
sobrepasar los 150 µg/m³, entonces de acuerdo a esto categorizaremos.
8
Base de datos disponible en la página web del Departamento de Matemática y Física.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 60
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Para esto utilizaremos la función SI, insertamos una nueva columna adyacente a la que tiene los registros
del Nivel de Polución
Figura 64. Categorización de la variable Nivel de polución.
La nueva variable la llamaremos “Condición del Nivel de Polución”, que tendrá como recorrido
P: si el nivel de polución cumple con la norma establecida, <=150 µg/m³
NP: Si el nivel de polución supera la norma establecida, es decir >150 µg/m³
Escribimos el nombre al inicio de la columna
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 61
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 65. Ingreso de columna adyacente para la categorización.
Posicionados en la celda B2, insertamos la función lógica SI, esta función permitirá categorizar la variable
numérica, asociando la categoría P o NP, según corresponda
Figura 66. Uso de función lógica =SI().
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 62
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
La función SI, requiere de ingresar la prueba lógica, y la asignación que se hará en caso de que la evaluación
sea verdadera o falsa
Figura 67. Ingreso de variable a categorizar.
En nuestro ejemplo la prueba lógica es evaluar si cada dato de la variable nivel de polución cumple con la
norma establecida por la empresa, luego escribiremos
Figura 68. Ingreso de valores “Verdadero” y “Falso”.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 63
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Hacemos clic en aceptar y nos queda para la primera celda asociado “P”, permitido cuando la medición fue
127.
Posicionados en la esquina inferior derecha de la celda evaluada, arrastramos el mouse para copiar en el
resto de las celdas
Figura 69. Extensión de función SI al resto de la columna adyacente.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 64
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
La base de datos ahora se presenta
Figura 70. Base de datos luego del ingreso de variable categorizada.
Ya estamos listos para crear la tabla de contingencia que finalmente nos permitirá obtener las
probabilidades condicionales.
En la tabla de contingencia estarán resumidas las frecuencias de las variables
Condición del nivel de polución (Permitido/ No Permitido)
Activación de la alarma ( SI / NO)
Posicionados en la primera celda de nuestra base de datos, insertamos la tabla dinámica, recordemos que
este procedimiento ya fue estudiado en el video 3 , de construcción de tablas de contingencia.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 65
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 71. Confección de tabla dinámica para el problema.
Quedó seleccionado el rango que contempla nuestra base de datos, y le indicamos que la tabla dinámica
quede en la misma hoja donde están los datos, dando como referencia la celda G2
Figura 72. Ingreso de celda para salida de opciones de tabla dinámica.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 66
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Se crea la tabla dinámica
Figura 73. Opciones de tabla dinámica.
Marcamos los campos “Condición del nivel de polución “y “Activación de la Alarma”
Figura 74. Ingreso de variables en fila y columna.
Arrastramos el campo activación de la alarma hacia las columnas y luego para completar la tabla con los
valores resumidos, debemos arrastrar cualquiera de los campos incluidos en la tabla hacia el recuadro
Valores.
Aparece ahora completa la tabla bivariada con las frecuencias conjuntas, marginales y totales.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 67
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 75. Tabla dinámica para el problema.
Ahora a partir de la tabla bivariada generaremos la tabla de contingencia
Posicionados sobre alguna frecuencia conjunta de la tabla bivariada, hacemos “click” con el botón derecho y
elegimos la opción “mostrar valores como” y luego “porcentaje del total general”
Figura 76. Modificación de valores de tabla dinámica.
La tabla se muestra ahora con porcentajes del total, nuevamente hacemos “click” con el boton derecho para
elegir la opción formato número
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 68
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 77. Valores de tabla dinámica en porcentajes.
Y luego “número“, dos decimales y ACEPTAR.
Figura 78. Modificación de valores de porcentaje a probabilidades.
Automaticamente aparece la tabla de contingencia.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 69
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 79. Valores de tabla dinámica en probabilidades.
Lo primero que haremos es escribir las probabilidades conjuntas como la probabilidad de la intersección de
los eventos y las probabilidades totales
Nuestros eventos son:
NP: Nivel de Polución no permitido
P : Nivel de Polución Permitido
NO : No se activa la alarma
SI : Se activa la alarma
Probabilidades conjuntas Probabilidades Totales
P( )
P( ) 81
P( )
( )
( )
( )
( )
( )
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 70
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 80. Cálculo de probabilidades conjuntas y marginales (totales).
Antes de calcular las probabilidades pedidas, contruiremos el arbol de las probabilidades condicionales que
nos permitirán aplicar el teorema de bayes.
Partiremos el árbol con la variable “Nivel de Polución”, dado que es natural entender que la alarma sonará
dependiendo del nivel de polución que haya en la faena.
Confeccionamos el árbol, utilizando herramientas de dibujo e insertando las fórmulas correspondientes.
Figura 81. Ingreso de árboles de probabilidad.
Para responder a las pregunta de la gerencia, antes debemos plantear las probabilidades que darán las
respuesta.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 71
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
1. ¿Cuál es la probabilidad de que la empresa sea multada?
Debemos entender que la empresa será multada sólo si los trabajadores siguen trabajando con niveles de
polución no permitidos, y esto ocurrirá si en ese momento no suena la alarma.
Entonces debemos calcular la probabilidad condicional de que no suene la alarma, sabiendo que hay niveles
de polución no permitido.
( )
( )
( )
Luego existe un 70% de probabilidad de que la empresa sea multada
Contestemos ahora la segunda pregunta:
2. ¿cuál es la probabilidad de la empresa detenga sus faenas sin haber sido necesario?
Para responder a esta pregunta debemos entender que debemos calcular la probabilidad de suene la alarma
sabiendo que los niveles de polución están dentro de las normas permitidas.
( )
( )
( )
( )
La probabilidad de que la empresa detenga sus faenas sin haber sido necesario es de un 10%
Para completar el árbol con las otras probabilidades condicionales, las calcularemos
( )
( )
( )
( )
( )
( )
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 72
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 82. Cálculo de probabilidades condicionales.
Respondamos ahora la tercera y cuarta pregunta
3.- ¿Cual es la probabilidad de que los trabajadores estén respirando aire con mucha polución sin tener
alerta ninguna?
( )
Al plantear la probabilidad nos damos cuenta que es a priori, es decir según lo planteado en el diagrama de
árbol, necesitamos saber cuál es la probabilidad de que suene la alarma sabiendo que no ha sonado la
alarma.
Utilizando el teorema de Bayes
( )
( ) ( )
( ) ( ) ( ) ( )
La probabilidad de que los trabajadores estén respirando un aire con nivel de polución no permitida, sin
que haya sonado la alarma es de un 8%
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 73
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 83. Lectura de “ramas” en árbol de probabilidad.
El mismo cálculo nos resulta, aplicando las probabilidad conjunta y marginal, de acuerdo a la información
que tenemos en la tabla de contingencia
( )
( )
( )
La probabilidad de que los trabajadores estén respirando niveles de polución no permitidos, sabiendo que la
alarma no se ha activado es de un 8%
Finalmente respondemos a la última pregunta:
4.-¿Cuál es la probabilidad de que la medida de parar las faenas esté bien aplicada, después de que se
activa la alarma?
Aquí debemos calcular la probabilidad de que realmente los niveles de polución son altos cuando sabemos
que ha sonado la alarma, es decir
( )
Esta probabilidad según nuestro diagrama de árbol, también es a priori, por lo que debemos aplicar el
teorema de Bayes
( )
( ) ( )
( ) ( ) ( ) ( )
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 74
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 84. Lectura de “ramas” en árbol de probabilidad.
El mismo cálculo nos resulta, aplicando las probabilidad conjunta y marginal, de acuerdo a la información
que tenemos en la tabla de contingencia
( )
( )
( )
La probabilidad de que los niveles de polución realmente no estén dentro de la norma permitida, sabiendo
que la alarma se ha activado es de un 25%
Conclusión:
De acuerdo a las probabilidades obtenidas, por una parte en relación a la empresa, la alta probabilidad de
ser multados 70%, aun cuando el riesgo tener pérdidas al detener las faenas no siendo necesario sea de un
10%, conjuntamente con un 25% de probabilidad de que los niveles de polución realmente no estén dentro
de la norma permitida, sabiendo que la alarma se ha activado , y , en relación a la seguridad de los
trabajadores, baja probabilidad, un 8% , de tener niveles de polución no permitidos cuando la alarma no se
ha activado, se puede concluir que la sugerencia, para evitar multas y perdidas, considerando que ya
existiendo aunque sea un 1% de riesgo para los trabajadores, la empresa debe tomar la decisión de invertir
en un nuevo instrumento que alerte con precisión sobre los niveles de polución no permitidos.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 75
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
7. La opción “Generación de números aleatorios” de la herramienta Análisis de datos
de MS Excel.
Ir a la opción “datos” en la barra superior y seleccionar “Análisis de datos”.
De la ventana de opciones seleccionar “Generación de números aleatorios”
Figura 85. Opción “Generación de números aleatorios”.
Hacer “click” en aceptar.
Descripción del menú de la opción generación de números aleatorios:
Figura 86. Ventana de opciones de Números aleatorios.
1: número de variables: Corresponde a la cantidad de columnas de datos que queremos generar. En este
caso, ingresaremos el valor 1 para así generar una sola columna con datos simulados.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 76
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
2: cantidad de números aleatorios: indica la cantidad de datos por columna que serán simulados. En este
caso ingresaremos 100, es decir, por cada columna de datos ingresada en la parte anterior, aparecerán 100
datos asociados.
3: Distribución: Ofrece un conjunto de distribuciones de probabilidad de uso frecuente en estadística.
Seleccionaremos “Normal” para este ejemplo. Para más detalle sobre el uso de cada distribución disponible
en esta opción, ir al video: “Anexo de distribuciones”
4: Parámetros: Esta opción depende de la distribución seleccionada. Como hemos seleccionado la opción
“Normal” dejaremos los valores por defecto de la opción, es decir, el valor 0 para la media y 1 para la
desviación estándar.
Figura 87. Opción distribución Normal.
5: Iniciar con: Corresponde al valor semilla con el cual se genera la secuencia de números aleatorios, si se
ingresa un valor, entonces Excel guardará la misma secuencia de números cada vez que en este campo se
ingrese tal número. En este caso, lo dejaremos en blanco.
6: Opciones de salida:
Rango de salida: se debe ingresar una celda donde se desea que se inicie la presentación de los
resultados del análisis. Es una opción útil si se quiere visualizar el resultado de la generación de números
aleatorios en la misma hoja donde se está trabajando.
En una hoja nueva: Corresponde a la opción por defecto, el resultado aparecerá en una hoja nueva
dentro de la misma planilla de Excel.
En un libro nuevo: Los resultado de la simulación de datos aparecerán en un libro nuevo de Excel.
En este caso seleccionaremos la opción “Rango de Salida”, luego, seleccionaremos la celda A1.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 77
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 88. Opción distribución Normal del ejemplo.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 78
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
7.1 “Anexo de distribuciones” de la opción “Generación de números aleatorios” de la
herramienta Análisis de datos de MS Excel.
Revisaremos en esta sección las distintas opciones para generar números aleatorios disponibles en la opción
“Análisis de datos”.
Figura 89. Lista de distribuciones para simular.
La opción “Generación de números aleatorios” permite simular números aleatorios para ocho distribuciones
que se describen a continuación:
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 79
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
7.1.1 Distribución discreta:
Se generan números aleatorios para un conjunto de valores enteros a los cuales se asocia a priori una
probabilidad de aparición del valor de la variable.
Figura 90. Opción distribución Discreta.
Para utilizar esta opción, se debe tener una tabla de probabilidades “a priori” para una variable aleatoria
discreta.
A modo de ejemplo simularemos el lanzamiento en 100 oportunidades de un dado de seis caras equilibrado.
A esta variable se le asocia en la literatura la distribución Uniforme Discreta.
Construiremos la Tabla de probabilidades a priori relacionada al problema:
X P(X=x)
1 0,16666667
2 0,16666667
3 0,16666667
4 0,16666667
5 0,16666667
6 0,16666667
Tabla 1. Tabla de probabilidad para la aparición de una cara en un dado de 6 caras
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 80
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Ingreso de datos en la ventana de opciones:
Figura 91. Ingreso de tabla a “priori” en distribución discreta.
Hacer ““click”” en Aceptar.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 81
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
7.1.2 Distribución Uniforme:
Genera números con igual probabilidad en un intervalo de valores predeterminado. Por defecto los
valores aparecen entre 0 y 1, lo cual, es equivalente a la función “=ALEATORIO()”.
Figura 92. Opción distribución Uniforme.
A modo de ejemplo se simularán 100 valores de la distribución Uniforme entre 0 y 1.
Figura 93. Ingreso de valores en opción distribución Uniforme.
Hacer ““click”” en Aceptar.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 82
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
7.1.3 Distribución Normal:
Simula números aleatorios de una distribución Normal con media y desviación estándar definidas por el
usuario. Por defecto el programa proporciona una media 0 y desviación estándar 1, la cual, corresponde a
los valores de la distribución Normal Estándar.
Figura 94. Opción distribución Normal.
A modo de ejemplo se simularán 100 valores de la distribución Normal Estándar.
Figura 95. Ingreso de valores en opción distribución Normal.
Hacer ““click”” en Aceptar.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 83
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
7.1.4 Distribución de Bernoulli:
Genera números aleatorios correspondientes a la distribución de Bernoulli. Es decir, para un experimento
aleatorio con dos posibles resultados donde el valor 0 indica “fracaso” y 1 “éxito”.
Se debe ingresar la probabilidad de éxito.
Figura 96. Opción distribución de Bernoulli.
A modo de ejemplo se simularán 100 valores correspondientes al lanzamiento de una moneda honesta, es
decir con Probabilidad = 0,5 donde la variable recibe el valor 0 si se obtiene un “sello” y un 1 si se obtiene
“cara”. Es decir, la variable de estudio sería: X: número de veces que se obtiene una cara al lanzar una
moneda 1 vez.
Figura 97. Ingreso de valores en opción distribución de Bernoulli.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 84
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Ingresar en la opción “probabilidad” el valor 0,5. El cuál indica la probabilidad de obtener una cara al lanzar
una moneda honesta.
Hacer ““click”” en Aceptar.
7.1.5 Distribución Binomial:
Genera números aleatorios correspondientes a una distribución Binomial. Es decir, para N experimentos
de Bernoulli independientes, con probabilidad de éxito “p”.
Figura 98. Opción distribución Binomial
A modo de ejemplo se simularán 100 valores correspondientes al lanzamiento de una moneda honesta, es
decir probabilidad=0,5 en 5 ocasiones, donde los valores representan el número de caras obtenidas en los 5
lanzamientos.
Figura 99. Ingreso de valores en opción distribución Binomial.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 85
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Ingresar en la opción “probabilidad” el valor 0,5. El cuál indica la probabilidad de obtener una cara al lanzar
una moneda honesta.
En la opción “Número de muestras” ingresar el valor 5, el cual indica la cantidad de veces que se lanza la
moneda, es decir, el número de experimentos de Bernoulli independientes.
Hacer ““click”” en Aceptar.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 86
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
7.1.6 Distribución Poisson:
Genera números aleatorios correspondientes a la distribución de Poisson para un valor esperado de la
variable denominada Lambda.
Figura 100. Opción distribución de Poisson.
A modo de ejemplo, se simularan 100 valores correspondientes a una distribución de Poisson con valor
esperado de la variable igual a 2. Esta simulación podría representar, por ejemplo, a una variable aleatoria X:
número de hermanos que tiene un alumno del curso de Estadística.
Figura 101. Ingreso de valores en opción distribución de Poisson.
En la opción “Lambda” ingresar el valor 2, el cual indica el valor esperado de hermanos que tiene un alumno
del curso de Estadística.
Hacer ““click”” en Aceptar.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 87
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
7.1.7 Frecuencia Relativa:
Genera una secuencia predeterminada de valores en un incremento y repeticiones definidas por el
usuario.
Figura 102. Opción frecuecia relativa.
A modo de ejemplo, se simulará una serie de valores entre 1 y 4, con incrementos de 1 unidad donde el
número será repetido dos veces y la secuencia en 3 ocasiones.
Figura 103. Ingreso de valores en opción frecuencia relativa.
Detalle de la función Frecuencia Relativa:
Parámetros: indica el rango de valores a generar
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 88
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
De: es el mínimo de los valores a generar
A: es el máximo valor a generar
Incremento: indica la cantidad a incrementar luego de generar el mínimo
En este caso se define De: 1 a 4 , incremento 1, es decir, se generarán números del 1 al 4, de 1 en 1.
Repitiendo cada número: indica la cantidad de veces que se repetirá un número antes de pasar al siguiente.
En este caso ingresamos el valor 2.
Repitiendo la secuencia: indica la cantidad de veces que se repite la secuencia de valores, es decir, números
de 1 a 4, con incremento 1, repetidos 2 veces. En este caso ingresamos el valor 3.
Hacer ““click”” en Aceptar.
Observación: En este ejemplo se han simulado tres secuencias de números del 1 al 4 con incremento 1 y
repetición 2 veces para cada número. Con un cálculo simple notamos que la cantidad de números a
generar serán 24, por lo que no coincidirá con los 100 valores ingresados en la opción “cantidad de
números aleatorios”, o sea, si los parámetros ingresados generan una secuencia superior a la “cantidad de
números aleatorios” predefinida, la secuencia finalizará en este valor.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 89
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
8. Distribuciones de probabilidad Discreta
En esta sección analizaremos algunas opciones disponibles para el cálculo de probabilidad en variables
aleatorias discretas.
A las funciones asociadas a estos cálculos se puede acceder haciendo ““click”” en el ícono .
Figura 104. Opción “Insertar función”.
Luego , en la opción “O seleccionar una categoría” elegir “Estadísticas”. En este menú se encuentran
disponibles las funciones asociadas al tema a tratar.
Figura 105. Función “Estadísticas”.
Otra opción es ingresar directamente la función asociada.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 90
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Realizaremos ahora una serie de problemas que involucra el cálculo de probabilidad discreta.
Si usted desea replicar estos cálculos, descargue la planilla “Video 6-Ejercicios de variable discreta”.
8.1. Probabilidad con distribución Binomial.
Figura 106. Opción probabilidad con distribución Binomial.
Ejemplos:
Figura 107. Ejemplo cálculo Binomial exacta.
Para resolver este problema, realice los siguientes pasos:
1. Seleccionamos la opción asociada a la distribución Binomial
2. Ingresamos el número de éxitos
3. Ingresamos el número de ensayos totales
4. Luego, la probabilidad de éxito asociada al problema
5. Finalmente escribimos la palabra FALSO, la cual indica que deseamos que la probabilidad entregada
sea exacta.
Figura 108. Ejemplo cálculo Binomial acumulada.
1. Seleccionamos la opción asociada a la distribución Binomial
2. Ingresamos el número de éxitos
3. Ingresamos el número de ensayos totales
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 91
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
4. Luego, la probabilidad de éxito asociada al problema
5. Finalmente escribimos la palabra VERDADERO, la cual indica que deseamos que la probabilidad
entregada, sea la acumulada hasta el valor ingresado
8.2. Probabilidad con distribución Binomial Inversa.
Figura 109. Opción cálculo inversa de probabilidad Binomial.
Figura 110. Ejemplo cálculo inversa de probabilidad Binomial.
1. Seleccionamos la opción asociada a la distribución Binomial Inversa
2. Ingresamos el número de ensayos totales
3. Luego, la probabilidad de éxito asociada al problema
4. Finalmente ingresamos la probabilidad acumulada del problema
8.3. Probabilidad con distribución Hipergeométrica.
Figura 111. Opción probabilidad con distribución Hipergeométrica.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 92
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 112. Ejemplo cálculo de probabilidad Hipergeométrica exacta.
1. Seleccionamos la opción asociada a la distribución Hipergeométrica
2. Ingresamos el número de éxitos
3. Ingresamos el número de extracciones sin reposición
4. Ingresamos el tamaño de la población de éxitos
5. Luego, el tamaño de la población total, es decir, la suma de fichas azules y rojas
6. Finalmente escribimos la palabra FALSO, la cual indica que deseamos que la probabilidad entregada
sea exacta.
8.4. Probabilidad con Distribución de Poisson.
Figura 113. Opción probabilidad con distribución de Poisson.
Figura 114. Ejemplo cálculo de probabilidad Poisson exacta.
1. Seleccionamos la opción asociada a la distribución de Poisson
2. Ingresamos el número de éxitos
3. Ingresamos el valor promedio asociado a la variable de estudio
4. Finalmente escribimos la palabra FALSO, la cual indica que deseamos que la probabilidad entregada
sea exacta.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 93
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 115. Ejemplo cálculo de probabilidad Poisson acumulada.
1. Seleccionamos la opción asociada a la distribución de Poisson
2. Ingresamos el número de éxitos
3. Ingresamos el valor promedio asociado a la variable de estudio
4. Finalmente escribimos la palabra VERDADERO, la cual indica que deseamos que la probabilidad
entregada sea la acumulada hasta el valor especificado.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 94
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
8.1 EJERCICIOS PROPUESTOS, TEMA: NÚMEROS ALEATORIOS Y VARIABLE ALEATORIA
DISCRETA
1. ¿Cuál es la probabilidad de obtener 3 caras al lanzar una moneda 5 veces?
2. ¿Cuál es la probabilidad de obtener a lo más 3 caras al lanzar una moneda 5 veces?
3. En 7 lanzamientos, ¿Cuál es el número más grande de caras que se puede esperar, con una
probabilidad de 0.98?
4. Genera 100 observaciones provenientes de una distribución binomial con probabilidad de éxito 0.4
y n=7.
5. Si X es binomial con probabilidad de éxito 0.4 y n=7. ¿Cuál es la probabilidad de que X sea a lo más
4. Es decir P(X ≤ 4)?
6. Si X es binomial con probabilidad de éxito 0.9 y n=6. ¿Cuál es la probabilidad de que X sea 4. Es
decir P(X = 4) ?
7. ¿Qué valor tiene una distribución de Poisson con varianza 6, cuya probabilidad acumulada es 0.92?
8. Genere 100 observaciones provenientes de una distribución de Poisson de parámetro lambda = 6.
9. Calcule la probabilidad de que una variable que tiene distribución Hipergeométrica de parámetros
N=9 r=4 y n=3 sea igual a 2.
10. Genere 100 observaciones provenientes de una distribución Poisson con probabilidad de éxito 0.9.
11. Si X es Poisson con media 6. ¿Cuál es la probabilidad de que X sea a lo más 4. Es decir P(X ≤ 4)?
12. Sea X Hipergeométrica(N=20,r=7,n=8). ¿Cuál es la probabilidad de que X sea a lo más 4, es decir,
P(X ≤ 4)?
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 95
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
9. Distribuciones de probabilidad Continua
En esta sección analizaremos algunas opciones disponibles para el cálculo de probabilidad para variables
aleatorias continuas.
A las funciones asociadas a estos cálculos se puede acceder haciendo ““click”” en el ícono .
Figura 116. Opción “Insertar función”.
Luego , en la opción “O seleccionar una categoría” elegir “Estadísticas”. En este menú se encuentran
disponibles las funciones asociadas al tema a tratar.
Figura 117. Función “Estadísticas”.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 96
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Realizaremos ahora una serie de problemas que involucra el cálculo de probabilidad continua.
Si usted desea replicar estos cálculos, descargue la planilla “Video 7-Ejercicios de variable continua”.
9.1. Probabilidad con distribución Exponencial.
Figura 118. Opción Probabilidad con distribución Exponencial.
Figura 119. Ejemplo cálculo de probabilidad Exponencial acumulada.
1. Seleccionamos la opción asociada a la distribución Exponencial.
2. Ingresamos el valor de la variable.
3. Ingresamos el valor del parámetro asociado a la variable de estudio.
4. Finalmente escribimos la palabra VERDADERO, la cual indica que deseamos que la probabilidad
entregada sea la acumulada hasta el valor especificado.
Nota: Si se ingresa la opción “FALSO” solo entregará la imagen del valor de la variable en la función de
densidad exponencial, esto, no es una probabilidad.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 97
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
9.2. Probabilidad con distribución Normal.
Figura 120. Opción Probabilidad con distribución Normal.
Figura 121. Ejemplo cálculo de probabilidad Exponencial acumulada.
1. Seleccionamos la opción asociada a la distribución Normal
2. Ingresamos el valor de la variable
3. Ingresamos el valor de la media
4. Ingresamos el valor de la desviación estándar
5. Finalmente escribimos la palabra VERDADERO, la cual indica que deseamos que la probabilidad
entregada sea la acumulada hasta el valor especificado.
9.3. Distribución Normal Inversa.
Figura 122. Opción distribución Normal Inversa.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 98
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 123. Ejemplo uso de función Normal Inversa.
1. Seleccionamos la opción asociada a la distribución Normal Inversa.
2. Ingresamos el valor del percentil, es decir, la probabilidad que acumula bajo él, el valor del
contenido del envase de leche desconocido.
3. Ingresamos el valor de la media.
4. Ingresamos el valor de la desviación estándar.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 99
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
9.1 EJERCICIOS PROPUESTOS, TEMA: NÚMEROS ALEATORIOS Y VARIABLE ALEATORIA
CONTINUA
1. Si X es una variable aleatoria con distribución Normal de media 3 y varianza 5. Determine la
probabilidad de que tal variable sea al menos 3,8.
2. Si X es una variable aleatoria con distribución Normal de media 3 y varianza 5. Determine la
probabilidad de que tal variable sea a lo más 4.
3. Sea X una variable aleatoria con distribución Normal de media 100 y desviación estándar 50. Simule
1000 observaciones aleatorias desde X, calcula su promedio y varianza. Compara con los resultados
teóricos.
4. Si X es una variable aleatoria con distribución Uniforme, donde 0<x<2. Determine la probabilidad de
que tal variable tome valores entre 1 y 1,5.
5. Sea X una distribución Uniforme entre 0 y 1. Simule 1000 observaciones aleatorias desde X, calcula
su promedio y varianza. Compara con los resultados teóricos.
6. Sea X una distribución Uniforme entre 0 y 1. Determine la probabilidad de que tal variable tome
valores entre 0,2 y 0,3.
7. Sea X una variable aleatoria con distribución Exponencial con valor esperado igual a 0,2. Simule 10
observaciones aleatorias desde X, calcula su promedio y varianza. Compara con los resultados
teóricos. Luego repita lo mismo para 100 y 1000 simulaciones.
8. Sea X una variable aleatoria con distribución Exponencial con valor esperado igual a 1. Determine la
probabilidad de que la variable aleatoria tome valores de al menos 0,5.
9. Sea X una variable aleatoria con distribución Exponencial con valor Varianza igual a 1/25.
Determine la probabilidad de que la variable aleatoria tome valores de al menos 5.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 100
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
10. Tablas bivariadas continuas y cálculo de probabilidades
El objetivo de este video es mostrar la construcción de tablas bivariadas utilizando la herramienta de Excel,
tablas dinámicas.
En nuestro ejemplo tenemos la fluctuación del dólar y el euro en un mismo mes, las variables con las que
trabajaremos son continuas y el interés será poder ver las frecuencias conjuntas en intervalos del mes.
Construiremos una tabla bivariada con 4 intervalos, entonces las frecuencias conjuntas resumidas en la
tabla mostrará la cantidad de días en que las monedas en conjunto tienen según su valor.
Lo primero que haremos es abrir el archivo “datos tabla bivariada”, hacemos ““click”” en “abrir”, archivo
Ahora que tenemos los datos, observamos que son 20 datos correspondientes a las variaciones de dólar y
euro en 20 días del mes de diciembre de 2014.
Posesionándonos en la primera celda de los datos hacemos ““click”” en insertar, tabla dinámica, tal como lo
hemos hecho en el video 3 referido a tablas bivariadas para variables cualitativas.
La primera columna corresponde al día del mes en que ocurrió la variación, este dato no es variable en
estudio, por lo que modificaremos el rango de entrada, incluyendo solo las columnas donde están los
valores del dólar y el euro.
La tabla la dejaremos en la misma hoja donde están los datos, para esto indicaremos en el rango de salida la
celda F1, y aceptamos.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 101
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 124. Ventana de opciones tabla dinámica.
Tenemos ahora la tabla dinámica, debemos indicarle los campos o variables que se incluirán, para este
ejemplo serán ambas variables.
Arrastramos el campo dólar hacia la casilla de las filas y el campo euros hacia la casilla de las columnas.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 102
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 125. Ingreso de variables fila y columna.
Observamos que la presentación de la tabla no es adecuada, dado que por ser variables continuas los datos
en su mayoría son distintos.
Lo que haremos será construir intervalos para ambos recorridos a modo de poder tener una mejor
presentación y resumen de las frecuencias conjuntas y marginales.
El número de intervalos se puede determinar por una formula conocida o bien según el objetivo del estudio.
En este caso será de interés visualizar el comportamiento de la variación de las monedas en cuatro niveles
de sus valores, entonces tendremos las frecuencias conjuntas resumidas en cuatro intervalos para ambas
variables.
Necesitaremos obtener los valores extremos y el rango, antes de construir los intervalos.
Para esto nos ubicaremos en las celdas por debajo de los datos, usted puede colocarlas donde desee o sea
más conveniente.
Colocaremos las fórmulas que permiten obtener el máximo, mínimo, rango y amplitud de lo s intervalos.
En la columna A a partir de la fila 23, escribiremos Máximo, Mínimo, Rango y amplitud.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 103
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 126. Elementos para cálculo de amplitud de “dólar” y “euro”.
En la celda B23, escribimos la fórmula igual MAX, paréntesis y marcamos el rango de los datos, en este caso
de la “variación del dólar”, ENTER
Figura 127. Cálculo de máximo.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 104
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
En celda B24, escribimos la formula igual MIN, paréntesis el rango de los datos, cierre de paréntesis
Figura 128. Cálculo de mínimo.
En celda B25, escribimos la fórmula para obtener el Rango, igual B23 menos B24, ENTER
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 105
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 129. Cálculo de Rango.
Finalmente escribimos la fórmula para obtener la amplitud de los intervalos, es igual B25 dividido por 4,
ENTER
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 106
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 130. Cálculo de amplitud.
Ahora copiamos estas mismas fórmulas para obtener máximo, mínimo, rango y amplitud de los intervalos,
para la variable “variación del euro”. Marcamos las celdas B23 a B26 y ubicando la cruz negra en la esquina
inferior derecha, arrastramos hacia las celdas C23 a C26, ENTER
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 107
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 131. Ampliación de cálculo a variable “euro”.
Ahora que ya conocemos la amplitud de los intervalos de ambas variables, volveremos a la tabla dinámica
para generar los intervalos que resumirán las frecuencias conjuntas.
Primero nos posesionamos sobre cualquier valor de variación del dólar, con el botón derecho elegimos
agrupar
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 108
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 132. Modificación de columna “dólar”.
Luego aparece un recuadro que muestra el máximo, el mínimo y pide que ingresemos la amplitud de los
intervalos, fijarse que son los mismos valores de máximo y mínimo que ya habíamos obtenido, en “POR”,
colocaremos la amplitud 3,99, y ACEPTAR
Figura 133. Ventana de modificación de columna “dólar”.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 109
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Automáticamente genera cuatro intervalos para la variable “variación del dólar”
Figura 134. Variable “dólar” modificada a intervalos.
Los mismos pasos haremos para la variable “variación del euro”
Figura 135. Ventana de modificación de columna “euro”.
La tabla ahora queda
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 110
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 136. Variable “euro” modificada a intervalos.
Para finalizar solo basta arrastrar cualquiera de los campos a la casilla valores, esto hará que la tabla
entregue las frecuencias conjuntas que deseamos tener
Figura 137. Ingreso de variable a campo de valores.
Ahora podemos interpretar algunas frecuencias en ellas:
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 111
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 138. Valores seleccionados para ejemplificar uso de tabla.
En cuatro de los 20 días del mes en que hubo variación de ambas monedas, estas estuvieron ambas en su
valor más bajo.
De igual forma, en tres de los 20 días del mes en que hubo variación de ambas monedas, estas estuvieron
ambas en su valor más alto.
Herramientas-de-Excel-para-Estadística.pdf
Herramientas-de-Excel-para-Estadística.pdf
Herramientas-de-Excel-para-Estadística.pdf
Herramientas-de-Excel-para-Estadística.pdf

Más contenido relacionado

Similar a Herramientas-de-Excel-para-Estadística.pdf

Secuencia de mercadotecnia 2
Secuencia de mercadotecnia 2Secuencia de mercadotecnia 2
Secuencia de mercadotecnia 2Guadalupe80
 
Problemas resueltos de estadistica aplicada a las ciencia social
Problemas resueltos de estadistica aplicada a las ciencia socialProblemas resueltos de estadistica aplicada a las ciencia social
Problemas resueltos de estadistica aplicada a las ciencia socialALEXIS PEÑAILILLO ARCE
 
Pruebas tecnicas para_el_proceso_de_seleccion_de_personal
Pruebas tecnicas para_el_proceso_de_seleccion_de_personalPruebas tecnicas para_el_proceso_de_seleccion_de_personal
Pruebas tecnicas para_el_proceso_de_seleccion_de_personalLeidy S. Rojas
 
Pruebas tecnicas para_el_proceso_de_seleccion_de_personal
Pruebas tecnicas para_el_proceso_de_seleccion_de_personalPruebas tecnicas para_el_proceso_de_seleccion_de_personal
Pruebas tecnicas para_el_proceso_de_seleccion_de_personalAiD Ingenieros Eirl
 
Guia de-estudio-paa
Guia de-estudio-paaGuia de-estudio-paa
Guia de-estudio-paadore26
 
Trabajo de grado USC Admón de Empresas
Trabajo de grado USC Admón de EmpresasTrabajo de grado USC Admón de Empresas
Trabajo de grado USC Admón de EmpresasWilliam Guerrero
 
Fb4 s matematicas4
Fb4 s matematicas4Fb4 s matematicas4
Fb4 s matematicas4Byron Daniel
 
Word, secciones, Tablas de contenidos. tabla de ilustraciones e índice
Word, secciones, Tablas de contenidos. tabla de ilustraciones e índice  Word, secciones, Tablas de contenidos. tabla de ilustraciones e índice
Word, secciones, Tablas de contenidos. tabla de ilustraciones e índice Victor Sefla
 
Diseño de una planta (producción catalizadores)
Diseño de una planta (producción catalizadores)Diseño de una planta (producción catalizadores)
Diseño de una planta (producción catalizadores)Jesus Guzman
 
Manual de mathematica
Manual de mathematicaManual de mathematica
Manual de mathematicaMateoLeonidez
 
Tesis Nivel de conocimiento sobre el pie diabético
Tesis Nivel de conocimiento sobre el pie diabético Tesis Nivel de conocimiento sobre el pie diabético
Tesis Nivel de conocimiento sobre el pie diabético Lorena Aguirre
 

Similar a Herramientas-de-Excel-para-Estadística.pdf (20)

Manual de SPSS/PASW
Manual de SPSS/PASWManual de SPSS/PASW
Manual de SPSS/PASW
 
PAU11 Castilla y León
PAU11 Castilla y LeónPAU11 Castilla y León
PAU11 Castilla y León
 
Secuencia de mercadotecnia 2
Secuencia de mercadotecnia 2Secuencia de mercadotecnia 2
Secuencia de mercadotecnia 2
 
Problemas resueltos de estadistica aplicada a las ciencia social
Problemas resueltos de estadistica aplicada a las ciencia socialProblemas resueltos de estadistica aplicada a las ciencia social
Problemas resueltos de estadistica aplicada a las ciencia social
 
finanzas
finanzasfinanzas
finanzas
 
Tesis Educacion 2
Tesis Educacion 2Tesis Educacion 2
Tesis Educacion 2
 
Pruebas tecnicas para_el_proceso_de_seleccion_de_personal
Pruebas tecnicas para_el_proceso_de_seleccion_de_personalPruebas tecnicas para_el_proceso_de_seleccion_de_personal
Pruebas tecnicas para_el_proceso_de_seleccion_de_personal
 
Pruebas tecnicas para_el_proceso_de_seleccion_de_personal
Pruebas tecnicas para_el_proceso_de_seleccion_de_personalPruebas tecnicas para_el_proceso_de_seleccion_de_personal
Pruebas tecnicas para_el_proceso_de_seleccion_de_personal
 
Guia de-estudio-paa
Guia de-estudio-paaGuia de-estudio-paa
Guia de-estudio-paa
 
Guia de-estudio-paa
Guia de-estudio-paaGuia de-estudio-paa
Guia de-estudio-paa
 
Trabajo de grado USC Admón de Empresas
Trabajo de grado USC Admón de EmpresasTrabajo de grado USC Admón de Empresas
Trabajo de grado USC Admón de Empresas
 
Fb4 s matematicas4
Fb4 s matematicas4Fb4 s matematicas4
Fb4 s matematicas4
 
Manual de excel avanzado
Manual de excel avanzadoManual de excel avanzado
Manual de excel avanzado
 
TGT_1182 (2).pdf
TGT_1182 (2).pdfTGT_1182 (2).pdf
TGT_1182 (2).pdf
 
Word, secciones, Tablas de contenidos. tabla de ilustraciones e índice
Word, secciones, Tablas de contenidos. tabla de ilustraciones e índice  Word, secciones, Tablas de contenidos. tabla de ilustraciones e índice
Word, secciones, Tablas de contenidos. tabla de ilustraciones e índice
 
Diseño de una planta (producción catalizadores)
Diseño de una planta (producción catalizadores)Diseño de una planta (producción catalizadores)
Diseño de una planta (producción catalizadores)
 
Srf 1 2015
Srf 1 2015Srf 1 2015
Srf 1 2015
 
Manual de mathematica
Manual de mathematicaManual de mathematica
Manual de mathematica
 
Tesis Nivel de conocimiento sobre el pie diabético
Tesis Nivel de conocimiento sobre el pie diabético Tesis Nivel de conocimiento sobre el pie diabético
Tesis Nivel de conocimiento sobre el pie diabético
 
16185199 mecanizado-cnc-torno-y-fresadora
16185199 mecanizado-cnc-torno-y-fresadora16185199 mecanizado-cnc-torno-y-fresadora
16185199 mecanizado-cnc-torno-y-fresadora
 

Más de Carlos Franco

Conceptos Básicos de Estadística - Diplomado en Análisis de Información Geoes...
Conceptos Básicos de Estadística - Diplomado en Análisis de Información Geoes...Conceptos Básicos de Estadística - Diplomado en Análisis de Información Geoes...
Conceptos Básicos de Estadística - Diplomado en Análisis de Información Geoes...Carlos Franco
 
Media Mediana y Moda.pdf
Media Mediana y Moda.pdfMedia Mediana y Moda.pdf
Media Mediana y Moda.pdfCarlos Franco
 
REGLAS_DERIVACION.pdf
REGLAS_DERIVACION.pdfREGLAS_DERIVACION.pdf
REGLAS_DERIVACION.pdfCarlos Franco
 
REGLAS_DERIVACION.pdf
REGLAS_DERIVACION.pdfREGLAS_DERIVACION.pdf
REGLAS_DERIVACION.pdfCarlos Franco
 
estadistica_5 (1).pdf
estadistica_5 (1).pdfestadistica_5 (1).pdf
estadistica_5 (1).pdfCarlos Franco
 
Estadística con SPSS.pdf
Estadística con SPSS.pdfEstadística con SPSS.pdf
Estadística con SPSS.pdfCarlos Franco
 
Pag_217 probabilidades.pdf
Pag_217 probabilidades.pdfPag_217 probabilidades.pdf
Pag_217 probabilidades.pdfCarlos Franco
 
estadistica_ejercicio.pdf
estadistica_ejercicio.pdfestadistica_ejercicio.pdf
estadistica_ejercicio.pdfCarlos Franco
 
estadistica_ejercicio probabilidades.pdf
estadistica_ejercicio probabilidades.pdfestadistica_ejercicio probabilidades.pdf
estadistica_ejercicio probabilidades.pdfCarlos Franco
 
Comunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdf
Comunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdfComunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdf
Comunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdfCarlos Franco
 
Cuartiles_deciles_y_percentiles.Ppalpdf.pdf
Cuartiles_deciles_y_percentiles.Ppalpdf.pdfCuartiles_deciles_y_percentiles.Ppalpdf.pdf
Cuartiles_deciles_y_percentiles.Ppalpdf.pdfCarlos Franco
 
Medidas de Dispersión..pdf
Medidas de Dispersión..pdfMedidas de Dispersión..pdf
Medidas de Dispersión..pdfCarlos Franco
 
Medidas de Dispersion empleando Excel.pdf
Medidas de Dispersion empleando Excel.pdfMedidas de Dispersion empleando Excel.pdf
Medidas de Dispersion empleando Excel.pdfCarlos Franco
 
Asimetria y Curtosis, Resumen de Medidas de Dispersión.pdf
Asimetria y Curtosis, Resumen de Medidas de Dispersión.pdfAsimetria y Curtosis, Resumen de Medidas de Dispersión.pdf
Asimetria y Curtosis, Resumen de Medidas de Dispersión.pdfCarlos Franco
 
MEDIDASDEDISPERSION.pdf
MEDIDASDEDISPERSION.pdfMEDIDASDEDISPERSION.pdf
MEDIDASDEDISPERSION.pdfCarlos Franco
 
medidas-tendencia-central datos agrupados y no agrupados.pdf
medidas-tendencia-central datos agrupados y no agrupados.pdfmedidas-tendencia-central datos agrupados y no agrupados.pdf
medidas-tendencia-central datos agrupados y no agrupados.pdfCarlos Franco
 

Más de Carlos Franco (20)

Conceptos Básicos de Estadística - Diplomado en Análisis de Información Geoes...
Conceptos Básicos de Estadística - Diplomado en Análisis de Información Geoes...Conceptos Básicos de Estadística - Diplomado en Análisis de Información Geoes...
Conceptos Básicos de Estadística - Diplomado en Análisis de Información Geoes...
 
Media Mediana y Moda.pdf
Media Mediana y Moda.pdfMedia Mediana y Moda.pdf
Media Mediana y Moda.pdf
 
REGLAS_DERIVACION.pdf
REGLAS_DERIVACION.pdfREGLAS_DERIVACION.pdf
REGLAS_DERIVACION.pdf
 
PARES ORDENADOS.pdf
PARES ORDENADOS.pdfPARES ORDENADOS.pdf
PARES ORDENADOS.pdf
 
REGLAS_DERIVACION.pdf
REGLAS_DERIVACION.pdfREGLAS_DERIVACION.pdf
REGLAS_DERIVACION.pdf
 
estadistica_5 (1).pdf
estadistica_5 (1).pdfestadistica_5 (1).pdf
estadistica_5 (1).pdf
 
tema1.pdf
tema1.pdftema1.pdf
tema1.pdf
 
Estadística con SPSS.pdf
Estadística con SPSS.pdfEstadística con SPSS.pdf
Estadística con SPSS.pdf
 
Pag_217 probabilidades.pdf
Pag_217 probabilidades.pdfPag_217 probabilidades.pdf
Pag_217 probabilidades.pdf
 
estadistica_ejercicio.pdf
estadistica_ejercicio.pdfestadistica_ejercicio.pdf
estadistica_ejercicio.pdf
 
estadistica_ejercicio probabilidades.pdf
estadistica_ejercicio probabilidades.pdfestadistica_ejercicio probabilidades.pdf
estadistica_ejercicio probabilidades.pdf
 
dispersion.pdf
dispersion.pdfdispersion.pdf
dispersion.pdf
 
Comunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdf
Comunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdfComunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdf
Comunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdf
 
Cuartiles_deciles_y_percentiles.Ppalpdf.pdf
Cuartiles_deciles_y_percentiles.Ppalpdf.pdfCuartiles_deciles_y_percentiles.Ppalpdf.pdf
Cuartiles_deciles_y_percentiles.Ppalpdf.pdf
 
Medidas de Dispersión..pdf
Medidas de Dispersión..pdfMedidas de Dispersión..pdf
Medidas de Dispersión..pdf
 
Medidas de Dispersion empleando Excel.pdf
Medidas de Dispersion empleando Excel.pdfMedidas de Dispersion empleando Excel.pdf
Medidas de Dispersion empleando Excel.pdf
 
Asimetria y Curtosis, Resumen de Medidas de Dispersión.pdf
Asimetria y Curtosis, Resumen de Medidas de Dispersión.pdfAsimetria y Curtosis, Resumen de Medidas de Dispersión.pdf
Asimetria y Curtosis, Resumen de Medidas de Dispersión.pdf
 
MEDIDASDEDISPERSION.pdf
MEDIDASDEDISPERSION.pdfMEDIDASDEDISPERSION.pdf
MEDIDASDEDISPERSION.pdf
 
medidas-tendencia-central datos agrupados y no agrupados.pdf
medidas-tendencia-central datos agrupados y no agrupados.pdfmedidas-tendencia-central datos agrupados y no agrupados.pdf
medidas-tendencia-central datos agrupados y no agrupados.pdf
 
resueltos_B5_t2.pdf
resueltos_B5_t2.pdfresueltos_B5_t2.pdf
resueltos_B5_t2.pdf
 

Último

TEMA 4 TEORIAS SOBRE EL ORIGEN DE LA VIDA.pdf
TEMA 4 TEORIAS SOBRE EL ORIGEN DE LA VIDA.pdfTEMA 4 TEORIAS SOBRE EL ORIGEN DE LA VIDA.pdf
TEMA 4 TEORIAS SOBRE EL ORIGEN DE LA VIDA.pdfrobertocarlosbaltaza
 
Novena a la Medalla Milagrosa, es una devoción
Novena a la Medalla Milagrosa,  es una devociónNovena a la Medalla Milagrosa,  es una devoción
Novena a la Medalla Milagrosa, es una devociónandres2973
 
CLASE 5 HOJA 2022.ppt botanica general 1
CLASE 5 HOJA 2022.ppt botanica general 1CLASE 5 HOJA 2022.ppt botanica general 1
CLASE 5 HOJA 2022.ppt botanica general 1jesusjja0210
 
Presentación digital Sobre ecosistemas, la selva
Presentación digital Sobre ecosistemas, la selvaPresentación digital Sobre ecosistemas, la selva
Presentación digital Sobre ecosistemas, la selvajesusvelazquez601
 
Virus del dengue perú 2024 diagnostico,manejo,
Virus del dengue perú 2024 diagnostico,manejo,Virus del dengue perú 2024 diagnostico,manejo,
Virus del dengue perú 2024 diagnostico,manejo,KiaraIbaezParedes
 
PARTES y Anatomía de la ESCÁPULA.descrpcion, fncinalidad
PARTES y Anatomía de la ESCÁPULA.descrpcion, fncinalidadPARTES y Anatomía de la ESCÁPULA.descrpcion, fncinalidad
PARTES y Anatomía de la ESCÁPULA.descrpcion, fncinalidadeumartinezvete
 
La independencia de México único resistencia y consumación
La independencia de México único resistencia y consumaciónLa independencia de México único resistencia y consumación
La independencia de México único resistencia y consumaciónMoralesSantizBrendaL
 
Tractos ascendentes y descendentes de la médula
Tractos ascendentes y descendentes de la médulaTractos ascendentes y descendentes de la médula
Tractos ascendentes y descendentes de la méduladianymorales5
 
propiedades y clasificacion de los materiales metalicos
propiedades y clasificacion de los materiales metalicospropiedades y clasificacion de los materiales metalicos
propiedades y clasificacion de los materiales metalicosOmarazahiSalinasLpez
 
Sistema Endocrino, rol de los receptores hormonales, hormonas circulantes y l...
Sistema Endocrino, rol de los receptores hormonales, hormonas circulantes y l...Sistema Endocrino, rol de los receptores hormonales, hormonas circulantes y l...
Sistema Endocrino, rol de los receptores hormonales, hormonas circulantes y l...GloriaMeza12
 
Coherencia textual II Práctica dirigida h
Coherencia textual II Práctica dirigida hCoherencia textual II Práctica dirigida h
Coherencia textual II Práctica dirigida hSalomDB1
 
TEJIDOS HISTOLÓGICOS osteona, canal de haves.pptx
TEJIDOS HISTOLÓGICOS osteona, canal de haves.pptxTEJIDOS HISTOLÓGICOS osteona, canal de haves.pptx
TEJIDOS HISTOLÓGICOS osteona, canal de haves.pptxmorajoe2109
 
5.1 INCREMENTO Y DIFERENCIACIÓN (3).pptx
5.1 INCREMENTO Y DIFERENCIACIÓN (3).pptx5.1 INCREMENTO Y DIFERENCIACIÓN (3).pptx
5.1 INCREMENTO Y DIFERENCIACIÓN (3).pptxllacza2004
 
nulidad de documentos privados en sede administrativa y otros.doc
nulidad de documentos privados en sede administrativa y otros.docnulidad de documentos privados en sede administrativa y otros.doc
nulidad de documentos privados en sede administrativa y otros.docSandroGutirrezTorrez
 
NEMATODOS TISULARES-2020.pdf, DE LA UNAN MANAGUA
NEMATODOS TISULARES-2020.pdf, DE LA UNAN MANAGUANEMATODOS TISULARES-2020.pdf, DE LA UNAN MANAGUA
NEMATODOS TISULARES-2020.pdf, DE LA UNAN MANAGUAcelixfabiolacaleropa
 
Van Young, Eric. - La otra rebelión. La lucha por la independencia de México,...
Van Young, Eric. - La otra rebelión. La lucha por la independencia de México,...Van Young, Eric. - La otra rebelión. La lucha por la independencia de México,...
Van Young, Eric. - La otra rebelión. La lucha por la independencia de México,...frank0071
 
Tortosa et al. 2º Simposio Internacional Composta.pdf
Tortosa et al. 2º Simposio Internacional Composta.pdfTortosa et al. 2º Simposio Internacional Composta.pdf
Tortosa et al. 2º Simposio Internacional Composta.pdfGermán Tortosa
 
Carbohidratos, lipidos, acidos nucleicos, y principios del metabolismo.
Carbohidratos, lipidos, acidos nucleicos, y principios del metabolismo.Carbohidratos, lipidos, acidos nucleicos, y principios del metabolismo.
Carbohidratos, lipidos, acidos nucleicos, y principios del metabolismo.Ralvila5
 
Sujeción e inmobilización de perros y gatos (1).pdf
Sujeción e inmobilización de perros y gatos (1).pdfSujeción e inmobilización de perros y gatos (1).pdf
Sujeción e inmobilización de perros y gatos (1).pdfXIMENAESTEFANIAGARCI1
 
fisilogia y anatomia del oido y el equilibrio
fisilogia y anatomia del oido y el equilibriofisilogia y anatomia del oido y el equilibrio
fisilogia y anatomia del oido y el equilibrioyanezevelyn0
 

Último (20)

TEMA 4 TEORIAS SOBRE EL ORIGEN DE LA VIDA.pdf
TEMA 4 TEORIAS SOBRE EL ORIGEN DE LA VIDA.pdfTEMA 4 TEORIAS SOBRE EL ORIGEN DE LA VIDA.pdf
TEMA 4 TEORIAS SOBRE EL ORIGEN DE LA VIDA.pdf
 
Novena a la Medalla Milagrosa, es una devoción
Novena a la Medalla Milagrosa,  es una devociónNovena a la Medalla Milagrosa,  es una devoción
Novena a la Medalla Milagrosa, es una devoción
 
CLASE 5 HOJA 2022.ppt botanica general 1
CLASE 5 HOJA 2022.ppt botanica general 1CLASE 5 HOJA 2022.ppt botanica general 1
CLASE 5 HOJA 2022.ppt botanica general 1
 
Presentación digital Sobre ecosistemas, la selva
Presentación digital Sobre ecosistemas, la selvaPresentación digital Sobre ecosistemas, la selva
Presentación digital Sobre ecosistemas, la selva
 
Virus del dengue perú 2024 diagnostico,manejo,
Virus del dengue perú 2024 diagnostico,manejo,Virus del dengue perú 2024 diagnostico,manejo,
Virus del dengue perú 2024 diagnostico,manejo,
 
PARTES y Anatomía de la ESCÁPULA.descrpcion, fncinalidad
PARTES y Anatomía de la ESCÁPULA.descrpcion, fncinalidadPARTES y Anatomía de la ESCÁPULA.descrpcion, fncinalidad
PARTES y Anatomía de la ESCÁPULA.descrpcion, fncinalidad
 
La independencia de México único resistencia y consumación
La independencia de México único resistencia y consumaciónLa independencia de México único resistencia y consumación
La independencia de México único resistencia y consumación
 
Tractos ascendentes y descendentes de la médula
Tractos ascendentes y descendentes de la médulaTractos ascendentes y descendentes de la médula
Tractos ascendentes y descendentes de la médula
 
propiedades y clasificacion de los materiales metalicos
propiedades y clasificacion de los materiales metalicospropiedades y clasificacion de los materiales metalicos
propiedades y clasificacion de los materiales metalicos
 
Sistema Endocrino, rol de los receptores hormonales, hormonas circulantes y l...
Sistema Endocrino, rol de los receptores hormonales, hormonas circulantes y l...Sistema Endocrino, rol de los receptores hormonales, hormonas circulantes y l...
Sistema Endocrino, rol de los receptores hormonales, hormonas circulantes y l...
 
Coherencia textual II Práctica dirigida h
Coherencia textual II Práctica dirigida hCoherencia textual II Práctica dirigida h
Coherencia textual II Práctica dirigida h
 
TEJIDOS HISTOLÓGICOS osteona, canal de haves.pptx
TEJIDOS HISTOLÓGICOS osteona, canal de haves.pptxTEJIDOS HISTOLÓGICOS osteona, canal de haves.pptx
TEJIDOS HISTOLÓGICOS osteona, canal de haves.pptx
 
5.1 INCREMENTO Y DIFERENCIACIÓN (3).pptx
5.1 INCREMENTO Y DIFERENCIACIÓN (3).pptx5.1 INCREMENTO Y DIFERENCIACIÓN (3).pptx
5.1 INCREMENTO Y DIFERENCIACIÓN (3).pptx
 
nulidad de documentos privados en sede administrativa y otros.doc
nulidad de documentos privados en sede administrativa y otros.docnulidad de documentos privados en sede administrativa y otros.doc
nulidad de documentos privados en sede administrativa y otros.doc
 
NEMATODOS TISULARES-2020.pdf, DE LA UNAN MANAGUA
NEMATODOS TISULARES-2020.pdf, DE LA UNAN MANAGUANEMATODOS TISULARES-2020.pdf, DE LA UNAN MANAGUA
NEMATODOS TISULARES-2020.pdf, DE LA UNAN MANAGUA
 
Van Young, Eric. - La otra rebelión. La lucha por la independencia de México,...
Van Young, Eric. - La otra rebelión. La lucha por la independencia de México,...Van Young, Eric. - La otra rebelión. La lucha por la independencia de México,...
Van Young, Eric. - La otra rebelión. La lucha por la independencia de México,...
 
Tortosa et al. 2º Simposio Internacional Composta.pdf
Tortosa et al. 2º Simposio Internacional Composta.pdfTortosa et al. 2º Simposio Internacional Composta.pdf
Tortosa et al. 2º Simposio Internacional Composta.pdf
 
Carbohidratos, lipidos, acidos nucleicos, y principios del metabolismo.
Carbohidratos, lipidos, acidos nucleicos, y principios del metabolismo.Carbohidratos, lipidos, acidos nucleicos, y principios del metabolismo.
Carbohidratos, lipidos, acidos nucleicos, y principios del metabolismo.
 
Sujeción e inmobilización de perros y gatos (1).pdf
Sujeción e inmobilización de perros y gatos (1).pdfSujeción e inmobilización de perros y gatos (1).pdf
Sujeción e inmobilización de perros y gatos (1).pdf
 
fisilogia y anatomia del oido y el equilibrio
fisilogia y anatomia del oido y el equilibriofisilogia y anatomia del oido y el equilibrio
fisilogia y anatomia del oido y el equilibrio
 

Herramientas-de-Excel-para-Estadística.pdf

  • 1. APUNTE: HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA PROFESORES: ÁLVARO TOLEDO SAN MARTÍN INÉS VICENCIO PARDO Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física
  • 2. APUNTE: HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA CÁTEDRA: ESTADÍSTICA I – ESTADÍSTICA APLICADA 2015 PROFESOR: ÁLVARO TOLEDO SAN MARTÍN Licenciado en Matemáticas, Estadístico y Magíster en Estadística de la Pontificia Universidad Católica de Chile. Coordinador de Estadística del Departamento de Matemática y Física , Universidad Bernardo O´Higgins. Atiende las cátedras de Estadística I y Estadística II, Matemática Básica, Álgebra y Cálculo I de la Universidad Bernardo O`Higgins Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física
  • 3. APUNTE: HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA CÁTEDRA: ESTADÍSTICA I – ESTADÍSTICA APLICADA 2015 PROFESORA: INÉS VICENCIO PARDO Profesora de Matemática y Computación, Universidad de Santiago de Chile. Magíster en Estadística Pontificia Universidad Católica de Chile. Coordinadora de Matemática y Álgebra del Departamento de Matemática y Física , Universidad Bernardo O´Higgins. Atiende las cátedras de Estadística I y Estadística II, Matemática Básica, Álgebra y Cálculo I. Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física
  • 4. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 5 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física CONTENIDO PRESENTACIÓN.................................................................................................................................... 7 1. Activación de la herramienta de análisis de datos de MS Office Excel. ...................................... 8 2. Confección de Tabla de frecuencias con función tabla dinámica.............................................. 10 2.1 Despliegue de opciones en Tabla Dinámica ........................................................................ 12 3. Estadística Descriptiva con la función Análisis de datos............................................................ 14 4. Construcción de un Histograma. ............................................................................................... 20 4.1 Una aplicación de medidas descriptivas.............................................................................. 27 4.2 EJERCICIOS PROPUESTOS, TEMA: TABLAS DE FRECUENCIAS, ESTADÍSTICA DESCRIPTIVA E HISTOGRAMA................................................................................................................................ 37 5. Tablas de contingencia .............................................................................................................. 39 5.1 ESQUEMA RESUMEN DE CONSTRUCCIÓN DE TABLA DE CONTINGENCIA........................... 46 6. Probabilidades y Teorema de Bayes.......................................................................................... 47 6.1 ESQUEMA RESUMEN CON PROBLEMAS DE PROBABILIDADES Y TEOREMA DE BAYES ....... 56 6.2 EJERCICIOS PROPUESTOS, TEMA: TABLA DE CONTINGENCIA, PROBABILIDADES Y TEOREMA DE BAYES ....................................................................................................................................... 58 7. La opción “Generación de números aleatorios” de la herramienta Análisis de datos de MS Excel. ................................................................................................................................................. 75 7.1 “Anexo de distribuciones” de la opción “Generación de números aleatorios” de la herramienta Análisis de datos de MS Excel. ................................................................................. 78 7.1.1 Distribución discreta:.................................................................................................... 79 7.1.2 Distribución Uniforme: ................................................................................................. 81 7.1.3 Distribución Normal:..................................................................................................... 82 7.1.4 Distribución de Bernoulli: ............................................................................................. 83
  • 5. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 6 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 7.1.5 Distribución Binomial:................................................................................................... 84 7.1.6 Distribución Poisson: .................................................................................................... 86 7.1.7 Frecuencia Relativa:...................................................................................................... 87 8. Distribuciones de probabilidad Discreta.................................................................................... 89 8.1. Probabilidad con distribución Binomial.............................................................................. 90 8.2. Probabilidad con distribución Binomial Inversa. ................................................................ 91 8.3. Probabilidad con distribución Hipergeométrica................................................................. 91 8.4. Probabilidad con Distribución de Poisson. ......................................................................... 92 8.1 EJERCICIOS PROPUESTOS, TEMA: NÚMEROS ALEATORIOS Y VARIABLE ALEATORIA DISCRETA....................................................................................................................................... 94 9. Distribuciones de probabilidad Continua .................................................................................. 95 9.1. Probabilidad con distribución Exponencial......................................................................... 96 9.2. Probabilidad con distribución Normal................................................................................ 97 9.3. Distribución Normal Inversa. .............................................................................................. 97 9.1 EJERCICIOS PROPUESTOS, TEMA: NÚMEROS ALEATORIOS Y VARIABLE ALEATORIA CONTINUA..................................................................................................................................... 99 10. Tablas bivariadas continuas y cálculo de probabilidades...................................................... 100 10.1 ESQUEMA RESUMEN TABLA BIVARIADA PARA DATOS CONTINUOS............................... 112 10.2 EJERCICIOS PROPUESTOS, TEMA: TABLA BIVARIADA CONTINUA ................................... 113 CONCLUSIÓN................................................................................................................................... 114 BIBLIOGRAFÍA.................................................................................................................................. 115
  • 6. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 7 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física PRESENTACIÓN Dentro del ámbito de la Estadística como ciencia aplicada, un estudiante de Ingeniería debe adquirir conocimientos que abarcan temas de análisis descriptivo de variables, problemas de probabilidad, estimación de modelos probabilístico y simulación de distribuciones de probabilidad, además de la inferencia estadística y el estudio de modelos estadísticos multivariados. El propósito de este material de apoyo es proveer al estudiante de Ingeniería (y de otras carreras) los conocimientos aplicados en software para desarrollar y comprender los contenidos del curso Estadística I (Estadística Aplicada) impartido por el Departamento de Matemática y Física para la Facultad de Ingeniería y Administración. El software a utilizar será Microsoft Excel. Se ha seleccionado Excel dado que es un programa de uso masivo que cuenta con las herramientas básicas suficientes para realizar tablas, gráficos, análisis de dados y que nuestro futuro profesional Ingeniero sin duda, podrá utilizar en el campo laboral. La organización de este documento sigue el orden de un programa de Estadística Matemática habitual y que es similar al orden de los contenidos que se tratan el curso de Estadística I (Estadística Aplicada). Incluye en un principio los pasos para activar la herramienta “Análisis de datos” que dispone Excel para Estadística, luego, se concentra el documento en el análisis descriptivos de datos y el análisis gráfico, luego, ejemplifica el cálculo de probabilidad abarcando hasta el importante Teorema de Bayes, para luego, entrar en el análisis de las variables aleatorias discretas y continuas haciendo énfasis en la capacidad de Excel para realizar simulaciones de este tipo de variables. Finalmente se complementa con la construcción de tablas bivariadas para datos continuos (y discretos) como extensión al caso de variables cualitativas. Este material es de carácter inédito, pues corresponde a la recolección de cursos y experiencias de análisis en el software Excel realizada por los autores en distintos cursos de estadística realizados en distintas casas de estudio. Algunos de los problemas propuestos se recopilaron de textos de Estadística que son citados habitualmente en la bibliografía de un curso formal de Estadística Matemática.
  • 7. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 8 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 1. Activación de la herramienta de análisis de datos de MS Office Excel. Para la activación de la herramienta análisis de datos de Excel, realice los siguientes pasos: Abra una hoja de Excel Haga “click” en la pestaña de “Archivo” ubicada en la parte superior izquierda de la hoja de Excel. Figura 1: Ubicación de la opción archivo en planilla Excel Se desplegará un menú en el costado izquierdo de la hoja. Figura 2: Ubicación de “Opciones” en la planilla Excel En el menú haga “click” en “Opciones” Se desplegará la siguiente ventana, de la cual debe seleccionar la opción “complementos”, luego haga “click” en “herramientas para análisis” y finalmente “click” en “ir”.
  • 8. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 9 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 3. Esquema de pasos para seleccionar la herramienta de análisis del menú complementos. En la ventana siguiente debe hacer “click” en la opción “herramienta para análisis” y luego aceptar. Figura 4. Ventana de complementos. La herramienta de análisis de datos ha sido activada. Para visualizarla se debe ir a la opción “Datos” de la barra superior de la hoja de Excel. En la parte final aparecerá activada la opción “Análisis de datos”.
  • 9. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 10 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 5. Visualización de la herramienta de análsis de datos . 2. Confección de Tabla de frecuencias con función tabla dinámica La siguiente tabla dinámica, será confeccionada con la base de datos dado.xlsx 1 , la cual representa el resultado obtenido del lanzamiento en 100 oportunidades de un dado equilibrado. Figura 6. Ubicación de función Tabla dinámica 1. Ir a la opción “Insertar”, en la parte superior de la planilla Excel que contiene los datos a trabajar. 2. Seleccionar la opción “Tabla dinámica”. 1 Base de datos disponible en la página web del Departamento de Matemática y Física.
  • 10. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 11 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 7. Ingreso de datos en función tabla dinámica. 3. Ingresar los datos en la opción “Tabla o rango”. Cabe destacar que por defecto Excel usará el dato ubicado en la primera fila como el título de la tabla dinámica. 4. Por defecto las opciones de la tabla dinámica aparecerán en la hoja de trabajo actual, pero es posible indicar que aparezcan en una hoja nueva. 5. Hacer “click” en “Aceptar”
  • 11. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 12 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 2.1 Despliegue de opciones en Tabla Dinámica Figura 8. Opciones Tabla Dinámica. 3. En el recuadro “Seleccionar campos para agregar al informe” desplazar el campo con el nombre de la variable (N°caraDado) hasta el recuadro “Etiqueta de fila”. Figura 9. Ilustración de construcción de tabla dinámica.
  • 12. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 13 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 4. Luego, en el recuadro “valores” hacer “click” sobre la opción por defecto “Suma de N°caraDado”, y seleccionar la opción “configuración de campo de valor”. Figura 10. Menú configuración “Campo de Valor” 5. Cambiar la opción “Suma” por la opción “Cuenta”. 6. Hacer “click” en “Aceptar”. Figura 11. Tabla dinámica Con esto se ha generado una tabla de frecuencias absolutas para la variable de estudio N°caraDado, la cual, resume la cantidad de veces que se obtuvo cierta cara del dado. Por ejemplo, la cara del dado con el valor 1, se obtuvo 22 veces de los 100 lanzamientos.
  • 13. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 14 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 3. Estadística Descriptiva con la función Análisis de datos. El objetivo de este video es mostrar el uso de la herramienta Análisis de Datos para la obtención de estadísticas descriptivas y confección de un histograma de frecuencias. Primero debemos seleccionar el menú de DATOS y hacer ““click”” en la herramienta “Análisis de Datos” Figura 12. Selección de opción análisis de datos. Cabe notar que cuando se utiliza un programa estadístico para los cálculos de estadísticos descriptivos, no es necesario confeccionar tablas de frecuencias. Las tablas de frecuencias serán de utilidad para la confección de gráficos y para presentar resumen de la información en el informe final. Para nuestro ejemplo utilizaremos la información que tenemos de las estaturas de 100 personas, disponibles en el archivo “Ejemplo descriptivas.xlsx 2 ”. Abrimos el archivo y tenemos: 2 Base de datos disponible en la página web del Departamento de Matemática y Física.
  • 14. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 15 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 13. Base de datos “Ejemplo descriptivas.xlsx”. Con esta base de datos mostraremos lo que entrega la herramienta “Análisis de Datos” en su opción, “Estadísticas Descriptivas”. Vamos al menú DATOS, hacemos ““click”” en “Análisis de Datos”, posteriormente hacemos ““click”” en la opción Estadísticas Descriptivas y finalmente ““click”” en aceptar. Figura 14. Opción Estadísticas Descriptivas. Se despliega el siguiente cuadro:
  • 15. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 16 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 15. Ventana de ingreso de datos. En esta ventana debemos ingresar el rango de datos que analizaremos, en este caso serán la columna donde se encuentran las estaturas de las 100 personas, si se incluye en el rango de entrada el nombre de la variable, entonces se debe marcar la opción “Rótulos en la primera fila”. Figura 16. Ingreso de datos.
  • 16. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 17 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Para las opciones de salida, marcaremos la opción Rango de Salida, y le indicamos una celda contigua a la columna de datos, por ejemplo la D1, entonces los resultados que nos entregue Excel quedarán a partir de esta celda. También si se estima por orden, podemos optar por dejar los resultados en una nueva hoja. Marcamos Resumen de estadísticas y Aceptar. Figura 17. Resumen de estadísticas. Excel nos entrega el listado de estadísticas descriptivas para la Variable Estatura Figura 18. Salida computacional de la opción análisis de datos.
  • 17. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 18 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Las estaturas están medidas con dos decimales que indican los centímetros, podemos entonces dejar las estadísticas descriptivas que obtuvimos también con dos decimales, esto facilitará la interpretación. Seleccionamos el rango de los valores de las medidas y con el botón derecho seleccionamos “Formato de celdas”. Figura 19. Opciones de presentación de datos. Y luego seleccionar formato número, “posición de decimales”: 2, y Aceptar Figura 20. Modificar decimales de la salida de datos.
  • 18. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 19 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Queda la siguiente presentación: Figura 21. Resumen de estadísticas con dos decimales. Las interpretaciones de las medidas de tendencia central son las siguientes: Media: - La media o promedio de las estaturas de las 100 personas es 1,60 metros, un metro y sesenta centímetros. Mediana: - El 50% de las personas con menores estaturas miden a lo más 1,61 metros , un metro y 61 centímetros, también podemos decir que el 50% de las personas más altas miden más de 1,61 metros. Moda: - Lo más frecuente en estas 100 personas es que midan aproximadamente 1,49 metros. Por otra parte la Desviación Estándar, que es la raíz cuadrada de la varianza, nos da una aproximación del promedio de las desviaciones de los datos respecto de su media. En nuestro ejemplo la desviación estándar es de 0,15 metros, es decir 15 cm, por lo que podemos decir que los datos tienen una desviación promedio aproximada respecto de los datos de 15 cm. Si tuviésemos las edades de otro grupo de personas, entonces podríamos comparar homogeneidad entre ellos, a menor desviación estándar entonces los datos son más homogéneos (datos más cercanos a promedio, menor dispersión de los datos)
  • 19. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 20 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 4. Construcción de un Histograma. Veamos ahora la construcción del histograma de frecuencia para los datos disponibles en la planilla “Ejemplo descriptivas”. Vamos al menú DATOS, hacemos ““click”” en “Análisis de Datos”, posteriormente hacemos ““click”” en la opción Histograma y finalmente ““click”” en aceptar. Figura 22. Función Histograma. Al hacer ““click”” en Aceptar, nos muestra el siguiente Cuadro
  • 20. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 21 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 23. Ventana de ingreso de datos . Aquí en el “rango de entrada” seleccionamos los datos que tenemos de las estaturas, en la opción “Rango de clase” no ingresaremos información, ya que queremos que el programa determine el número de clases de nuestro Histograma, marcamos “rótulo”, seleccionamos un “rango de salida”, finalmente marcamos las opciones “Porcentaje acumulado” , “Crear gráfico” y aceptamos.
  • 21. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 22 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 24. Opciones “Porcentaje acumulado” y “Crear gráfico (Histograma)”. Excel nos entrega una tabla de frecuencias con los porcentajes acumulados de dichas frecuencias, asociados a una clase que Excel determina, aquí el programa para las 100 estaturas determinó un resumen construyendo 11 intervalos. Figura 25. Salida computacional de opción “Histograma”.
  • 22. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 23 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física El histograma de frecuencias, además, muestra el gráfico de líneas con los porcentajes acumulados. Para visualizar mejor, agrandamos el gráfico y nos posesionamos sobre las barras para cambiar el ancho de estas, recordemos que la variable estaturas es continua y las barras se deben visualizar juntas formando un polígono de frecuencias. Hacemos “click” con el botón derecho del mouse sobre una de las barras, seleccionamos dar formato a serie de datos Figura 26. Opciones de formato. Luego cambiamos el Ancho del intervalo, de 150% a 0% y presionamos Enter.
  • 23. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 24 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 27. Modificaciones al ancho del intervalo. Con esta misma opción, seleccionamos ahora el ícono del balde que es para relleno y líneas, y hacemos “click”. Figura 28. Opciones de serie.
  • 24. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 25 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Luego elegimos un color negro para las líneas de las barras, cerramos la ventana. Figura 29. Ingreso de nombre a histograma. Lo único que falta es escribir un título adecuado y dar nombre al eje de las clases. Hacemos “click” sobre el título y lo modificamos, escribiremos “Histograma de frecuencia de las Edades”, de igual forma hacemos “click” sobre clase en el eje de las abscisas y lo modificamos, escribiremos allí “clase de las edades”. Tenemos finalizado el histograma de frecuencias.
  • 25. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 26 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 30. Histograma completo.
  • 26. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 27 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 4.1 Una aplicación de medidas descriptivas. Una sociedad de Ingenieros consultores, decidió adquirir un nuevo Odómetro para tomar mediciones de larga distancia, la decisión de hacer esta inversión fue necesaria dado que el que tienen actualmente ya tiene 6 años de antigüedad y las últimas muestras de medición a un cierto punto que se han hecho con tal instrumento, han tenido diferencias notorias. La medición que la empresa entrega entre dos puntos es el promedio de las mediciones hechas en tres días distintos y a distintas horas del día, esto para no tener sesgo por factores como clima, luminosidad o interrupciones externas. El nuevo instrumento es tecnológicamente más avanzado y de mayor precisión (menor margen de error,+/- 0,5% ), según lo que asegura la compañía que lo vendió. La empresa además de empezar a utilizar el nuevo odómetro, sigue utilizando el antiguo, dado la gran demanda de proyectos en los cuales sus servicios de medición han sido contratados. Los ingenieros está consciente de la necesita contar con dos de estos instrumentos pero quieren tener alguna evidencia de que las mediciones tomadas por el antiguo odómetro son realmente más inexactas con respecto a su media, que las mediciones tomadas por el nuevo. Para esto los ingenieros deciden, ya conociendo una distancia entre dos puntos de 61,5 metros, tomar dos muestras donde se harán 10 mediciones de esta distancia conocida, (10 días distintos), cada una con los dos odómetros respectivamente (en metros), con las que calcularan medidas descriptivas, principalmente para comparar medidas de tendencia central y de dispersión. Los resultados de estos cálculos ayudaran a tomar la decisión de desechar o seguir utilizando el antiguo odómetro Las medidas obtenidas se encuentran en el archivo “medidas_odometro.xlsx 3 ” , abriendo el archivo , tenemos: 3 Base de datos disponible en la página web del Departamento de Matemática y Física.
  • 27. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 28 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 31. Base de datos “medidas_odometro.xlsx”. Para los cálculos de las medidas de tendencia central, utilizaremos la herramienta de análisis de datos “Estadísticas descriptivas. En el menú principal, elegimos la opción “datos”, luego “Análisis de datos”, y “Estadística descriptiva Figura 32. Opción Estadística Descriptiva.
  • 28. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 29 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Calculamos primero las estadísticas descriptivas de las mediciones hechas con el odómetro antiguo, en el rango de entrada marcamos el rango donde están las medidas que se tomaron con el odómetro antiguo, de la B2 a la B11, y en el rango de salida la celda F1, desde esa celda se desplegarán, los resultados y ACEPTAR Figura 33. Ingreso de datos.
  • 29. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 30 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Hacemos doble “click” entre las columna F y G, para ajustar el tamaño de la columna F al contenido. Tenemos entonces: Figura 34. Desciptivos de Odómetro Antiguo. El mismo procedimiento hacemos ahora para obtener las estadísticas descriptivas de las medidas tomadas con el odómetro Nuevo, los ubicamos a partir de la celda I1 para poder tener una mirada conjunta de los cálculos obtenidos, tenemos entonces: Figura 35. Comparación de descriptivos de odómetros (Antiguo y Nuevo)
  • 30. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 31 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Observado los resultados obtenidos, marcaremos con un color de relleno gris, las estadísticas relevantes Figura 36. Comparación de algunos descriptivos. Con respecto a las medias obtenidas, tenemos entre ellas una diferencia de 0,425 metros, es decir 42, 5 cm, puede ser bastante dependiendo del contexto de la medición, y lo más importante que en relación al valor exacto, el odómetro nuevo, entrega una media más cercana a la medida real que es 61,5. Con respecto a la desviación estándar obtenida, claramente las medidas tomadas por el odómetro antiguo, presentan una mayor dispersión entre ellas, esto puede generar una mayor diferencia entre los promedios finales cuando se tomen sólo tres medidas. Otro dato importante acá es el Rango, indicador también de dispersión de los datos, el rango que se dan en las medidas tomadas por el odómetro antiguo es un metro superior con respecto a lo que presentan las medidas tomadas por el odómetro nuevo. Si observamos también el coeficiente de asimetría, nos podemos dar cuenta de que las mediciones tomadas con el odómetro nuevo presentan una marcada asimetría negativa, esto quiere decir que los tatos en su mayoría, se presentan superiores al promedio Figura 37. Comparación de coeficientes de asimetría.
  • 31. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 32 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Ahora obtendremos los histogramas de frecuencias para visualizar mejor el comportamiento de los datos. Usando la misma herramienta “Datos”, “Análisis de Datos” , “Histograma” Figura 38. Confección de histogramas. Para las medidas tomadas con el odómetro antiguo, el rango de entrada es desde la celda B2 a la B11, y el rango de salida desde la celda F17, ACEPTAR Figura 39. Ingreso de datos. Excel para confeccionar el histograma de frecuencias, genera intervalos para agrupar las frecuencias, en este caso generó cuatro intervalos, donde las marcas de clases se muestran a partir de la celda que indicamos
  • 32. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 33 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física para la salida. Figura 40. Salida de histograma 1. Como las variables son continuas, corresponde ajustar el histograma con intervalos continuos, nos posesionamos sobre las barras y haciendo clic con el botón derecho elegimos la opción “Dar formato a la serie de datos”.
  • 33. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 34 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 41. Formato de serie de datos. Y luego indicamos un 0% en el ancho del intervalo Figura 42. Modificación del ancho del histograma. Con la misma opción “Formato serie de datos”, ahora elegimos “Relleno y Líneas”, marcamos “línea sólida”, color negro, para visualizar mejor las barras en el histograma
  • 34. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 35 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 43. Resultado de la modificación del ancho del histograma. En la gráfica se visualiza la asimetría negativa que daba el coeficiente de asimetría,-0,6527, mayores frecuencias sobre el promedio. Ahora repetimos los pasos anteriores para obtener el histograma de frecuencias para las medidas tomadas con el odómetro nuevo Nos queda:
  • 35. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 36 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 44. Comparación de Histogramas de Odómetros. La gráfica aquí se visualiza más simétrica con respecto al su promedio, y se corrobora con el coeficiente de asimetría obtenido que es de 0,3266, que en este caso sería una leve asimetría positiva. Con la información obtenida se puede concluir que de acuerdo a la diferencia que se presenta en el promedio calculado por el odómetro antiguo respecto de la verdadera distancia y además respecto del promedio más preciso entregado por el odómetro nuevo, más la mayor dispersión indicada tanto por la desviación estándar, como por el rango de los datos de las mediciones obtenidas también por el odómetro antiguo y la marcada asimetría negativa que se genera en la distribución de estos, se debería dar de baja el odómetro antiguo y comprar otro nuevo.
  • 36. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 37 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 4.2 EJERCICIOS PROPUESTOS, TEMA: TABLAS DE FRECUENCIAS, ESTADÍSTICA DESCRIPTIVA E HISTOGRAMA 1. Considere la base de datos “Examenes.xlsx” 4 la cual contiene información sobre el número de preguntas que se realizaron en 17 exámenes de distintas disciplinas y la cantidad de alumnos que rindieron el respectivo examen en cierta universidad. Confecciones una tabla de frecuencias para la variable Exámenes . Ingrese el archivo Excel generado en el buzón habilitado en la plataforma del laboratorio. 2. Considere la base de datos “Examenes.xlsx” la cual contiene información sobre el número de preguntas que se realizaron en 17 exámenes de distintas disciplinas y la cantidad de alumnos que rindieron el respectivo examen en cierta universidad. Realice un resumen de descriptivos para la variable Exámenes. Ingrese el archivo Excel generado en el buzón habilitado en la plataforma del laboratorio. Preguntas independientes: a. Indique el valor de la media. b. Indique el valor de la moda. c. Determine el valor de la desviación estándar (corregida) d. Determine el coeficiente de variación. e. Determine los cuartiles de la distribución de los datos. f. Determine el rango intercuartil. 3. Considere la base de datos “Examenes.xlsx” la cual contiene información sobre el número de preguntas que se realizaron en 17 exámenes de distintas disciplinas y la cantidad de alumnos que rindieron el respectivo examen en cierta universidad. Realice un histograma para la variable Exámenes. Ingrese el archivo Excel generado en el buzón habilitado en la plataforma del laboratorio. 4. Considere la base de datos “Examenes.xlsx” la cual contiene información sobre el número de preguntas que se realizaron en 17 exámenes de distintas disciplinas y la cantidad de alumnos que rindieron el respectivo examen en cierta universidad. Confecciones una tabla de frecuencias para la variable alumnos. Ingrese el archivo Excel generado en el buzón habilitado en la plataforma del laboratorio. 4 Base de datos disponible en la página web del Departamento de Matemática y Física.
  • 37. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 38 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 5. Considere la base de datos “Examenes.xlsx 5 ” la cual contiene información sobre el número de preguntas que se realizaron en 17 exámenes de distintas disciplinas y la cantidad de alumnos que rindieron el respectivo examen en cierta universidad. Realice un resumen de descriptivos para la variable alumnos. Ingrese el archivo Excel generado en el buzón habilitado en la plataforma del laboratorio. Preguntas independientes: a. Indique el valor de la mediana. b. Indique el valor del coeficiente de asimetría. c. Determine el valor de la desviación estándar (corregida) d. Determine el coeficiente de variación. e. Determine los cuartiles de la distribución de los datos. f. Determine el rango intercuartil. 6. Considere la base de datos “Examenes.xlsx” la cual contiene información sobre el número de preguntas que se realizaron en 17 exámenes de distintas disciplinas y la cantidad de alumnos que rindieron el respectivo examen en cierta universidad. Realice un histograma para la variable alumnos. Ingrese el archivo Excel generado en el buzón habilitado en la plataforma del laboratorio. 5 Base de datos disponible en la página web del Departamento de Matemática y Física.
  • 38. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 39 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 5. Tablas de contingencia El objetivo de este video es mostrar la forma de construir una tabla de contingencia a partir de una tabla bivariada para dos variables cualitativas y que posteriormente servirá de base para la construcción de una tabla de contingencia. Recordemos que una tabla bivariada es aquella que resume las frecuencias absolutas conjuntas y marginales, a partir de ellas se pueden obtener medidas de estadísticos marginales y condicionales, además la tabla de contingencia resume la misma información pero en términos de probabilidades. Abriremos el archivo “Ejemplo tabla contingencia”, que contiene la base de datos que utilizaremos, esta base contiene dos variables que son: el “sexo” y el “nivel de estudios” de 20 personas. Lo primero que haremos es construir la tabla bivariada, para estos utilizaremos una Tabla dinámica. Tomando posición en cualquiera de las celdas donde se encuentran los datos, seleccionamos del menú la opción insertar y posteriormente la opción Tablas dinámicas, (primera opción que aparece en el menú). Figura 45. Base de datos “Ejemplo tabla contingencia.xlsx6 ” Aparecerá el siguiente cuadro: 6 Base de datos disponible en la página web del Departamento de Matemática y Física.
  • 39. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 40 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 46. Ingreso de matriz de datos. Al habernos posicionado en una celda de los datos Excel toma por defecto los datos adyacentes que no tienen celdas vacías y es lo que muestra marcado con las líneas punteadas y que además aparece como rango de entrada en el recuadro. Cuando se trabaja con este tipo de tablas la base de datos no puede tener celdas vacías. En este recuadro también se solicita que se elija dónde queremos que esté la tabla, aquí seleccionaremos una celda adyacente a los datos, a veces por orden los más conveniente será una nueva hoja. Seleccionamos aceptar y se crea automáticamente la tabla dinámica, pero vacía
  • 40. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 41 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 47. Pantalla de campos de tabla dinámica. Excel muestra a la derecha las opciones de la tabla dinámica, agrega automáticamente los campos que identificó de la base de datos, que son justamente los nombres de los rótulos de cada variables. La tabla dinámica espera que le indiquemos cuales de estos campos incluiremos en ella. Como queremos construir una tabla bivariada debemos incluir las dos variables, dejando una de ellas asociada a área de las filas y la otra al área de las columnas. Seleccionamos entonces ambas variables, por defecto la tabla dinámica las deja automáticamente asociadas a las columnas, pero sólo dejamos ahí la variable “Nivel de Estudios” y arrastramos la variable “Sexo”, hacia el área de las filas. Figura 48. Ingreso de variables en filas y columnas. Para que aparezcan el conteo de los datos debemos arrastrar nuevamente cualquiera de los dos campos a la casilla “Valores”, para este ejemplo arrastraremos el campo Sexo.
  • 41. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 42 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 49. Tabla dinámica final. En esta tabla de doble entrada podemos observar las frecuencias conjuntas absolutas y marginales. Por ejemplo tenemos que 6 mujeres tienen un nivel de estudios Medio, también del total de las personas 10 son hombres y 10 son mujeres. Ahora llevaremos esta tabla en términos de probabilidades, que es la tabla de contingencia. Posicionándonos sobre la tabla dinámica construida, hacemos “click” sobre el botón derecho y elegimos la opción, “Mostrar valores como” y luego % del total general.
  • 42. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 43 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 50. Modificación de valores en tabla dinámica. La tabla queda ahora mostrando las frecuencias porcentuales conjuntas y marginales Figura 51. Valores como porcentajes en tabla dinámica. Finalmente posicionados nuevamente sobre la tabla, hacemos “click” con el botón derecho del Mouse y elegimos la opción “Formato del número” y luego “número” y dos decimales.
  • 43. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 44 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 52. Modificación de valores a probabilidades. La tabla queda ahora mostrando las probabilidades de ocurrencia condicionales y marginales. Figura 53. Valores como probabilidades en tabla dinámica. Ahora esta tabla de contingencia contiene las probabilidades conjuntas y marginales calculadas a partir de las frecuencias conjuntas y marginales que teníamos en la tabla bivariada.
  • 44. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 45 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 54. Interpretación de algunos valores en tabla dinámica.
  • 45. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 46 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 5.1 ESQUEMA RESUMEN DE CONSTRUCCIÓN DE TABLA DE CONTINGENCIA El objetivo de este video es mostrar la forma de construir una tabla de contingencia con la función Tabla dinámica Abriremos el archivo “Ejemplo tabla contingencia”, que contiene la base de datos que utilizaremos. Esta base contiene dos variables que son: “género” y “nivel de estudios” de 20 personas. 1. Ir a la opción “Insertar”, en la parte superior de la planilla Excel que contiene los datos a trabajar. 2. Seleccionar la opción “Tabla dinámica”. 3. Ingresar los datos en la opción “Tabla o rango”. 4. Por defecto las opciones de la tabla dinámica aparecerán en la hoja de trabajo actual, pero es posible indicar que aparezcan en una hoja nueva. 5. Hacer “click” en “Aceptar” 6. En el recuadro “Seleccionar campos para agregar al informe” desplazamos el campo “nivel de estudio” hasta el recuadro “Etiqueta de fila” y el campo “sexo” hasta el recuadro “Etiqueta de columna”. Finalmente desplazar cualquiera de los campos hasta el recuadro “Valores” 7. Luego, en el recuadro “valores” hacer “click” sobre la opción por defecto “Suma de N°caraDado”, y seleccionar la opción “configuración de campo de valores”. 8. Cambiar la opción “Suma” por la opción “Cuenta”. 9. Hacer “click” en “Aceptar”. Ejemplos de lectura de la tabla: En el estudio participaron 10 hombres y 10 mujeres. 4 individuos tienen un nivel de estudio “Básico” 3 individuos en el estudio son de sexo “masculino” y tiene un nivel de estudio “Medio”
  • 46. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 47 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 6. Probabilidades y Teorema de Bayes El objetivo de este video es estudiar la obtención de probabilidades condicionales y a través del el teorema de Bayes. Ya en el video 3, se estudió el cálculo de probabilidades simples, obtenidas las frecuencias marginales de una tabla de contingencia. Recordemos también que la tabla de contingencia fue construida con una tabla dinámica. Rescatando la tabla de contingencia construida en el video 3, ahora la utilizaremos para obtener probabilidades condicionales y aplicar el teorema de Bayes. Las variables asociadas son “sexo” y “nivel de estudios” de 20 personas, construiremos el diagrama de árbol para mostrar las probabilidades conjuntas y condicionales. Lo primero que haremos es escribir las probabilidades conjuntas como la probabilidad de la intersección de los eventos
  • 47. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 48 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 55. Definición de eventos asociados a las variables de estudio. Ahora utilizando la herramienta para escribir formulas, escribiremos las probabilidades conjuntas en términos de la intersección de los eventos.
  • 48. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 49 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 56. Opción ingreso de ecuación en planilla Excel. Entonces: La probabilidad de que la persona tenga educación básica y sea de género femenino es igual a 0,1 La probabilidad de que la persona tenga educación media sea de género femenino es igual a 0,3 La probabilidad de que la persona tenga educación superior y sea de género femenino es igual a 0,1 De igual forma: La probabilidad de que la persona tenga educación básica y sea de género masculino es igual a 0,1 La probabilidad de que la persona tenga educación media y sea de género masculino es igual a 0,15 La probabilidad de que la persona tenga educación superior y sea de género masculino es igual a 0,25
  • 49. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 50 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 57. Ingreso de probabilidades con editor de ecuaciones. Observemos que la suma de todas las probabilidades conjuntas es 1. Comenzamos ahora a confeccionar el diagrama de árbol para representar las probabilidades condicionales. Escribimos en una misma columna pero con separación de seis celdas, el recorrido de la variable sexo, es decir Femenino y Masculino, y en la celda de abajo colocamos las probabilidades totales correspondientes, y centramos el contenido de las celdas.
  • 50. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 51 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 58. Formato para ingreso de diagrama de árbol. En la siguiente columna y celda por medio, colocamos los tipos de educación definidos en los eventos, estos son EB, EM, ES, y los alineamos estos a la derecha. Figura 59. Ingreso de probabilidades en para árbol de probabilidad.
  • 51. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 52 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Para dibujar las flechas del diagrama de árbol, usando del menú principal la opción “Insertar “y luego elegimos la opción “formas”, y el icono de la flecha Figura 60. Ingreso de “ramas” del árbol de probabilidad. Dibujamos tres flechas para hacer el diagrama. Figura 61. Árbol de probabilidades.
  • 52. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 53 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Una vez dibujadas las flechas, colocaremos en la columna siguiente, las probabilidades condicionales asociada a cada evento, debemos recordar que cuando dos eventos son independientes se cumple que la probabilidad de la intersección de ellos es igual a la multiplicación de las probabilidades de cada evento. Dejando una columna de separación y nuevamente haciendo uso de la herramienta para escribir ecuaciones, expresamos y obtenemos las probabilidades condicionales que corresponden a cada rama del diagrama de árbol según la propiedad vista en clases. Hacemos “click” en Insertar y luego ecuación, arrastramos el cuadro hasta la celda contigua a la primera rama del árbol, y escribimos “La probabilidad de que la persona tenga educación básica dado que es de género femenino es igual a la probabilidad de que tenga educación básica y sea de género femenino dividido por la probabilidad de que la persona sea de género femenino, esto es 0,1 dividido por 0,5, igual a 0,2”. Conviene copiar las fórmulas y solo cambiar los eventos correspondientes. Con el botón derecho hacemos “click” en copiar y luego pegamos frente a la segunda rama del árbol y así sucesivamente. Ahora modificamos cada formula quedando: La probabilidad de que la persona tenga educación media dado que es de género femenino es igual a la probabilidad de que tenga educación media y sea de género femenino dividido por la probabilidad de que la persona sea de género femenino, esto es 0,3 dividido por 0,5, igual a 0,6 Para la tercera rama: La probabilidad de que la persona tenga educación superior dado que es de género femenino es igual a la probabilidad de que tenga educación superior y sea de género femenino dividido por la probabilidad de que la persona sea de género femenino, esto es 0,1 dividido por 0,5, igual a 0,2 De igual forma para la cuarta rama: La probabilidad de que la persona tenga educación básica dado que es de género masculino es igual a la probabilidad de que tenga educación básica y sea de género masculino dividido por la probabilidad de que la persona sea de género masculino, esto es 0,1 dividido por 0,5, igual a 0,2 Para la quinta rama: La probabilidad de que la persona tenga educación media dado que es de género masculino es igual a la probabilidad de que tenga educación media y sea de género masculino dividido por la probabilidad de que la persona sea de género masculino, esto es 0,15 dividido por 0,5, igual a 0,3 Y para la sexta rama: La probabilidad de que la persona tenga educación superior dado que es de género masculino es igual a la probabilidad de que tenga educación superior y sea de género masculino dividido por la probabilidad de que la persona sea de género masculino, esto es 0,25 dividido por 0,5, igual a 0,5
  • 53. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 54 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 62. Ejemplos de cálculo de probabilidad condicional. Observemos acá que la suma de las probabilidades condicionales de los niveles de educación dado los géneros Femenino y Masculino indistintamente, también suman uno. Entonces podemos decir por ejemplo que: La probabilidad de que una persona tenga un nivel de educación medio, dado que es de sexo femenino es de un 60% La probabilidad de que una persona tenga nivel de educación superior dado que es de sexo masculino es de un 50%. Veamos que pasa ahora si queremos responder a la pregunta: ¿Cuál es la probabilidad de que una persona sea mujer sabiendo que su nivel de educación es Básico? La respuesta nos las da el teorema de Bayes. Para poder calcular esta probabilidad necesitamos conocer la probabilidad total de tener Educación básica, y esta es :
  • 54. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 55 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física “P de EB, educación básica, es igual a P de EB inter F(femenino), más P de EB y M(masculino) y esto de acuerdo a la propiedad de la probabilidad condicional, es igual a “P de F por P de EB dado F”, más “P de M por P de EB dado F” Una vez más utilizando la herramienta para escribir ecuaciones, escribiremos la probabilidad que deseamos obtener Elegimos insertar, ecuación y arrastramos la ecuación para responder la pregunta Escribimos, probabilidad de que una persona sea de género femenino, sabiendo que tiene educación básica es igual, seleccionamos en el menú superior herramientas de ecuaciones y luego fracción, en el numerador colocamos la probabilidad conjunta “P de F inter EB, educación básica y en el denominador “P de ED, educación básica”, que es la probabilidad de lo que está dado o conocido. Y es igual a la probabilidad de que la persona sea de género femenino por la probabilidad de que tenga estudios básicos sabiendo que es de género femenino, dividido por la probabilidad total de tener estudios básicos. Figura 63. Ejemplo de aplicación del teorema de Bayes.
  • 55. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 56 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 6.1 ESQUEMA RESUMEN CON PROBLEMAS DE PROBABILIDADES Y TEOREMA DE BAYES En este video practicaremos el cálculo de probabilidad y el teorema de Bayes en base a la tabla de contingencia creada en el video de Tablas de contingencia. Primero, adaptaremos la tabla de contingencia a una tabla de probabilidades, para esto marcamos el recuadro de la tabla dinámica y hacemos “click” con el botón derecho. De la lista de opciones seleccionamos “Mostrar valores como” y elegimos “% del total general”, luego seleccionamos solo el área de la tabla dinámica donde hay porcentajes y hacemos “click” con el botón derecho, seleccionamos la opción “Formato de número” y luego elegimos “número” con esto logramos que nuestra tabla de contingencia ahora sea una tabla de probabilidades. Resolución de los problemas propuestos: 1. ¿Cuál es la probabilidad de que al seleccionar un individuo al azar este tenga un nivel de estudio Básico? Esta pregunta es una probabilidad marginal, la obtenemos directamente de la tabla de probabilidades, específicamente en el total fila del nivel de estudio básico. 2. ¿Cuál es la probabilidad de que al seleccionar un individuo al azar este sea hombre y tenga nivel de estudio Superior? Esta pregunta es una probabilidad conjunta, la obtenemos directamente de la tabla de probabilidades, específicamente en la intersección de “Hombre” y “Superior”. 3. Si se sabe que un individuo seleccionado al azar es mujer. ¿Cuál es la probabilidad de que tenga un nivel de estudio Medio? Esta pregunta está condicionada, se sabe que el individuo es mujer y lo que se pregunta es por la probabilidad que tenga nivel de estudio Medio. Para resolverlo dividimos la probabilidad conjunta de Mujer y nivel de estudio Medio, entre la probabilidad de que el individuo sea mujer.
  • 56. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 57 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 4. Si se sabe que un individuo seleccionado al azar tiene un nivel de estudio Medio, ¿Cuál es la probabilidad que sea Mujer? Indicación: debe utilizar el resultado de la pregunta anterior Esta pregunta puede ser resuelta igual que la pregunta anterior, pero utilizaremos el teorema de Bayes tal como pide la indicación. Por lo que, multiplicaremos la probabilidad obtenida en la pregunta anterior por la probabilidad de que el individuo sea mujer, esto nos da la probabilidad conjunta de Mujer y nivel de estudio medio, luego, lo dividimos por la probabilidad de que el individuo tenga un nivel de estudio Medio
  • 57. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 58 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 6.2 EJERCICIOS PROPUESTOS, TEMA: TABLA DE CONTINGENCIA, PROBABILIDADES Y TEOREMA DE BAYES 1. Considere la base de datos Favoritos.xlsx 7 la cual contiene información sobre 23 personas a las cuales se les consultó respecto a color y mascota favoritos. Con los datos confecciones una tabla de contingencia utilizando la función Tabla dinámica, luego ingrese el documento en el buzón habilitado en la plataforma de laboratorio. 2. Considere la base de datos Favoritos.xlsx la cual contiene información sobre 23 personas a las cuales se les consultó respecto a color y mascota favoritos. Con los datos confeccione una tabla de probabilidades, luego ingrese el documento en el buzón habilitado en la plataforma de laboratorio. Preguntas independientes en base a los datos Favoritos.xlsx: 3. ¿Cuál es la probabilidad que un individuo seleccionado al azar le guste el color rojo y su mascota preferida sea un perro? 4. ¿Cuál es la probabilidad que un individuo seleccionado al azar le guste el color morado y su mascota preferida sea un hámster? 5. ¿Cuál es la probabilidad que un individuo seleccionado al azar le guste el color negro? 6. ¿Cuál es la probabilidad que un individuo seleccionado al azar su mascota preferida sea un conejo? 7. Si se sabe que a una persona seleccionada al azar le gusta el color amarillo. ¿Cuál es la probabilidad de que su mascota favorita sea un hámster? 8. Si se sabe que a una persona seleccionada al azar le gusta el color azul. ¿Cuál es la probabilidad de que su mascota favorita sea un gato? 9. Si se sabe que una persona seleccionada al azar su animal favorito es un conejo . ¿Cuál es la probabilidad de que su color favorito sea negro? 7 Base de datos disponible en la página web del Departamento de Matemática y Física.
  • 58. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 59 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física El caso es el siguiente: Una Empresa minera adquirió instaló hace una un año una estación de monitoreo para medir la concentración de material particulado en el aire, esta estación está programada para tomar mediciones cada 8 hora y en caso de que la medición detecte que los niveles de polución superan los 150 µg/m³ (PM10), la alarma se activará automáticamente. De sonar la alarma, la empresa debe parar la faena hasta lograr bajar los niveles de polución bajo el nivel máximo permitido, de lo contrario se venir una inspección en ese momento, la empresa será multada. Ya con un año de funcionamiento, la empresa minera ha detectado errores en el funcionamiento de la estación de monitoreo, pero no tiene presupuestado la renovación de esta, por el alto costo de inversión. Por lo anterior la empresa pide al departamento de prevención de riesgos que de acuerdo a los registros de las mediciones tomadas por dicha estación en relación al funcionamiento de la alarma en los últimos 6 meses, determine por una parte 1. ¿Cuál es la probabilidad de que la empresa sea multada? 2. ¿Cuál es la probabilidad de la empresa detenga sus faenas sin haber sido necesario? 3. ¿Cuál es la probabilidad de que los trabajadores estén respirando aire con mucha polución sin tener alerta ninguna? 4. ¿Cuál es la probabilidad de que la medida de parar las faenas esté bien aplicada, después de que se activa la alarma? La información antes pedida servirá como evidencia para tomar la decisión de quedarse con esta estación de monitoreo o adquirir otra. Para dar respuesta a los requerimientos de la gerencia se pueden obtener por una parte, preguntas 1 y 2, calculando una probabilidad condicional y por otra parte, preguntas 3 y 4, utilizando el teorema de Bayes. Veamos como: Abrimos el archivo que contiene la base de datos Monitoreo_polucion.xlsx 8 Observamos que tenemos cuatro campos de información, que son, la Fecha, la hora, el nivel de polución y el registro de si activó o no la alarma. Para generar la tabla de contingencia no es adecuado usar la variable cuantitativa Nivel de polución dado que se hará el conteo según categorías y estas no existen, por lo que será conveniente antes categorizarlas. Recordemos que la empresa tiene establecido como norma, que los niveles de polución P10, no pueden sobrepasar los 150 µg/m³, entonces de acuerdo a esto categorizaremos. 8 Base de datos disponible en la página web del Departamento de Matemática y Física.
  • 59. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 60 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Para esto utilizaremos la función SI, insertamos una nueva columna adyacente a la que tiene los registros del Nivel de Polución Figura 64. Categorización de la variable Nivel de polución. La nueva variable la llamaremos “Condición del Nivel de Polución”, que tendrá como recorrido P: si el nivel de polución cumple con la norma establecida, <=150 µg/m³ NP: Si el nivel de polución supera la norma establecida, es decir >150 µg/m³ Escribimos el nombre al inicio de la columna
  • 60. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 61 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 65. Ingreso de columna adyacente para la categorización. Posicionados en la celda B2, insertamos la función lógica SI, esta función permitirá categorizar la variable numérica, asociando la categoría P o NP, según corresponda Figura 66. Uso de función lógica =SI().
  • 61. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 62 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física La función SI, requiere de ingresar la prueba lógica, y la asignación que se hará en caso de que la evaluación sea verdadera o falsa Figura 67. Ingreso de variable a categorizar. En nuestro ejemplo la prueba lógica es evaluar si cada dato de la variable nivel de polución cumple con la norma establecida por la empresa, luego escribiremos Figura 68. Ingreso de valores “Verdadero” y “Falso”.
  • 62. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 63 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Hacemos clic en aceptar y nos queda para la primera celda asociado “P”, permitido cuando la medición fue 127. Posicionados en la esquina inferior derecha de la celda evaluada, arrastramos el mouse para copiar en el resto de las celdas Figura 69. Extensión de función SI al resto de la columna adyacente.
  • 63. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 64 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física La base de datos ahora se presenta Figura 70. Base de datos luego del ingreso de variable categorizada. Ya estamos listos para crear la tabla de contingencia que finalmente nos permitirá obtener las probabilidades condicionales. En la tabla de contingencia estarán resumidas las frecuencias de las variables Condición del nivel de polución (Permitido/ No Permitido) Activación de la alarma ( SI / NO) Posicionados en la primera celda de nuestra base de datos, insertamos la tabla dinámica, recordemos que este procedimiento ya fue estudiado en el video 3 , de construcción de tablas de contingencia.
  • 64. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 65 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 71. Confección de tabla dinámica para el problema. Quedó seleccionado el rango que contempla nuestra base de datos, y le indicamos que la tabla dinámica quede en la misma hoja donde están los datos, dando como referencia la celda G2 Figura 72. Ingreso de celda para salida de opciones de tabla dinámica.
  • 65. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 66 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Se crea la tabla dinámica Figura 73. Opciones de tabla dinámica. Marcamos los campos “Condición del nivel de polución “y “Activación de la Alarma” Figura 74. Ingreso de variables en fila y columna. Arrastramos el campo activación de la alarma hacia las columnas y luego para completar la tabla con los valores resumidos, debemos arrastrar cualquiera de los campos incluidos en la tabla hacia el recuadro Valores. Aparece ahora completa la tabla bivariada con las frecuencias conjuntas, marginales y totales.
  • 66. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 67 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 75. Tabla dinámica para el problema. Ahora a partir de la tabla bivariada generaremos la tabla de contingencia Posicionados sobre alguna frecuencia conjunta de la tabla bivariada, hacemos “click” con el botón derecho y elegimos la opción “mostrar valores como” y luego “porcentaje del total general” Figura 76. Modificación de valores de tabla dinámica. La tabla se muestra ahora con porcentajes del total, nuevamente hacemos “click” con el boton derecho para elegir la opción formato número
  • 67. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 68 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 77. Valores de tabla dinámica en porcentajes. Y luego “número“, dos decimales y ACEPTAR. Figura 78. Modificación de valores de porcentaje a probabilidades. Automaticamente aparece la tabla de contingencia.
  • 68. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 69 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 79. Valores de tabla dinámica en probabilidades. Lo primero que haremos es escribir las probabilidades conjuntas como la probabilidad de la intersección de los eventos y las probabilidades totales Nuestros eventos son: NP: Nivel de Polución no permitido P : Nivel de Polución Permitido NO : No se activa la alarma SI : Se activa la alarma Probabilidades conjuntas Probabilidades Totales P( ) P( ) 81 P( ) ( ) ( ) ( ) ( ) ( )
  • 69. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 70 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 80. Cálculo de probabilidades conjuntas y marginales (totales). Antes de calcular las probabilidades pedidas, contruiremos el arbol de las probabilidades condicionales que nos permitirán aplicar el teorema de bayes. Partiremos el árbol con la variable “Nivel de Polución”, dado que es natural entender que la alarma sonará dependiendo del nivel de polución que haya en la faena. Confeccionamos el árbol, utilizando herramientas de dibujo e insertando las fórmulas correspondientes. Figura 81. Ingreso de árboles de probabilidad. Para responder a las pregunta de la gerencia, antes debemos plantear las probabilidades que darán las respuesta.
  • 70. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 71 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 1. ¿Cuál es la probabilidad de que la empresa sea multada? Debemos entender que la empresa será multada sólo si los trabajadores siguen trabajando con niveles de polución no permitidos, y esto ocurrirá si en ese momento no suena la alarma. Entonces debemos calcular la probabilidad condicional de que no suene la alarma, sabiendo que hay niveles de polución no permitido. ( ) ( ) ( ) Luego existe un 70% de probabilidad de que la empresa sea multada Contestemos ahora la segunda pregunta: 2. ¿cuál es la probabilidad de la empresa detenga sus faenas sin haber sido necesario? Para responder a esta pregunta debemos entender que debemos calcular la probabilidad de suene la alarma sabiendo que los niveles de polución están dentro de las normas permitidas. ( ) ( ) ( ) ( ) La probabilidad de que la empresa detenga sus faenas sin haber sido necesario es de un 10% Para completar el árbol con las otras probabilidades condicionales, las calcularemos ( ) ( ) ( ) ( ) ( ) ( )
  • 71. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 72 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 82. Cálculo de probabilidades condicionales. Respondamos ahora la tercera y cuarta pregunta 3.- ¿Cual es la probabilidad de que los trabajadores estén respirando aire con mucha polución sin tener alerta ninguna? ( ) Al plantear la probabilidad nos damos cuenta que es a priori, es decir según lo planteado en el diagrama de árbol, necesitamos saber cuál es la probabilidad de que suene la alarma sabiendo que no ha sonado la alarma. Utilizando el teorema de Bayes ( ) ( ) ( ) ( ) ( ) ( ) ( ) La probabilidad de que los trabajadores estén respirando un aire con nivel de polución no permitida, sin que haya sonado la alarma es de un 8%
  • 72. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 73 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 83. Lectura de “ramas” en árbol de probabilidad. El mismo cálculo nos resulta, aplicando las probabilidad conjunta y marginal, de acuerdo a la información que tenemos en la tabla de contingencia ( ) ( ) ( ) La probabilidad de que los trabajadores estén respirando niveles de polución no permitidos, sabiendo que la alarma no se ha activado es de un 8% Finalmente respondemos a la última pregunta: 4.-¿Cuál es la probabilidad de que la medida de parar las faenas esté bien aplicada, después de que se activa la alarma? Aquí debemos calcular la probabilidad de que realmente los niveles de polución son altos cuando sabemos que ha sonado la alarma, es decir ( ) Esta probabilidad según nuestro diagrama de árbol, también es a priori, por lo que debemos aplicar el teorema de Bayes ( ) ( ) ( ) ( ) ( ) ( ) ( )
  • 73. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 74 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 84. Lectura de “ramas” en árbol de probabilidad. El mismo cálculo nos resulta, aplicando las probabilidad conjunta y marginal, de acuerdo a la información que tenemos en la tabla de contingencia ( ) ( ) ( ) La probabilidad de que los niveles de polución realmente no estén dentro de la norma permitida, sabiendo que la alarma se ha activado es de un 25% Conclusión: De acuerdo a las probabilidades obtenidas, por una parte en relación a la empresa, la alta probabilidad de ser multados 70%, aun cuando el riesgo tener pérdidas al detener las faenas no siendo necesario sea de un 10%, conjuntamente con un 25% de probabilidad de que los niveles de polución realmente no estén dentro de la norma permitida, sabiendo que la alarma se ha activado , y , en relación a la seguridad de los trabajadores, baja probabilidad, un 8% , de tener niveles de polución no permitidos cuando la alarma no se ha activado, se puede concluir que la sugerencia, para evitar multas y perdidas, considerando que ya existiendo aunque sea un 1% de riesgo para los trabajadores, la empresa debe tomar la decisión de invertir en un nuevo instrumento que alerte con precisión sobre los niveles de polución no permitidos.
  • 74. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 75 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 7. La opción “Generación de números aleatorios” de la herramienta Análisis de datos de MS Excel. Ir a la opción “datos” en la barra superior y seleccionar “Análisis de datos”. De la ventana de opciones seleccionar “Generación de números aleatorios” Figura 85. Opción “Generación de números aleatorios”. Hacer “click” en aceptar. Descripción del menú de la opción generación de números aleatorios: Figura 86. Ventana de opciones de Números aleatorios. 1: número de variables: Corresponde a la cantidad de columnas de datos que queremos generar. En este caso, ingresaremos el valor 1 para así generar una sola columna con datos simulados.
  • 75. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 76 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 2: cantidad de números aleatorios: indica la cantidad de datos por columna que serán simulados. En este caso ingresaremos 100, es decir, por cada columna de datos ingresada en la parte anterior, aparecerán 100 datos asociados. 3: Distribución: Ofrece un conjunto de distribuciones de probabilidad de uso frecuente en estadística. Seleccionaremos “Normal” para este ejemplo. Para más detalle sobre el uso de cada distribución disponible en esta opción, ir al video: “Anexo de distribuciones” 4: Parámetros: Esta opción depende de la distribución seleccionada. Como hemos seleccionado la opción “Normal” dejaremos los valores por defecto de la opción, es decir, el valor 0 para la media y 1 para la desviación estándar. Figura 87. Opción distribución Normal. 5: Iniciar con: Corresponde al valor semilla con el cual se genera la secuencia de números aleatorios, si se ingresa un valor, entonces Excel guardará la misma secuencia de números cada vez que en este campo se ingrese tal número. En este caso, lo dejaremos en blanco. 6: Opciones de salida: Rango de salida: se debe ingresar una celda donde se desea que se inicie la presentación de los resultados del análisis. Es una opción útil si se quiere visualizar el resultado de la generación de números aleatorios en la misma hoja donde se está trabajando. En una hoja nueva: Corresponde a la opción por defecto, el resultado aparecerá en una hoja nueva dentro de la misma planilla de Excel. En un libro nuevo: Los resultado de la simulación de datos aparecerán en un libro nuevo de Excel. En este caso seleccionaremos la opción “Rango de Salida”, luego, seleccionaremos la celda A1.
  • 76. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 77 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 88. Opción distribución Normal del ejemplo.
  • 77. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 78 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 7.1 “Anexo de distribuciones” de la opción “Generación de números aleatorios” de la herramienta Análisis de datos de MS Excel. Revisaremos en esta sección las distintas opciones para generar números aleatorios disponibles en la opción “Análisis de datos”. Figura 89. Lista de distribuciones para simular. La opción “Generación de números aleatorios” permite simular números aleatorios para ocho distribuciones que se describen a continuación:
  • 78. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 79 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 7.1.1 Distribución discreta: Se generan números aleatorios para un conjunto de valores enteros a los cuales se asocia a priori una probabilidad de aparición del valor de la variable. Figura 90. Opción distribución Discreta. Para utilizar esta opción, se debe tener una tabla de probabilidades “a priori” para una variable aleatoria discreta. A modo de ejemplo simularemos el lanzamiento en 100 oportunidades de un dado de seis caras equilibrado. A esta variable se le asocia en la literatura la distribución Uniforme Discreta. Construiremos la Tabla de probabilidades a priori relacionada al problema: X P(X=x) 1 0,16666667 2 0,16666667 3 0,16666667 4 0,16666667 5 0,16666667 6 0,16666667 Tabla 1. Tabla de probabilidad para la aparición de una cara en un dado de 6 caras
  • 79. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 80 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Ingreso de datos en la ventana de opciones: Figura 91. Ingreso de tabla a “priori” en distribución discreta. Hacer ““click”” en Aceptar.
  • 80. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 81 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 7.1.2 Distribución Uniforme: Genera números con igual probabilidad en un intervalo de valores predeterminado. Por defecto los valores aparecen entre 0 y 1, lo cual, es equivalente a la función “=ALEATORIO()”. Figura 92. Opción distribución Uniforme. A modo de ejemplo se simularán 100 valores de la distribución Uniforme entre 0 y 1. Figura 93. Ingreso de valores en opción distribución Uniforme. Hacer ““click”” en Aceptar.
  • 81. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 82 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 7.1.3 Distribución Normal: Simula números aleatorios de una distribución Normal con media y desviación estándar definidas por el usuario. Por defecto el programa proporciona una media 0 y desviación estándar 1, la cual, corresponde a los valores de la distribución Normal Estándar. Figura 94. Opción distribución Normal. A modo de ejemplo se simularán 100 valores de la distribución Normal Estándar. Figura 95. Ingreso de valores en opción distribución Normal. Hacer ““click”” en Aceptar.
  • 82. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 83 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 7.1.4 Distribución de Bernoulli: Genera números aleatorios correspondientes a la distribución de Bernoulli. Es decir, para un experimento aleatorio con dos posibles resultados donde el valor 0 indica “fracaso” y 1 “éxito”. Se debe ingresar la probabilidad de éxito. Figura 96. Opción distribución de Bernoulli. A modo de ejemplo se simularán 100 valores correspondientes al lanzamiento de una moneda honesta, es decir con Probabilidad = 0,5 donde la variable recibe el valor 0 si se obtiene un “sello” y un 1 si se obtiene “cara”. Es decir, la variable de estudio sería: X: número de veces que se obtiene una cara al lanzar una moneda 1 vez. Figura 97. Ingreso de valores en opción distribución de Bernoulli.
  • 83. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 84 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Ingresar en la opción “probabilidad” el valor 0,5. El cuál indica la probabilidad de obtener una cara al lanzar una moneda honesta. Hacer ““click”” en Aceptar. 7.1.5 Distribución Binomial: Genera números aleatorios correspondientes a una distribución Binomial. Es decir, para N experimentos de Bernoulli independientes, con probabilidad de éxito “p”. Figura 98. Opción distribución Binomial A modo de ejemplo se simularán 100 valores correspondientes al lanzamiento de una moneda honesta, es decir probabilidad=0,5 en 5 ocasiones, donde los valores representan el número de caras obtenidas en los 5 lanzamientos. Figura 99. Ingreso de valores en opción distribución Binomial.
  • 84. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 85 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Ingresar en la opción “probabilidad” el valor 0,5. El cuál indica la probabilidad de obtener una cara al lanzar una moneda honesta. En la opción “Número de muestras” ingresar el valor 5, el cual indica la cantidad de veces que se lanza la moneda, es decir, el número de experimentos de Bernoulli independientes. Hacer ““click”” en Aceptar.
  • 85. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 86 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 7.1.6 Distribución Poisson: Genera números aleatorios correspondientes a la distribución de Poisson para un valor esperado de la variable denominada Lambda. Figura 100. Opción distribución de Poisson. A modo de ejemplo, se simularan 100 valores correspondientes a una distribución de Poisson con valor esperado de la variable igual a 2. Esta simulación podría representar, por ejemplo, a una variable aleatoria X: número de hermanos que tiene un alumno del curso de Estadística. Figura 101. Ingreso de valores en opción distribución de Poisson. En la opción “Lambda” ingresar el valor 2, el cual indica el valor esperado de hermanos que tiene un alumno del curso de Estadística. Hacer ““click”” en Aceptar.
  • 86. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 87 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 7.1.7 Frecuencia Relativa: Genera una secuencia predeterminada de valores en un incremento y repeticiones definidas por el usuario. Figura 102. Opción frecuecia relativa. A modo de ejemplo, se simulará una serie de valores entre 1 y 4, con incrementos de 1 unidad donde el número será repetido dos veces y la secuencia en 3 ocasiones. Figura 103. Ingreso de valores en opción frecuencia relativa. Detalle de la función Frecuencia Relativa: Parámetros: indica el rango de valores a generar
  • 87. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 88 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física De: es el mínimo de los valores a generar A: es el máximo valor a generar Incremento: indica la cantidad a incrementar luego de generar el mínimo En este caso se define De: 1 a 4 , incremento 1, es decir, se generarán números del 1 al 4, de 1 en 1. Repitiendo cada número: indica la cantidad de veces que se repetirá un número antes de pasar al siguiente. En este caso ingresamos el valor 2. Repitiendo la secuencia: indica la cantidad de veces que se repite la secuencia de valores, es decir, números de 1 a 4, con incremento 1, repetidos 2 veces. En este caso ingresamos el valor 3. Hacer ““click”” en Aceptar. Observación: En este ejemplo se han simulado tres secuencias de números del 1 al 4 con incremento 1 y repetición 2 veces para cada número. Con un cálculo simple notamos que la cantidad de números a generar serán 24, por lo que no coincidirá con los 100 valores ingresados en la opción “cantidad de números aleatorios”, o sea, si los parámetros ingresados generan una secuencia superior a la “cantidad de números aleatorios” predefinida, la secuencia finalizará en este valor.
  • 88. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 89 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 8. Distribuciones de probabilidad Discreta En esta sección analizaremos algunas opciones disponibles para el cálculo de probabilidad en variables aleatorias discretas. A las funciones asociadas a estos cálculos se puede acceder haciendo ““click”” en el ícono . Figura 104. Opción “Insertar función”. Luego , en la opción “O seleccionar una categoría” elegir “Estadísticas”. En este menú se encuentran disponibles las funciones asociadas al tema a tratar. Figura 105. Función “Estadísticas”. Otra opción es ingresar directamente la función asociada.
  • 89. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 90 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Realizaremos ahora una serie de problemas que involucra el cálculo de probabilidad discreta. Si usted desea replicar estos cálculos, descargue la planilla “Video 6-Ejercicios de variable discreta”. 8.1. Probabilidad con distribución Binomial. Figura 106. Opción probabilidad con distribución Binomial. Ejemplos: Figura 107. Ejemplo cálculo Binomial exacta. Para resolver este problema, realice los siguientes pasos: 1. Seleccionamos la opción asociada a la distribución Binomial 2. Ingresamos el número de éxitos 3. Ingresamos el número de ensayos totales 4. Luego, la probabilidad de éxito asociada al problema 5. Finalmente escribimos la palabra FALSO, la cual indica que deseamos que la probabilidad entregada sea exacta. Figura 108. Ejemplo cálculo Binomial acumulada. 1. Seleccionamos la opción asociada a la distribución Binomial 2. Ingresamos el número de éxitos 3. Ingresamos el número de ensayos totales
  • 90. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 91 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 4. Luego, la probabilidad de éxito asociada al problema 5. Finalmente escribimos la palabra VERDADERO, la cual indica que deseamos que la probabilidad entregada, sea la acumulada hasta el valor ingresado 8.2. Probabilidad con distribución Binomial Inversa. Figura 109. Opción cálculo inversa de probabilidad Binomial. Figura 110. Ejemplo cálculo inversa de probabilidad Binomial. 1. Seleccionamos la opción asociada a la distribución Binomial Inversa 2. Ingresamos el número de ensayos totales 3. Luego, la probabilidad de éxito asociada al problema 4. Finalmente ingresamos la probabilidad acumulada del problema 8.3. Probabilidad con distribución Hipergeométrica. Figura 111. Opción probabilidad con distribución Hipergeométrica.
  • 91. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 92 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 112. Ejemplo cálculo de probabilidad Hipergeométrica exacta. 1. Seleccionamos la opción asociada a la distribución Hipergeométrica 2. Ingresamos el número de éxitos 3. Ingresamos el número de extracciones sin reposición 4. Ingresamos el tamaño de la población de éxitos 5. Luego, el tamaño de la población total, es decir, la suma de fichas azules y rojas 6. Finalmente escribimos la palabra FALSO, la cual indica que deseamos que la probabilidad entregada sea exacta. 8.4. Probabilidad con Distribución de Poisson. Figura 113. Opción probabilidad con distribución de Poisson. Figura 114. Ejemplo cálculo de probabilidad Poisson exacta. 1. Seleccionamos la opción asociada a la distribución de Poisson 2. Ingresamos el número de éxitos 3. Ingresamos el valor promedio asociado a la variable de estudio 4. Finalmente escribimos la palabra FALSO, la cual indica que deseamos que la probabilidad entregada sea exacta.
  • 92. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 93 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 115. Ejemplo cálculo de probabilidad Poisson acumulada. 1. Seleccionamos la opción asociada a la distribución de Poisson 2. Ingresamos el número de éxitos 3. Ingresamos el valor promedio asociado a la variable de estudio 4. Finalmente escribimos la palabra VERDADERO, la cual indica que deseamos que la probabilidad entregada sea la acumulada hasta el valor especificado.
  • 93. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 94 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 8.1 EJERCICIOS PROPUESTOS, TEMA: NÚMEROS ALEATORIOS Y VARIABLE ALEATORIA DISCRETA 1. ¿Cuál es la probabilidad de obtener 3 caras al lanzar una moneda 5 veces? 2. ¿Cuál es la probabilidad de obtener a lo más 3 caras al lanzar una moneda 5 veces? 3. En 7 lanzamientos, ¿Cuál es el número más grande de caras que se puede esperar, con una probabilidad de 0.98? 4. Genera 100 observaciones provenientes de una distribución binomial con probabilidad de éxito 0.4 y n=7. 5. Si X es binomial con probabilidad de éxito 0.4 y n=7. ¿Cuál es la probabilidad de que X sea a lo más 4. Es decir P(X ≤ 4)? 6. Si X es binomial con probabilidad de éxito 0.9 y n=6. ¿Cuál es la probabilidad de que X sea 4. Es decir P(X = 4) ? 7. ¿Qué valor tiene una distribución de Poisson con varianza 6, cuya probabilidad acumulada es 0.92? 8. Genere 100 observaciones provenientes de una distribución de Poisson de parámetro lambda = 6. 9. Calcule la probabilidad de que una variable que tiene distribución Hipergeométrica de parámetros N=9 r=4 y n=3 sea igual a 2. 10. Genere 100 observaciones provenientes de una distribución Poisson con probabilidad de éxito 0.9. 11. Si X es Poisson con media 6. ¿Cuál es la probabilidad de que X sea a lo más 4. Es decir P(X ≤ 4)? 12. Sea X Hipergeométrica(N=20,r=7,n=8). ¿Cuál es la probabilidad de que X sea a lo más 4, es decir, P(X ≤ 4)?
  • 94. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 95 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 9. Distribuciones de probabilidad Continua En esta sección analizaremos algunas opciones disponibles para el cálculo de probabilidad para variables aleatorias continuas. A las funciones asociadas a estos cálculos se puede acceder haciendo ““click”” en el ícono . Figura 116. Opción “Insertar función”. Luego , en la opción “O seleccionar una categoría” elegir “Estadísticas”. En este menú se encuentran disponibles las funciones asociadas al tema a tratar. Figura 117. Función “Estadísticas”.
  • 95. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 96 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Realizaremos ahora una serie de problemas que involucra el cálculo de probabilidad continua. Si usted desea replicar estos cálculos, descargue la planilla “Video 7-Ejercicios de variable continua”. 9.1. Probabilidad con distribución Exponencial. Figura 118. Opción Probabilidad con distribución Exponencial. Figura 119. Ejemplo cálculo de probabilidad Exponencial acumulada. 1. Seleccionamos la opción asociada a la distribución Exponencial. 2. Ingresamos el valor de la variable. 3. Ingresamos el valor del parámetro asociado a la variable de estudio. 4. Finalmente escribimos la palabra VERDADERO, la cual indica que deseamos que la probabilidad entregada sea la acumulada hasta el valor especificado. Nota: Si se ingresa la opción “FALSO” solo entregará la imagen del valor de la variable en la función de densidad exponencial, esto, no es una probabilidad.
  • 96. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 97 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 9.2. Probabilidad con distribución Normal. Figura 120. Opción Probabilidad con distribución Normal. Figura 121. Ejemplo cálculo de probabilidad Exponencial acumulada. 1. Seleccionamos la opción asociada a la distribución Normal 2. Ingresamos el valor de la variable 3. Ingresamos el valor de la media 4. Ingresamos el valor de la desviación estándar 5. Finalmente escribimos la palabra VERDADERO, la cual indica que deseamos que la probabilidad entregada sea la acumulada hasta el valor especificado. 9.3. Distribución Normal Inversa. Figura 122. Opción distribución Normal Inversa.
  • 97. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 98 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 123. Ejemplo uso de función Normal Inversa. 1. Seleccionamos la opción asociada a la distribución Normal Inversa. 2. Ingresamos el valor del percentil, es decir, la probabilidad que acumula bajo él, el valor del contenido del envase de leche desconocido. 3. Ingresamos el valor de la media. 4. Ingresamos el valor de la desviación estándar.
  • 98. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 99 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 9.1 EJERCICIOS PROPUESTOS, TEMA: NÚMEROS ALEATORIOS Y VARIABLE ALEATORIA CONTINUA 1. Si X es una variable aleatoria con distribución Normal de media 3 y varianza 5. Determine la probabilidad de que tal variable sea al menos 3,8. 2. Si X es una variable aleatoria con distribución Normal de media 3 y varianza 5. Determine la probabilidad de que tal variable sea a lo más 4. 3. Sea X una variable aleatoria con distribución Normal de media 100 y desviación estándar 50. Simule 1000 observaciones aleatorias desde X, calcula su promedio y varianza. Compara con los resultados teóricos. 4. Si X es una variable aleatoria con distribución Uniforme, donde 0<x<2. Determine la probabilidad de que tal variable tome valores entre 1 y 1,5. 5. Sea X una distribución Uniforme entre 0 y 1. Simule 1000 observaciones aleatorias desde X, calcula su promedio y varianza. Compara con los resultados teóricos. 6. Sea X una distribución Uniforme entre 0 y 1. Determine la probabilidad de que tal variable tome valores entre 0,2 y 0,3. 7. Sea X una variable aleatoria con distribución Exponencial con valor esperado igual a 0,2. Simule 10 observaciones aleatorias desde X, calcula su promedio y varianza. Compara con los resultados teóricos. Luego repita lo mismo para 100 y 1000 simulaciones. 8. Sea X una variable aleatoria con distribución Exponencial con valor esperado igual a 1. Determine la probabilidad de que la variable aleatoria tome valores de al menos 0,5. 9. Sea X una variable aleatoria con distribución Exponencial con valor Varianza igual a 1/25. Determine la probabilidad de que la variable aleatoria tome valores de al menos 5.
  • 99. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 100 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física 10. Tablas bivariadas continuas y cálculo de probabilidades El objetivo de este video es mostrar la construcción de tablas bivariadas utilizando la herramienta de Excel, tablas dinámicas. En nuestro ejemplo tenemos la fluctuación del dólar y el euro en un mismo mes, las variables con las que trabajaremos son continuas y el interés será poder ver las frecuencias conjuntas en intervalos del mes. Construiremos una tabla bivariada con 4 intervalos, entonces las frecuencias conjuntas resumidas en la tabla mostrará la cantidad de días en que las monedas en conjunto tienen según su valor. Lo primero que haremos es abrir el archivo “datos tabla bivariada”, hacemos ““click”” en “abrir”, archivo Ahora que tenemos los datos, observamos que son 20 datos correspondientes a las variaciones de dólar y euro en 20 días del mes de diciembre de 2014. Posesionándonos en la primera celda de los datos hacemos ““click”” en insertar, tabla dinámica, tal como lo hemos hecho en el video 3 referido a tablas bivariadas para variables cualitativas. La primera columna corresponde al día del mes en que ocurrió la variación, este dato no es variable en estudio, por lo que modificaremos el rango de entrada, incluyendo solo las columnas donde están los valores del dólar y el euro. La tabla la dejaremos en la misma hoja donde están los datos, para esto indicaremos en el rango de salida la celda F1, y aceptamos.
  • 100. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 101 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 124. Ventana de opciones tabla dinámica. Tenemos ahora la tabla dinámica, debemos indicarle los campos o variables que se incluirán, para este ejemplo serán ambas variables. Arrastramos el campo dólar hacia la casilla de las filas y el campo euros hacia la casilla de las columnas.
  • 101. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 102 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 125. Ingreso de variables fila y columna. Observamos que la presentación de la tabla no es adecuada, dado que por ser variables continuas los datos en su mayoría son distintos. Lo que haremos será construir intervalos para ambos recorridos a modo de poder tener una mejor presentación y resumen de las frecuencias conjuntas y marginales. El número de intervalos se puede determinar por una formula conocida o bien según el objetivo del estudio. En este caso será de interés visualizar el comportamiento de la variación de las monedas en cuatro niveles de sus valores, entonces tendremos las frecuencias conjuntas resumidas en cuatro intervalos para ambas variables. Necesitaremos obtener los valores extremos y el rango, antes de construir los intervalos. Para esto nos ubicaremos en las celdas por debajo de los datos, usted puede colocarlas donde desee o sea más conveniente. Colocaremos las fórmulas que permiten obtener el máximo, mínimo, rango y amplitud de lo s intervalos. En la columna A a partir de la fila 23, escribiremos Máximo, Mínimo, Rango y amplitud.
  • 102. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 103 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 126. Elementos para cálculo de amplitud de “dólar” y “euro”. En la celda B23, escribimos la fórmula igual MAX, paréntesis y marcamos el rango de los datos, en este caso de la “variación del dólar”, ENTER Figura 127. Cálculo de máximo.
  • 103. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 104 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física En celda B24, escribimos la formula igual MIN, paréntesis el rango de los datos, cierre de paréntesis Figura 128. Cálculo de mínimo. En celda B25, escribimos la fórmula para obtener el Rango, igual B23 menos B24, ENTER
  • 104. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 105 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 129. Cálculo de Rango. Finalmente escribimos la fórmula para obtener la amplitud de los intervalos, es igual B25 dividido por 4, ENTER
  • 105. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 106 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 130. Cálculo de amplitud. Ahora copiamos estas mismas fórmulas para obtener máximo, mínimo, rango y amplitud de los intervalos, para la variable “variación del euro”. Marcamos las celdas B23 a B26 y ubicando la cruz negra en la esquina inferior derecha, arrastramos hacia las celdas C23 a C26, ENTER
  • 106. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 107 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 131. Ampliación de cálculo a variable “euro”. Ahora que ya conocemos la amplitud de los intervalos de ambas variables, volveremos a la tabla dinámica para generar los intervalos que resumirán las frecuencias conjuntas. Primero nos posesionamos sobre cualquier valor de variación del dólar, con el botón derecho elegimos agrupar
  • 107. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 108 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 132. Modificación de columna “dólar”. Luego aparece un recuadro que muestra el máximo, el mínimo y pide que ingresemos la amplitud de los intervalos, fijarse que son los mismos valores de máximo y mínimo que ya habíamos obtenido, en “POR”, colocaremos la amplitud 3,99, y ACEPTAR Figura 133. Ventana de modificación de columna “dólar”.
  • 108. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 109 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Automáticamente genera cuatro intervalos para la variable “variación del dólar” Figura 134. Variable “dólar” modificada a intervalos. Los mismos pasos haremos para la variable “variación del euro” Figura 135. Ventana de modificación de columna “euro”. La tabla ahora queda
  • 109. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 110 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 136. Variable “euro” modificada a intervalos. Para finalizar solo basta arrastrar cualquiera de los campos a la casilla valores, esto hará que la tabla entregue las frecuencias conjuntas que deseamos tener Figura 137. Ingreso de variable a campo de valores. Ahora podemos interpretar algunas frecuencias en ellas:
  • 110. HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 111 Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física Figura 138. Valores seleccionados para ejemplificar uso de tabla. En cuatro de los 20 días del mes en que hubo variación de ambas monedas, estas estuvieron ambas en su valor más bajo. De igual forma, en tres de los 20 días del mes en que hubo variación de ambas monedas, estas estuvieron ambas en su valor más alto.