1. Probabilidad y Estadística
Bloque I
Imágenes que dicen mucho: estadística descriptiva
Ciclo Escolar
2022-2023
Dr. Fernando Osorno Gutiérrez
2. Información de
revistas
• La asociación de agentes inmobiliarios informó
que la mediana del precio de venta de una casa
en Estados Unidos es de $215 000 (The Wall
Street Journal, 16 de enero de 2006).
• Durante el Super Bowl de 2006 el costo
promedio de un spot publicitario de 30
segundos en televisión fue de $2.5 millones
(USA Today, 27 de enero de 2007).
• En una encuesta de Jupiter Media se encontró
que 31% de los hombres adultos ven más de 10
horas de televisión a la semana. Entre las
mujeres sólo 26% (The Wall Street Journal, 26
de enero de 2004).
• Los Yankees de Nueva York tienen la nómina
más alta dentro de la liga mayor de béisbol. En
el año 2005 la nómina del equipo fue de $208
306 817, siendo la mediana por jugador de $5
833 334 (USA Today, febrero 2006).
3. Estadísticas • A los datos numéricos de las frases anteriores se
les llama estadísticas.
• Promedios, medianas, porcentajes, número
índices
• Ayudan a entender una gran variedad de negocios y
situaciones económicas.
• En un sentido amplio, la estadística se define como
el arte y la ciencia de reunir datos, analizarlos,
presentarlos e interpretarlos.
• Esto da una mejor comprensión del entorno (negocio,
investigación, población, etc).
4. Ejercicio
de cálculo
mental
Encuentra el número faltante:
7 X ? = 63
63 + ? = 113
78 - ? = 17
Encuentra el operador faltante:
72 ? 8 = 9
8 ? 6 = 48
25 ? 126 = 151
48 ? 7 = 55
5. Población, Muestra, Censo
• Población: Es el colectivo que abarca todos los elementos
cuyas características queremos estudiar. Conjunto entero al
que se desea describir o del que se necesita establecer
conclusiones.
• Muestra. Es un conjunto de elementos seleccionados de una
población de acuerdo a un plan de acción previamente
establecido (muestreo), para obtener conclusiones que pueden
ser extensivas hacia toda la población.
• Censo. Es el estudio de todos y cada uno de los elementos de
una población.
6. Muestreo, Estadístico
• Muestreo. Es la técnica que nos permite seleccionar muestras
adecuadas de una población de estudio. Debe conducir a la
obtención de una muestra representativa de la población.
• Estadístico. Cualquiera de las medidas descriptivas de la
muestra.
7. Estadística descriptiva vs Estadística
inferencial
• Estadística descriptiva. Rama de la estadística que permite
analizar todo un conjunto de datos, de los cuales se extraen
conclusiones verdaderas, únicamente para ese conjunto.
• Estadística inferencial. En esta rama de la estadística, lo que se
pretende es obtener conclusiones generales de una
determinada población, mediante el estudio de una muestra
representativa sacada de ella. Analiza o investiga a una
población, valiéndose de los datos y resultados que se obtienen
de una muestra.
10. Tipos de Variables
• Variables Cualitativas. Son características o cualidades que no
pueden ser medidos con números.
• Variables cualitativos nominales. Presentan modalidades no numéricas
que no admiten un criterio de orden.
• Variables cualitativos ordinales. Presentan modalidades numéricas en
las que existe un orden.
• Variables Cuantitativas. Se expresan mediante un número, se
pueden realizar operaciones aritméticas con ellas.
• Discretas. Toma valores aislados, no admite valores intermedios entre
dos valores específicos.
• Continuas. Puede tomar valores comprendidos entre dos números.
11. Distribuciones de Frecuencias
• Una distribución de frecuencia es un resumen tabular de datos que muestra el número
(frecuencia) de elementos en cada una de las diferentes clases disyuntas (que no se
sobreponen).
• Frecuencia. Es el número de veces que un elemento se repite en un estudio estadístico.
• Frecuencia de clase. Es el número de elementos que tiene cada una de las categorías
mutuamente excluyentes de una distribución.
12. Construcción de una Distribución de
Frecuencias
1. Determinar rango. RANGO = MÁXIMO – MÍNIMO
2. Calcular el número de categorías. El resultado se aproxima al
entero inmediato menor o mayor.
3. Calcular la amplitud (i) de cada intervalo de clase dividiendo
el rango entre el número de categorías. El resultado se
aproxima al valor inmediato superior.
No CATEGORÍAS = 1 + 3.3 * LOG(n)
i = RANGO / (No CATEGORÍAS)
13. Construcción de una Distribución de
Frecuencias
4. Se establecen los límites de cada categoría. Determinar el
límite inferior de la primera categoría y sumar la amplitud del
intervalo, y se obtiene el límite inferior de la siguiente
categoría y así sucesivamente.
5. Frecuencia de clase. Contar cuántos elementos están
incluidos en cada clase.
14. Ejemplo
• Los siguientes datos representan el tiempo en minutos que un
cliente se mantuvo en la fila antes de ser atendido en un banco.
NÚMERO DE ELEMENTOS = 80
MÁXIMO = 32 MÍNIMO = 3
RANGO = 32 – 3 = 29V
No Categorías = 1 + 3.3 *log(80)
= 1 + 3.3 * 1.903
= 7.28 7 u 8
15. Ejemplo
• Amplitud del intervalo:
escogemos 8
• Límites de categorías:
escogemos el 2 como
límite inferior y
sumamos el ancho del
intervalo.
18. Ejercicio
• Las calificaciones de 50 alumnos en Matemáticas han sido las
siguientes:
• Construir tabla de distribución de frecuencias y dibuja el
diagrama de barras.
19. Distribución de Frecuencia con datos
Cualitativos
• Cinco refrescos muy conocidos son Coca cola clásica (Coke Classic), Coca cola de dieta (Diet Coke), Dr.
Pepper, Pepsi y Sprite. Suponga que los datos de la tabla 2.1 muestran los refrescos que fueron comprados
en una muestra de 50 ventas de refresco.
20. Distribución de Frecuencia
• Para elaborar una distribución de
frecuencia se cuenta el número de
veces que aparece cada refresco en la
tabla.
• El resumen aporta más claridad que los
datos originales.
• Al observar esta distribución de
frecuencia, es claro que Coca cola
clásica es el refresco que más se
vende, Pepsi el segundo, Coca cola de
dieta el tercero y Sprite y Dr. Pepper
están empatados en el cuarto lugar.
21. Frecuencia relativa y Frecuencia
porcentual
• La Frecuencia relativa de una clase es igual a la parte o
proporción de los elementos que pertenecen a cada clase.
• La Frecuencia porcentual da los porcentajes que
corresponden a cada clase. Se obtiene multiplicando la
frecuencia relativa por 100.
22.
23. Gráfica de
Pastel
Es otra gráfica para presentar
distribuciones de frecuencia
relativa o porcentual.
• Dibujar un círculo que representa todos
los datos.
• Usar la frecuencia para dividir el círculo
en sectores o partes que corresponden
a la frecuencia relativa de cada clase.
Ejemplo: CocaCola clásica tiene Fr=0.38,
como un círculo tiene 360 grados, el
sector del pastel para CocaCola clásica
es 0.38 * 360 = 136.8 grados.
25. Ejercicio
• Realice una gráfica de pastel de las
siguientes calificaciones de clientes de
un restaurant.
26. Ejercicio
• Realice una gráfica de pastel de las
siguientes calificaciones de clientes de
un restaurant.
27. Medidas de Tendencia Central
• Media: Valor promedio de una variable. Si los datos son datos
de una muestra, la media se denota ẋ, si los datos son de una
población, la media se denota con la letra griega µ.
• Se acostumbra escribir el primer elemento como x1, el segundo
como x2, y la i-ésima observación como xi.
• Ejemplo Media Muestral:
28. Mediana
• Es el valor de en medio en los datos ordenados de menor a
mayor (en forma ascendente). Procedimiento:
Ordenar los datos de menor a mayor (en forma ascendente).
a. Si el número de observaciones es impar, la mediana es el valor de en
medio.
b. Si el número de observaciones es par, la mediana es el promedio de
las dos observaciones de en medio.
30. Moda
• Es el valor que se presenta con mayor frecuencia.
• Moda = 46
31. Medidas de dispersión o variabilidad
• Suponga que compra artículos por Internet. Después de algunos meses, se da cuenta
que el promedio de días que dos proveedores requieren para surtir una orden es 10 días.
De acuerdo a las gráficas, ¿muestran los dos proveedores el mismo grado de
confiabilidad en términos de tiempos para surtir los productos? ¿cuál prefiere usted?
32. Varianza
• La varianza está basada en la diferencia entre cada valor xi y la media.
• A la diferencia entre cada valor xi y la media se le llama desviación
respecto de la media.
• Hay dos tipos de varianza:
• Varianza poblacional. Se obtiene con TODOS los datos de una población.
• Varianza muestral. Se obtiene con los datos de una muestra (una parte de la
población).
Sigma: σ
34. Desviación Estándar
• La desviación estándar se define como la raíz cuadrada
positiva de la varianza.
35. Ejercicio 1
• Se hizo una investigación sobre el número de minutos por mes que los usuarios de
teléfonos celulares usan sus teléfonos. A continuación se muestran los minutos por mes
hallados en una muestra de 15 usuarios de teléfonos.
• Obtener la media y mediana.
• Obtener varianza y desviación estándar.
37. Ejercicio 2
• Las puntuaciones de un jugador de Golf en el 2005 y 2006 son los
siguientes:
• Use la media y la desviación estándar para evaluar a este jugador de
golf en estos dos años.
• ¿Cuál es la principal diferencia en su desempeño en estos dos años? ¿Se
puede ver algún progreso en sus puntuaciones del 2006?, ¿cuál?
39. Ejercicio 3
• Miles de Mexicanos trabajan para sus empresas desde sus
hogares. A continuación se presenta una muestra de datos que
dan las edades de estas personas.
• Calcular Media, Mediana y Moda.
• Realizar gráfica de barras
• Construir distribución de
Frecuencias
• Rango
• No de Categorías
• Amplitud
• Límites de cada categoría
• Frecuencia de clase
40. Ejemplo 4
• Las tarifas de renta de automóviles por día de siete ciudades son las
siguientes:
• Calcular:
• Varianza
• Desviación Estándar
43. Ganancias de películas
• La empresa Walt Disney compró en 7.4 mil millones de dólares Pixar Animation Studios
Inc. A continuación, se presentan las películas animadas producidas por cada una de
estas empresas (Disney y Pixar). Las ganancias están en millones de dólares. Calcule
las ganancias totales, la media, la mediana para comparar el éxito de las películas
producidas por ambas empresas. ¿Sugieren dichos estadísticos por lo menos una razón
por la que Disney haya podido estar interesada en comprar Pixar? Analice.