2. Se le conoce como el
conjunto de métodos y
procedimientos
derivados de la
recopilación,
presentación y análisis de
datos con el fin de llegar
a una conclusión
concreta
Estadística
3. Estadística
Descriptiva
Se emplea para
describir y
analizar conjuntos
de datos
provenientes de
una población
Inferencial
Es aquella que se
emplea para
estimar hábitos o
características de
una población de
estudio.
4. Variables
Cualitativas
Son Aquellas
variables que no
son medibles, sino
son propiedades
que se tiene o no
(discriminativas)
Cuantitativas
Es aquella que se
son observables,
medibles ya sea por
conteo simple o
medición física
Ejemplos: Tamaño, Estado Civil,
Nacionalidad
5. Variables
Cuantitativas
Discretas
Son variables
derivadas de un
conteo simple y
esta basado en
números
enteros
Continuas
Son variables
derivadas de una
medición física
empleando escalas
continuas, que
incluyen valores
decimales o
fraccionales
Ejemplos: Numero de Integrantes de
una familia o la Edad
Ejemplos: Estatura, Temperatura,
longitud, etc.
6. Conceptos Básicos
Población: conjunto compuesto por individuos,
objetos o medidas de estudio que tienen
observables y clasificables (N).
Tipos de
Población
Finitas
Poblaciones
Pequeñas que es
posible
analizarse por
completo
Infinitas
Poblaciones que
por si solas no es
posible
analizarse por
completo por lo
que es necesario
realizar en
muestreo
7. Muestra: Es un subconjunto o porción de la población
ya sea seleccionada arbitrariamente o al azar se
representa como (n).
Los Datos: Son el numero de medidas realizadas a la
muestra o población y recopiladas por medio de una
observación.
8. Valor Estadístico: Es una medida o valor que se
calcula para describir una característica a partir de
una muestra.
ValoresEstadísticos
Tendencia
Central
Tendencia de
Dispersión
11. Análisis Estadístico
Datos No Agrupados
(conjunto no mayor
a 30 elementos
Datos Agrupados
(conjunto mayor a
30 elementos)
12. CONCEPTOS PARA LA
TABULACION DE DATOS
Son empleados para calcular los
estadísticos en conjuntos grandes de
datos.
13. • Frecuencia Absoluta
Son considerados como el numero de veces en
que se repite una variable o fenómeno.
Se representa con la letra fi
Edades de polizones. El Queen Mary navegaba entre Inglaterra y Estados Unidos;
en ocasiones se encontraron polizones a bordo. A continuación se listan las edades
(en años) de los polizones que iban con rumbo al este y de los que iban al oeste
(datos de Cunard Steamship Co., Ltd.). Compare los dos conjuntos de datos.
14. • Tamaño de la muestra
Indica la cantidad de elementos que conforman
muestra estudiada y se obtiene sumando todas
frecuencias absolutas.
Se representa con la letra n
n = fi
15. • Frecuencia Relativa
Es la proporción de datos que se encuentran
cada una de las clases. En valor fracción o
porcentual. Se obtiene dividiendo la frecuencia
del intervalo, entre el tamaño de la muestra
Se representa con la letra hi
𝒉𝒊 =
𝒇 𝒊
𝒏
𝒉𝒊 = 1 0 ≤ 𝒉𝒊 ≤ 1
16. • Frecuencia Relativa Acumulada
Es la proporción de datos acumulados que
encuentran hasta cierta clase o renglón.
Se representa con la letra Hi
𝑯𝒊 =
𝒋=𝟏
𝒊
𝒉𝒋
𝟎 ≤ 𝑯𝒊
≤ 𝟏 j = Frecuencia
17. • Frecuencia Absoluta Acumulada
Es la cantidad de datos acumulados que se
encuentran hasta cierta clase o renglón.
Se representa con la letra Fi
𝑭𝒊 =
𝒋=𝟏
𝒊
𝒇𝒋
𝟎 ≤ 𝑭𝒊 ≤ 𝟎 j = Frecuencia
18. • Rango o Recorrido
Es la diferencia entre el valor máximo y el
valor mínimo de la muestra.
Se representa con la letra R
R = x (max de muestra) - x (min de muestra)
x = valor
19. • Numero de Intervalos
Es el numero de grupos en que se puede
dividir una serie de datos.
Se representa con la letra m
𝒎 = 𝟏 + 𝟑. 𝟑 log(𝒏)
20. • Amplitud del Intervalo
El espacio entre el valor superior e inferior
de cada clase, intervalo o renglón.
Se representa con la letra a
𝒂 =
𝑹
𝒎
21. • Limites de un intervalo
Son los valores extremos de cada clase o
renglón.
Se representa con las letras Linf. y Lsup
• Limites reales de un intervalo
se obtiene calculando el promedio entre el
valor superior de una clase y la inferior de la
clase continua.
Se representa con las letras Lr inf. y Lr sup
22. • Marca de Clase
Es el punto medio de cada intervalo
x =
𝑥 max 𝑖𝑛𝑡 + 𝑥 min 𝑖𝑛𝑡.
2
25. Tipos de Gráficos
• Los gráficos circulares se usan para mostrar los
comparativos, entre los comportamientos de
frecuencias relativas, absolutas o porcentuales
26. • Pictogramas Similar a los gráficos circulares,
pero la frecuencia es representada por
de un dibujo o figura representativa
dependiendo del estudio,
27. • Graficas de barras Son gráficos empleados
para representar una tabla de frecuencias
variables discretas de unos pocos valores.
28. • Graficas de líneas Son gráficos lineales que se
emplean para mostrar los cambios entre las
frecuencias relativas o absolutas, de variables
continuas o discretas.
29. • Histograma Son gráficos de barras en donde se
pueden emplear variables continuas y frecuencias
absolutas o relativas y emplea escalas continuas
en sus ejes.
30. • Ojiva de Frecuencias Son gráficos puntos que
representan la evolución de las frecuencias,
determina los cambios de pendiente y por lo
el comportamiento de la muestra, acorde a los
valores.
32. En todo análisis y/o interpretación se
pueden utilizar diversas medidas
descriptiva que representan las
propiedades de tendencia central,
dispersión y forma para extraer y
resumir las principales características
de los datos.
33. Medidas de tendencia central
La mayor parte de los conjuntos de datos
una tendencia a agruparse alrededor de un punto
"central" y por lo general es posible elegir algún
valor que describa todo un conjunto de datos. Las
medidas de tendencia central a estudiar son:
aritmética, mediana y moda.
34. La media aritmética (también denominada
media). Se calcula sumando todas las
observaciones de un conjunto de datos,
dividiendo después ese total entre el número
total de elementos involucrados
Media aritmética
35. Para datos no Agrupados
𝒙 =
𝒙 𝟏 + 𝒙 𝟐 + ⋯ + 𝒙𝒊
𝒏
=
𝒊=𝟏
𝒏
𝒙𝒊
𝒏
Media aritmética
36. Para datos Agrupados
𝒙 =
𝒙 𝟏 𝒇 𝟏 + 𝒙 𝟐 𝒇 𝟐 + ⋯ + 𝒙𝒊 𝒇𝒊
𝒏
=
𝒊=𝟏
𝒏
𝒙𝒊 𝒇𝒊
𝒏
Media aritmética
37. La mediana es el valor que se encuentra en el centro
de una secuencia ordenada de datos. La mediana no
se ve afectada por observaciones extremas en un
conjunto de datos.
Por ello, cuando se presenta alguna información
extrema, resulta apropiado utilizar la mediana, y no la
media, para describir el conjunto de datos.
Su símbolo es Me
Mediana
40. 𝒊 es el primer intervalo cuya frecuencia acumulada supera a
𝑛
2
𝑳𝒊 es el límite real inferior del intervalo de la mediana.
n es el número de datos.
𝑭𝒊−𝟏 es la frecuencia acumulada anterior al intervalo de la
mediana.
𝒇𝒊 es la frecuencia absoluta del intervalo de la mediana.
𝒂 es la amplitud del intervalo
Donde
41. La moda es el valor de un conjunto de datos que
aparece con mayor frecuencia. Se le obtiene
fácilmente a partir de un arreglo ordenado. A
diferencia de la media aritmética, la moda no se
afecta ante la ocurrencia de valores extremos.
Sin embargo, sólo se utiliza la moda para propósitos
descriptivos porque es más variable que las
anteriores.
Moda
42. Para datos No agrupados
No existe formula solo el dato que
mas se repite. se lee como Mo
ejemplo 1,2,3,3,3,5,7,9 Mo =3
Moda
43. Para datos Agrupados
No existe formula solo el dato que
mas se repite. se lee como Mo
𝑀 𝑜 = 𝐿𝑖 +
𝑓𝑖+1
𝑓𝑖+1 + 𝑓𝑖−1
𝑎
Moda
44. 𝒊 es el intervalo de mayor frecuencia absoluta
𝑳𝒊 es el límite real inferior del intervalo i.
𝒇𝒊−𝟏 es la frecuencia absoluta del intervalo anterior.
𝒇𝒊+𝟏 es la frecuencia absoluta del intervalo posterior.
𝒂 es la amplitud del intervalo
Donde
45. IMC y género. Es bien sabido que los hombres
tienden a pesar más y a ser más altos que las
El índice de masa corporal (IMC) es una medida que
basa en el peso y la estatura. A continuación se listan
los valores de IMC de hombres y mujeres elegidos de
manera aleatoria. ¿Parece existir una diferencia
notable?
47. Una segunda propiedad que describe a un conjunto
de datos es la dispersión. Dos conjuntos de datos
pueden diferir en tendencia central como en
dispersión, o dos conjuntos pueden tener las mismas
medidas de tendencia central pero difiere en términos
de dispersión.
Ejemplo: 1)22222 2 = 2
2)11233 2 = 2
48. Rango
Indica el número de valores que toma la variable. El
rango es la diferencia entre el valor máximo y el valor
mínimo de un conjunto de datos.
R = xmáx - xmín
Si los datos están agrupados en una tabla de
frecuencias, el recorrido es la diferencia entre el
límite real superior del último intervalo y el límite real
inferior del primer intervalo.
R = Lmáx - Lmín
49.
50. El rango mide "la dispersión total" del
conjunto de datos. Aunque el rango es una
medida de dispersión simple y que se
calcula con facilidad, su debilidad
preponderante es que no toma en
consideración la forma en que se distribuyen
los datos entre los valores más pequeños y
los más grandes.
51. Desviación Media
Es la media aritmética de los valores absolutos de las
desviaciones de todos los datos respecto a la media
aritmética. Su símbolo es DM.
a) Desviación media para datos no agrupados
𝑫𝑴 =
𝒊=𝟏
𝒏
𝒙 − 𝒙
𝒏
55. Varianza y Desviación Estándar
Dos medidas de dispersión que se utilizan con
frecuencia y que sí toman en consideración la
forma en que se distribuyen los valores son la
varianza y su raíz cuadrada, la desviación
Estas medidas establecen la forma en que los
valores fluctúan con respecto a la media.
56. Varianza
La varianza se define como el promedio aritmético de
las diferencias entre cada uno de los valores del
conjunto de datos y la media aritmética del conjunto
elevadas al cuadrado.
Su símbolo es S2 si estamos trabajando con una
muestra y σ2 si estamos trabajando con una
57. a) Varianza para datos No Agrupados
𝐒 𝟐 =
𝒊=𝟏
𝒏 𝒙 − 𝒙 𝟐
𝒏 − 𝟏
𝛔 𝟐
=
𝒊=𝟏
𝒏 𝒙 − 𝝁 𝟐
𝑵 − 𝟏
Muestra
Población
58.
59. b) Varianza para datos Agrupados
𝐒 𝟐 =
𝒊=𝟏
𝒏 𝒙 − 𝒙 𝟐 𝒇𝒊
𝒏 − 𝟏
𝛔 𝟐
=
𝒊=𝟏
𝒏 𝒙 − 𝝁 𝟐
𝒇𝒊
𝑵 − 𝟏
Muestra
Población
60.
61.
62. Ejemplo: De un grupo de contribuyentes se determinó
que el promedio de impuestos es de $32.200, con una
varianza de $7.600. Determinar en cada uno de los
siguientes casos, la nueva varianza:
a) Los impuestos aumentan en un 2 %
b) A los impuestos se les disminuye la cantidad de
$2.300
c) A cada contribuyente, se le disminuye un 3 % y
además se le condona $2.550
63.
64. Desviación Típica o Desviación Estándar
Es la raíz cuadrada positiva de la Varianza. Su
símbolo es si se está trabajando S con una muestra
es σ si se está trabajando con una población.
b) Desviación estándar para datos No-agrupados
𝑺 =
𝒊=𝟏
𝒏 𝒙 − 𝒙 𝟐
𝒏 − 𝟏
67. ¿Qué indican la Varianza y la Desviación
Estándar?
La varianza y la desviación estándar miden la
dispersión "promedio" en torno a la media
aritmética, es decir, cómo fluctúan las
observaciones mayores por encima de la media
aritmética y cómo se distribuyen las
menores por debajo de ella.
68. La varianza tiene ciertas propiedades matemáticas
útiles. Sin embargo, al calcularla se obtienen
unidades al cuadrado cm , pulgadas , mm ,
, (horas) , etc. por ello, en la práctica, la principal
medida de dispersión que se utiliza es la desviación
estándar, cuyo valor está dado en las unidades
originales: cm, pulgadas, mm, edades, horas, etc.
69. Criterio de Homogeneidad
Una distribución se considera homogénea, si
la desviación estándar se encuentra entre la
quinta y la cuarta parte del rango. Si no es
entonces se considera que la muestra es
heterogénea
70.
71. Comparación de la variación en diferentes
población
La propiedad dificulta comparar la variación
de valores tomados de distintas poblaciones.
Como el resultado es un valor libre de
unidades de medida específicas, el
de variación resuelve esta desventaja.
72. Definición
El coeficiente de variación (CV) de un
conjunto de datos muéstrales o
poblacionales, expresado como porcentaje,
describe la desviación estándar en relación
con la media. El coeficiente de variación está
dado de la siguiente forma:
𝐶𝑉 =
𝑠
𝑥
∗ 100
Muestra
𝐶𝑉 =
𝜎
𝜇
∗ 100
Población
73. EJEMPLO Estatura y peso de hombres Si
utilizamos los datos de la muestra de
estaturas y pesos de los 40 hombres del
conjunto de datos 1 del apéndice B,
obtendremos los estadísticos que aparecen
en la siguiente tabla.
Calcule el coeficiente de variación de las
estaturas, después calcule el coeficiente de
variación de los pesos; finalmente, compare
los dos resultados.
74.
75. Medidas de posición relativa
Puntuaciones z
Una puntuación z (o valor estandarizado) se
calcula convirtiendo un valor a una escala
estandarizada, como se establece en la
siguiente definición. Utilizaremos
ampliamente las puntuaciones z en el
capítulo 6 y en capítulos posteriores, ya que
son muy importantes.
76. Definición
Una puntuación z (o valor estandarizado) es el
número de desviaciones estándar que un valor x
se encuentra por arriba o por debajo de la media.
Se calcula utilizando las siguientes expresiones:
𝑧 =
𝑥 − 𝑥
𝑠
∗ 100
Muestra
𝑧 =
𝑥 − 𝜇
𝜎
∗ 100
Población
77.
78. The division manager for Northern Pipe and
Steel Company decide implant a new
incentive system for the managers of
Northern´s three plants. The plan called for
bonus to be paid the next month to the
manager whose plant has the greatest relative
improvement over the average monthly
production volume .
79. The following data reflect the historical
production volumes at the three plants .
Plant 1 Plant 2 Plant 3
μ= 700 μ= 2300 μ= 1200
σ= 200 σ= 350 σ= 30
80. At the close of the next month, the monthly
output for the three plants was
Plant 1 Plant 2 Plant 3
810 2600 1320
Suppose the division awarded the bonus to
the manager of plant 2 because her plant
increased the production by 300 units over
the mean.
81. This was a bigger increase than that of any of
the others managers . Do you agree with who
receive the bonus of this month?
82. Medicion de Medida de tendencia central
(Medida de aplicacion adicionales)
83. Una herramienta para muchos marcadores es
llamada grafico de bigotes y deciles (box
and whiskers plot), que incorpora la mediana
y los cuartiles para graficar la tendencia
central.
85. Rolling Hills Golf Course. Rolling hills is a
semiprivate golf club in rural North Carolina.
Like most golf courses, Rolling Hills
battles the slow play issue. Recently, the
course manager colected a radom simple of
the times for 18 hole rounds course. He plans
to make a presentation to the board of the
directors and wishes to construct a box and
whiskers plot as part of the presentation.
88. Se hace una encuesta entre 100 personas
acerca del numero de horas diarias que se
dedican a ver tv. Obteniéndose la siguiente
información.
Calcule la variación y desviación estándar.
89. De un total de 100 datos, 20 son 4, 40 son 5,
30 son 6 y el reto 7. Hallar la desviación
estándar.
90. Cuatro grupos de estudiantes, consistente en
15, 20, 10 y 18 individuos, dieron pesos de 60,
72. 55 y 65 kilos. Hallar la varianza de los
estudiantes
91. Las notas de un estudiante en sus
certámenes han sido 84. 91, 72, 68, 87 y 78.
Hallar la desviación estándar. Las notas son
homogéneas
92. Exercise 1
The following data represents the
commuting distances for employees of Pay
and Carry department store.
94. • The personnel manager for Pay and Carry
would like you to develop frequency
distribution and histogram for these data.
95. • Develop a steam and leaf diagram of these
data
96. • Break the data into three groups : under
3.0 miles; 3.0 and under 6 miles; and 6
miles and over. Construct a pie chart to
illustrate the proportion of employees in
each category.
97. • Referring to part c. construct a bar chart to
depict the proportion of employees in each
category.
98. Wendy Harrington is a staff accountant at a
regional accounting firm in Miami. One of her
clients has had problems with balancing the
cash register at the end of the day. Wendy
has made a study of the endings shortage
(indicates with parenthesis) or overage for the
past 30 days when the cash register did not
balance, and she has recorded the following
data.
100. • Develop a frequency distribution and a
histogram for these data.
• Develop a steam and leaf diagram for
these data. Explain the differences between
the histogram and a steam and leaf
diagram.
101. The following data reflect the number of
books sold at a used book store in Brooklyng,
New York each day for a radom sample of 45
days.
102.
103. 𝑧 =
𝑥 − 𝜇
𝜎
x - dato dado
μ - media promedio
σ – desviación estándar.