2. 2
Definiciones básicas
• Habitantes de una ciudad.
• Televisores fabricados en una factoría.
• Alumnos de primero de bachillerato.
• Color del pelo: negro, castaño, rubio o pelirrojo
• Sexo: hombre o mujer
• Miembros asalariados de una familia: 0, 1 , 2 , 3 ,4 ,
• Alturas de alumnos:178, 169, 172, 183, …
Variable estadística : Cada uno de los rasgos o
características que se quiere estudiar de los elementos de
la población, susceptible o no de medida.
Población: Conjunto de elementos que se quiere estudiar.
Muestra: Cualquier subconjunto de una población. El
número de elementos de una muestra se llama tamaño.
3. 3
Definiciones básicas
• Es sinónimo de unidad básica o última del muestreo
• Ingreso promedio de los trabajadores
• Frecuencia de venta de productos
Estadístico : Es una medida descriptiva de una muestra
Individuo: Cada uno de los elementos que componen una
población y/o muestra .
Carácter : Propiedad o cualidad que presentan los
elementos de una población que se desea estudiar .
• Cualitativo cuando no puede medirse numéricamente
• Cuantitativo cuando puede medirse numéricamente (Variable)
4. 4
Tipos de Estadística
– Trata del recuento, ordenación y clasificación de
los datos obtenidos de las observaciones:
• Construcción de tablas, gráficos y cálculo de parámetros.
• La Estadística descriptiva o deductiva:
• La Estadística inferencial o inductiva:
– Utiliza los resultados de la estadística
descriptiva y se apoya en el cálculo de
probabilidades para la obtención de
conclusiones sobre una población a partir de los
resultados obtenidos de una muestra.
5. 5
Variables cualitativas y cuantitativas
vas
Cuantitati
as
Cualitativ
Variables
Continuas
Discretas
(Cualidades ,
categorías o
atributos)
(Aquellas
medibles
numéricamente)
• Número de hijos
• Páginas de un libro
• Edad
• Peso
• Talla
• Tiempo
(Unidades
completas )
(Cualquier
valor en un
rango)
Ordinales
Nominales
• Escalas
• Etapas
• Colores
• Lugares
• Profesiones
6. 6
Dicotómicas: Sólo hay dos categoría, que son excluyentes una
de la otra
Ejemplo: enfermo-sano, muerto-vivo, mujer-hombre
Nominal: tiene mas de dos categorías y no hay orden entre
ellas.
Ejemplo: color de los ojos, grupo sanguíneo
Ordinal: tiene varias categorías y hay orden entre ellas.
Ejemplo: grado tumoral, calificación del riesgo en
anestesia.
Tipos de Variables Cualitativas
7. 7
Continuas: números infinito no numerables de
elementos.Tiene asociado el concepto de medida, en
unidades a veces fraccionarias.
Ejemplo: Presión arterial, Edad, peso.
Discretas: números finitos o infinitos numerables de
elementos. Se asocia con el concepto de conteo.
Ejemplo: N° de hijos, N° de casos de
tuberculosis por estado.
Tipos de Variables Cuantitativas
8. 8
Presentaciones estadísticas y
representaciones gráficas
• Forma sencilla y clara de agrupar la información
• Pueden ser sencillas o complejas según la cantidad de datos
• Es importante el manejo lógico de la disposición
• Tablas:
• Gráficos:
Son los métodos empleados para organizar y presentar las
observaciones , con el objeto de mostrar la máxima
información con una rápida visualización , manejo de
estética y sencilléz operativa . Pueden ser de dos tipos:
• Permiten visualizar la información y sus relaciones
• Es una forma ilustrativa y clara de los datos
• Es una forma creativa y artística de presentación
9. 9
Las descripciones numéricas de datos son
importantes. Dado un conjunto de n
observaciones :
La estadística descriptiva nos ayuda mediante el
manejo de medidas de tendencia central
relativas a la posición de los datos y medidas de
dispersión relativas a la variabilidad de los datos.
n
x
x
x ,.....,
, 2
1
Diferentes tipos de medidas
10. 10
Las medidas descriptivas más comunes de
tendencia central o posición son: la media
aritmética y la mediana
Existen otras medidas de tendencia central que en
ocasiones pueden resultar de interés tales como :
la moda, los cuartiles, los deciles, los percentiles, la
media armónica, la media geométrica y la media
ponderada.
Medidas de Tendencia Central
11. 11
MediaAritmética
La media aritmética es simplemente el promedio
(también llamada media muestral ya que
generalmente se calcula en relación a una muestra).
Se calcula de la siguiente forma: si las
observaciones de una muestra de tamaño n son x1,
x2,…,xn entonces:
n
x
n
x
x
x
X
n
i
i
n
1
2
1 ...
12. 12
Mediana
La mediana se suele definir como el valor “más
intermedio o central ” una vez que los datos han sido
ordenados en forma creciente. Se suele denotar por
Me. La forma más general de calcular la mediana es la
siguiente:
1 2
2 ( 2) 1
2
n
n n
x si n es impar
Me x x
si n es par
13. 13
Moda
La moda de un conjunto de observaciones es el valor
que más se repite, aquel cuya frecuencia absoluta es
máxima.
Puede ser única, que haya más de una, o que no
exista.
Cuando hay más de una , la distribución de los datos
se denomina acorde : bimodal , trimodal, polimodal,
etc.
14. 14
Nos brindan una idea muy clara de la “posición” de los
parámetros dentro de una distribución de datos.
Uso de : Media , Mediana y Moda
• La media tiene el uso más frecuente y sencillo ,
tales como : talla media del mexicano,
temperatura histórica promedio , etc.
• La mediana es representativa en poblaciones
heterogéneas , tales como : distribución de
salarios , peso medio, etc.
• La moda literalmente tiene que ver con “estar de
moda” o lo que más se lleva , tal como: número de
individuos por casa en México, cantidad de
usuarios de ciertos equipos celulares , etc.
15. 15
La forma de distribución de las observaciones puede variar , causando
desviaciones de estas mediciones centrales , por eso es conveniente el
empleo conjunto de la media y la mediana en una población o muestra.
Relación entre : Media,Mediana y Moda
La media se usa para distribuciones simétricas que
no tienen sesgo , mientras que la mediana es más
representativa cuando se tienen datos de
distribución sesgada.
16. 16
Las medidas descriptivas más
comunes de dispersión son: el
rango, la varianza y la desviación
estándar .
Existen otras medidas de
dispersión que en ocasiones
pueden resultar de interés tales
como : rango semi-intercuartilar ,
rango percentilar y coeficiente de
variación.
Medidas de Dispersión
17. 17
Rango
El rango de la muestra es la medida de variabilidad más sencilla entre todas las mencionadas
Como valor se define como la diferencia entre la observación más grande y la más pequeña :
Indica el ancho, recorrido o amplitud de valores . Tiene como sus límites el valor mayor y el menor en la
distribución de datos.
min
max x
x
r
18. 18
Varianza
Es una medida significativa de la dispersión de las
observaciones alrededor de la media.
Se define como el promedio de las desviaciones respecto
a su media , elevadas al cuadrado :
n
x
x
s
n
i
i
1
2
2
)
(
n
x
x
s
n
i
i
1
2
2
)
(
19. 19
Desviación estándar
Es una medida significativa de la dispersión de las
observaciones alrededor de la media.
Se define como la raíz cuadrada del promedio de las
desviaciones respecto a su media , elevadas al cuadrado ;
es decir la raíz cuadrada de la varianza :
n
x
x
n
i
i
1
2
)
(
20. 20
Utilidad de las medidas de dispersión
Las medidas centrales solo nos indican el valor medio
alrededor del cual se agrupan nuestros datos , pero las de
dispersión nos detallan la variación de las observaciones en
cuanto a forma y extensión.
Nos muestran claramente la distancia entre los datos y la
media aritmética, además de que dependen de todas las
observaciones.
Son únicas de una serie de datos y por eso se denominan
absolutas , pero pierden sentido de comparación , para lo
cual hay que usar el coeficiente de variación (desviación
estándar sobre
la media en porcentaje) .
21. 21
BIBLIOGRAFÍA
1) Spiegel, Murray R. y Stephens, Larry J. (2001).
Estadística serie Schaum. México: McGraw-Hill, pp. 1 –
124
2) Domínguez, Jorge. (2009). Estadística y probabilidad. El
Mundo de los datos y el azar. México: Oxford University
Press. Unidad 3: Resumen y organización de datos, pp. 76
a 129.