2. Estadística
2
La estadística es la ciencia que se ocupa de la recogida y obtención de
datos y de su posterior tratamiento para poder expresarlos numéricamente y
así poder extraer conclusiones.
Los primeros estudios estadísticos eran demográficos así que se ha
conservado gran parte del vocabulario.
3. Estadística
3
• Población: Es el conjunto sobre el que se realizará el estudio
estadístico.
• Individuo o Unidad Estadística: Cada uno de los elementos que
componen la población.
• Muestra: Conjunto representativo de la población pero más pequeño que
esta.
• Muestreo: Es la reunión de los datos sobre una muestra que serán el
objeto de nuestro estudio estadístico.
• Valor: Son todos los resultados que podemos obtener. En el caso de una
moneda serían cara y cruz.
• Dato: Los distintos valores que obtenemos para cada individuo. Si
lanzamos la moneda al aire tres veces obtendríamos 3 datos; por
ejemplo: cruz, cara, cruz.
4. Medidas de Tendencia Central
4
Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar
alguna medida de tendencia central, dividiendo el recorrido de la variable en dos, o
bien fragmentar la cantidad de datos en partes iguales. Las más usuales son la
media, la mediana, la moda, los cuartiles, quintiles, deciles y percentiles. Pueden ser
de dos tipos: de tendencia central o de tipismo
Medidas de Dispersión: se llaman medidas de dispersión aquellas que permiten
retratar la distancia de los valores de la variable a un cierto valor central, o que
permiten identificar la concentración de los datos en un cierto sector del recorrido de
la variable. Se trata de coeficientes para variables cuantitativas. Las más usuales son
el desvío estándar y la varianza.
5. Medidas de Posición
La Media (ഥ𝑿)
5
La idea de media o promedio (también llamada media aritmética) formaliza el
concepto intuitivo de punto de equilibrio de las observaciones. Es decir, es el punto
medio del recorrido de la variable según la cantidad de valores obtenidos.
El cálculo de la media: Dado un conjunto de n observaciones 𝑥1, 𝑥2 , 𝑥3, … , 𝑥 𝑛 , la
media ഥ𝒙 se obtiene dividiendo la suma de todos los datos por el numero de ellos, es
decir:
ഥ𝑿 =
𝒙 𝟏 + 𝒙 𝟐 + 𝒙 𝟑 + ⋯ + 𝒙 𝒏
𝒏
=
𝟏
𝒏
𝒊=𝟏
𝒏
𝒙𝒊
8. Medidas de Posición
La Mediana
8
La mediana, a diferencia de la media no busca el valor central del recorrido de la
variable según la cantidad de observaciones, sino que busca determinar el valor que
tiene aquella observación que divide la cantidad de observaciones en dos mitades
iguales. Por lo tanto es necesario atender a la ordenación de los datos, y debido a
ello, este cálculo depende de la posición relativa de los valores obtenidos. Es
necesario, antes que nada, ordenar los datos de menor a mayor (o viceversa).
En caso de que n sea impar 𝐦𝐞𝐝 = 𝒙 𝒏+𝟏
𝟐
En caso de que n sea par 𝐦𝐞𝐝 = 𝒙 𝒏
𝟐
La mediana es la media aritmética de los dos
valores centrales.
10. Medidas de Posición
La Moda
10
• Es aquel valor observado que tiene mayor frecuencia.
• En datos agrupados se puede considerar como moda a la marca de
clase de la categoría con mayor frecuencia.
• Cuando dos valores ocurren con las misma frecuencia y ésta es la
más alta, ambos valores son modas, por lo que el conjunto de datos
es bimodal.
• Cuando ningún valor se repite, se dice que no hay moda.
12. Medidas de Dispersión
Varianza
12
Cuantifica la dispersión de los datos con respecto a la media. Se obtiene
como la media de las desviaciones cuadráticas de cada dato con respecto a
la media.
Muestral
𝑠2
=
1
𝑛 − 1
𝑖=1
𝑛
(𝑋𝑖 − ത𝑋)2
Poblacional
𝑠2 =
1
𝑛
𝑖=1
𝑛
(𝑋𝑖 − ത𝑋)2
13. Medidas de Dispersión
Desviación Estándar
13
Es posible identificar conjuntos de datos que a pesar de ser muy distintos en
términos de valores absolutos, poseen la misma media. Una medida diferencial
para identificar esos conjuntos de datos es la concentración o dispersión alrededor
de la media.
Una manera de evitar que los distintos signos se compensen es elevarlas al
cuadrado, de manera que todas las desviaciones sean positivas. La raíz cuadrada
del promedio de estas cantidades recibe el nombre de desvío estándar, o
desviación típica y es representada por la siguiente fórmula:
𝑠 =
1
𝑛 − 1
𝑖=1
𝑛
(𝑋𝑖 − ത𝑋)2
𝑠 =
1
𝑛
𝑖=1
𝑛
(𝑋𝑖 − ത𝑋)2
23. Rango Estadístico
23
En estadística, el rango representa la diferencia entre el valor máximo y
el valor mínimo de un conjunto de datos. El rango nos muestra la
distribución de los valores en una serie. Si el rango es un número muy
alto, entonces los valores de la serie están bastante distribuidos. En
cambio, si se trata de un número pequeño, quiere decir que los valores
de la serie están muy cerca entre sí.