El documento presenta información sobre estadística descriptiva. Explica conceptos como frecuencias absolutas y relativas, medidas de tendencia central como la media, mediana y moda, y medidas de posición no central como los cuantiles. Describe cómo calcular estas medidas y sus aplicaciones para resumir y analizar conjuntos de datos.
1. FACULTAD: CIENCIAS DE LA EDUCACIÓN Y DESARROLLO SOCIAL
CARRERA:
LICENCIATURA EN EDUCACIÓN BÁSICA
DOMINIO DEL CONOCIMIENTO MATEMÁTICO EN EL SUBNIVEL DE BÁSICA SUPERIOR
NIVEL: VII
PARALELO 04
TAREA PRESENTACIÓN ELECTRÓNICA (TAREA 7)
Docente. Castillo Salazar David Ricardo
Estudiante: Gabriela Yessenia Hidalgo Saavedra
AÑO: 2020
2.
3.
4. Aplicaciones de la estadística descriptiva
La estadística descriptiva es aplicable en casi todas las áreas donde
recopilan datos cuantitativos. Puede brindar información acerca de
productos, procesos o diversos aspectos del sistema de gestión de la
calidad, como también en el ámbito de la dirección y organización
personas, la logística, etc. Algunos ejemplos de dichas aplicaciones
los siguientes:
• Resumen de las mediciones principales de las características de un
producto.
• Describir el comportamiento de algún parámetro del proceso, como
puede ser la temperatura de un horno.
• Caracterizar el tiempo de entrega o el tiempo de respuesta en el
sector de los servicios.
• Procesar datos relacionados con muestras a clientes, tales como la
satisfacción o insatisfacción del cliente.
• Ilustrar la medición de los datos, tales como los datos de calibración
del equipo.
• Visualizar el resultado del desempeño de un producto en un periodo
mediante un gráfico de tendencia.
5. FRECUENCIAS
La frecuencia estadística es la cantidad de veces que se
repite una observación durante la realización de un
muestreo. Este concepto suele explicarse junto con un
ejemplo que ilustre a qué hace referencia el término
frecuencia estadística en cada caso.
Supongamos que se realiza un muestreo aleatorio
mediante una encuesta que consta de una sola pregunta y
3 opciones de respuesta, y que la encuesta se hace a un
grupo de 20 personas.
Cinco personas responden con la opción 1, diez con la
opción 2 y cinco con la opción 3. Recordemos que la
frecuencia estadística es la cantidad de veces que se
repite una observación; es decir, en este ejemplo, la
frecuencia estadística sería de cinco para la opción 1, de
diez para la opción 2 y de cinco para la opción 3.
Nótese que la sumatoria de las frecuencias estadísticas, en
este caso, es igual al total de personas encuestadas. Esto
significa que la frecuencia estadística es la manera en que
se distribuyen las respuestas de las personas.
6. Tipos de frecuencia estadística
En estadística, podemos identificar 4 tipos
de frecuencias: absoluta, relativa,
absoluta acumulada y relativa acumulada.
Frecuencia absoluta
La frecuencia absoluta es un tipo de
frecuencia estadística que se utiliza en
una investigación para determinar el
número de veces que se repite un valor.
Esta se representa con las letras ni ó fi y
utilizada en la estadísticas descriptivas
para conocer sus características y cuántas
veces se repite en una muestra. Además,
suma de las frecuencias absolutas
obtenidas es igual al total de los datos
analizados, que se representa con N.
Ejemplos de frecuencia absoluta
Para entender mejor este concepto, veamos 2 ejemplos
de frecuencia absoluta.
Ejemplo con variable discreta
Una consultora decide realizar una investigación en una
oficina acerca de la cantidad de hijos que poseen sus
empleados. Luego de realizar la pregunta a 20
empleados, las respuestas son las siguientes: 0, 2, 2, 0, 3,
1, 1, 2, 3, 1, 0, 2, 3, 4, 3, 4, 2, 0, 1, 2.
En consecuencia tenemos N = 20 (cantidad de
empleados evaluados) y Xi = variable aleatoria
Hijos Frecuencia absoluta (fi)
0 4
1 4
2 6
3 4
4 2
∑ 20
7. Medidas de tendencia central
Las características globales de un conjunto de datos estadísticos pueden resumirse
mediante una serie de cantidades numéricas representativas llamadas parámetros
estadísticos. Entre ellas, las medidas de tendencia central, como la media aritmética,
la moda o la mediana, ayudan a conocer de forma aproximada el comportamiento de
una distribución estadística.
Medidas de centralización
Se llama medidas de posición, tendencia central o centralización a unos valores
numéricos en torno a los cuales se agrupan, en mayor o menor medida, los valores
de una variable estadística. Estas medidas se conocen también como promedios.
Para que un valor pueda ser considerado promedio, debe cumplirse que esté situado
entre el menor y el mayor de la serie y que su cálculo y utilización resulten sencillos
en términos matemáticos.
Se distinguen dos clases principales de valores promedio:
•Las medidas de posición centrales: medias (aritmética, geométrica, cuadrática,
ponderada), mediana y moda.
•Las medidas de posición no centrales: entre las que destacan especialmente los
cuantiles.
Las medidas de centralización son parámetros representativos de distribuciones de
frecuencia como las que ilustra la imagen.
Media aritmética
Se define media aritmética de una serie
de valores como el resultado producido al
sumar todos ellos y dividir la suma por el
número total de valores. La media
aritmética se expresada como .
Dada una variable x que toma los valores
x1, x2, ..., xn, con frecuencias absolutas
simbolizadas por f1, f2, ..., fn, la media
aritmética de todos estos valores vendrá
dada por:
8. Media ponderada
En algunas series estadísticas, no todos los valores
tienen la misma importancia. Entonces, para calcular
la media se ponderan dichos valores según su peso,
con lo que se obtiene una media ponderada.
Si se tiene una variable con valores x1, x2, ..., xn, a los
que se asigna un peso mediante valores numéricos
p1, p2, ..., pn, la media ponderada se calculará como
sigue:
Mediana
La media aritmética no siempre es representativa de una serie estadística. Para complementarla,
se utiliza un valor numérico conocido como mediana o valor central.
Dado un conjunto de valores ordenados, su mediana se define como un valor numérico
tal que se encuentra en el centro de la serie, con igual número de valores superiores a él
que inferiores. Normalmente, la mediana se expresa como Me.
La mediana es única para cada grupo de valores. Cuando el número de valores
ordenados (de mayor a menor, o de menor a mayor) de la serie es impar, la mediana
corresponderá al valor que ocupe la posición (n + 1)/2 de la serie. Si el número de
valores es par, ninguno de ellos ocupará la posición central. Entonces, se tomará como
mediana la media aritmética entre los dos valores centrales.
Determinación de la mediana de una serie de valores
Moda
En una serie de valores a los que se asocia una frecuencia, se define moda como el valor
de la variable que posee una frecuencia mayor que los restantes. La moda se simboliza
normalmente por Mo.
Un grupo de valores puede tener varias modas. Una serie de valores con sólo una moda
denomina unimodal; si tiene dos modas, es bimodal, y así sucesivamente.
9. Medidas de posición no central
En estadística descriptiva, las medidas de posición no
central permiten conocer otros puntos característicos de la
distribución que no son los valores centrales. Entre las
medidas de posición no central más importantes están los
cuantiles.
El término cuantil fue usado por primera vez por Kendall en
1940. El cuantil de orden p de una distribución (con 0 < p < 1)
es el valor de la variable que marca un corte de modo
que una proporción p de valores de la población es menor o
igual que . Por ejemplo, el cuantil de orden 0.36 dejaría
un 36% de valores por debajo y el cuantil de orden 0.50 se
corresponde con la mediana de la distribución.
Los cuantiles suelen usarse por grupos que dividen la
distribución en partes iguales; entendidas estas como
intervalos que comprenden la misma proporción de valores.
Los más usados son:
•Los Cuartiles, que dividen a la distribución en cuatro partes
(corresponden a los cuantiles 0.25, 0.50 y 0.75);
•Los Quintiles, que dividen a la distribución en cinco partes
(corresponden a los cuantiles 0.20, 0.40, 0.60 y 0.80) ;
•Los Deciles, que dividen a la distribución en diez partes;
•Los Percentiles, que dividen a la distribución en cien partes.
10. Edad de la
población
habitantes
frecuencia
acumulada
0-20 9 9
20-40 18 27
40-60 26 53
60-80 7 60
80-100 4 64
Cálculo de cuantiles de datos agrupados en intervalos
Calcularemos el cuantil de orden 0.30 de la edad de la población de una
aldea resumida en la tabla:
Nuestro primer paso será hallar el intervalo en que se encuentra nuestro
cuantil: De un total de 64 datos, el cuantil 0.30 ocupará la posición
np=64×0.3=19.2. Observamos en la columna de frecuencias acumuladas
que este valor, por estar comprendido entre 9 y 27, corresponde al intervalo
20-40.
Dentro de este intervalo, seleccionaremos el valor de nuestro cuantil por
simple interpolación lineal. Para ello, siguiendo las indicaciones del gráfico,
sólo será necesario hacer una regla de tres.
Observamos en la figura dos triángulos semejantes:
OAB y OCD. El cuantil buscado corresponderá a la
abscisa 20+x. Razonando por semejanza, OB=x es a
AB=10.2, como OD=20 es a CD=18. Despejando
obtenemos x=11.33, luego el cuantil buscado es a
20+x=31.33.
11. Cuantiles destacados
Cuartiles
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales. Aparecen citados en la literatura
científica por primera vez en 1879 por D. McAlister.[1]
La diferencia entre el tercer cuartil y el primero se conoce como rango intercuartílico. Se representa gráficamente como la anchura de las cajas en los llamados
diagramas de cajas.
Dada una serie de valores X1,X2,X3 ...Xn ordenados en forma creciente, podemos pensar que su cálculo podría efectuarse:
•Primer cuartil (Q1) como la mediana de la primera mitad de valores;
•Segundo cuartil (Q2) como la propia mediana de la serie;
•Tercer cuartil (Q3) como la mediana de la segunda mitad de valores.
Pero esto conduce a distintos métodos de cálculo de los cuartiles primero (resp. tercero) según la propia mediana se incluya o excluya en la serie de la primera
(resp. segunda) mitad de valores.
Cálculo con datos no Agrupados
No hay uniformidad sobre su cálculo. en la bibliografía se encuentran hasta cinco métodos que dan resultados diferentes.[2] Uno de los métodos es el siguiente:
dados n datos ordenados,
•El primer cuartil:
(n+3)/4
•Para el tercer cuartil
(3n+1)/4
Percentiles
Se representan con la letra P. Para el percentil i-ésimo, donde la i toma valores del 1 al 99. El i % de la muestra son valores menores que él y el 100-i %
restante son mayores.
Aparecen citados en la literatura científica por primera vez por Francis Galton en 1885[3]
•P25 = Q1.
•P50 = Q2 = mediana.
•P75 = Q3.
Cálculo con datos no Agrupados
Un método para calcular un percentil sería el siguiente: Calculamos donde n es el número de elementos de la muestra e i el percentil. El resultado
de realizar esta operación da como resultado un número real con parte entera E y parte decimal D. Teniendo en cuenta estos 2 valores, aplicamos la siguiente
función:
El resultado de esta última operación es el valor del percentil pedido.