Introducción:Los objetivos de Desarrollo Sostenible
Estadística descriptiva para una variable
1. Estadística Descriptiva para una
variable
Realizado por Lennys Febres, C.I. 18.666.809
Ciudad Guayana, Mayo 2017.
UNIVERSIDAD NACIONAL EXPERIMENTAL DE GUAYANA
COORDINACIÓN DE INVESTIGACIÓN Y POSTGRADO
POSTGRADO EN SALUD OCUPACIONAL
SEMINARIO BIOESTADÍSTICA
2. Estadística Descriptiva para una variable
La Estadística descriptiva, se refiere a la descripción, clasificación, y
representación grafica de n datos
Tabla de frecuencias:
La construcción de tablas de frecuencias ha sido hasta hace
bien poco la fase preliminar a cualquier estudio descriptivo,
utilizándose como medio para la elaboración de gráficos y el calculo de
valores típicos. Construir una tabla de frecuencias básica equivale a
determinar que valores concretos se dan en la muestra y con que
frecuencia. Se denomina también distribución de frecuencias.
3. Estadística Descriptiva para una variable
Representación grafica
El segundo paso del proceso consiste en ilustrar mediante un
grafico lo obtenido en la tabla de frecuencia. Existen varios tipos de
gráficos. El más simple es el diagrama de sectores; existe también el
diagrama de barras.
El tercer paso del proceso descriptivo consiste en calcular una
serie de parámetros, es decir, números, con la intención de recoger la
información que aportan los n datos de la muestra considerada. Los
valores típicos son, precisamente, esos números que pretenden
caracterizar la muestra. Esta fase del estudio solo tiene sentido cuando
la variable estudiada es cuantitativa. Distinguiremos entre medidas de
centralización, medidas de posición, medidas de dispersión y medidas
de forma.
4. Estadística Descriptiva para una variable
Medidas de centralización
Las más importantes sin duda aunque por si mismas no suelen
bastar para resumir la información.
Media aritmética o maestral: es el valor central en sentido
aritmético. Se obtiene sumando los n datos de la muestra y
dividiéndolos por el tamaño de esta, donde cada dato aparece en el
sumatorio tantas veces como se repita en la muestra.
Mediana: es el valor central, en el sentido del orden, es decir,
aquel que quedaría en el medio una vez ordenados los datos de menor
a mayor, repitiéndose si es necesario tantas veces como aparezcan en
la muestra. Para calcularla basta pues con ordenar los datos y
determinar la posición del medio. Si el numero de datos n es impar es
el dato que ocupa la posición n+1/2 . Si n es par tenemos un conflicto
que puede resolverse mediante: n/2 y n/2 + 1.
5. Estadística Descriptiva para una variable
Medidas de posición
Se trata de una serie de números que dividen la muestra
ordenada en partes con la misma cantidad de datos. La principal
medida de posición ya la hemos estudiado: la mediana, pues divide la
muestra en dos mitades.
Si pretendemos dividir la muestra ordenada en cuatro partes
iguales obtenemos los denominados cuartiles, que se denotan por Q1,
Q2 y Q3. El primero deja a su izquierda (o debajo, segun se prefiera) el
25 % de los datos; el segundo deja a la izquierda el 50 %, por lo que
se trata de la propia mediana; el tercero deja a la derecha el 25 %.
Si dividimos la muestra en diez partes iguales obtenemos los
denominados deciles D1, D2, . . . , D9. Si dividimos la muestra en 100
partes iguales, obtendremos los percentiles p1, p2, . . . , p99.
6. Estadística Descriptiva para una variable
Medidas de dispersión
Tienen por objeto completar la información que aportan las
medidas de centralización pues miden el grado de dispersión de los
datos o, lo que es lo mismo , la variabilidad de la muestra.
Varianza maestral: nos da una medida de dispersión relativa al
tamaño maestral de los distintos datos respecto a la media aritmética
x. Si la elevamos al cuadrado obtenemos la Desviación Típica.
Coeficiente de variación: se trata de un coeficiente
adimensional relacionado con la media y la desviación típica que es de
gran utilidad para comparar la dispersión de distintos grupos de datos,
dado que nos da una medida de la dispersión de los datos relativa al
orden de magnitudes que estos presentan. Concretamente, se define
mediante C.V. = s/x × 100.
7. Estadística Descriptiva para una variable
Medidas de forma
Por ultimo, consideramos dos parámetros que pretenden dar
cierta idea de la forma en la que se distribuyen los datos.
Coeficiente de asimetría: es, como su propio nombre indica
una medida del grado de asimetría o sesgo que se da en la distribución
de los datos.
Coeficiente de aplastamiento o de Curtosis: El parámetro
m4/s4 es una buena referencia acerca del grado de aplastamiento que
presenta la grafica de los datos cuando esta es simétrica, de manera
que cuanto mayor sea su valor tanto menor seria su aplastamiento.
8. Ejercicios
1. Se tienen 30 datos numéricos correspondientes a la medición del peso en
kg. de 30 individuos. En que dimensiones se expresaran la media aritmética, varianza,
desviación típica y coeficiente de variación?
r. La media aritmética, varianza y desviación típica se expresa en las mismas
unidades de la muestra, en este caso kilos. El coeficiente de variación es adimensional.
2. La siguiente tabla representa el número de infartos de miocardio por día que
se atendieron en un servicio especializado durante 30 días: a) Representar el diagrama
de barras para frecuencias absolutas y frecuencias absolutas acumuladas. b) Calcular
la media, varianza, desviación típica y coeficiente de variación de los datos anteriores.
c) Calcular la mediana
Infartos 0 1 2 3 4 5 6
fi 2 3 8 11 2 3 1
9. EjerciciosInfartos fi F1 Hi
0 2 2 0,06
1 3 5 0,16
2 8 13 0,43
3 11 24 0,8
4 2 26 0,86
5 3 29 0,96
6 1 30 1
Total 30
Media: X= 81/30 = 2,7 infartos
Mediana= 15+16/2= 31/2= 15,5 infartos
Varianza= 58,3/30-1= 58,3/29= 2,01 infartos
Desviación típica: 2,01 = 1,42 𝑖𝑛𝑓𝑎𝑟𝑡𝑜𝑠
C.V. = S/X x100= 1,42/2,7x100= 52,59
0
5
10
15
0 1 2 3 4 5 6
Dias
Numero de infartos
Distribuciòn de infartos según la Frecuencia absoluta
0
0.5
1
1.5
0 1 2 3 4 5 6
Numero de infartos
Distribuciòn de infartos según la Frecuencia absoluta
acumulada
10. Bibliografía
• Montanero Fernandez J. Manual de Bioestadística. España.
Universidad de Extremadura. Disponible en:
http://matematicas.unex.es/~jmf/Archivos/Bioestadistica.pdf