Clase1-Estadística descriptiva aplicada a la investigación
1. UNIVERSIDAD NACIONAL DEL CALLAO
FACULTAD DE CIENCIAS DE LA SALUD
UNIDAD DE POS GRADO
DOCTORADO EN SALUD PÚBLICA
ASIGNATURA: ESTADÍSTICA APLICADA A
LA INVESTIGACIÓN
Docente: Dr. César Fernando SOLÍS LAVADO
Setiembre-2021
4. ¿Qué idea tenemos de Estadística?
Para transformarlos en información y tomar decisiones
oportunas y eficientes.
Estadística es la ciencia que estudia un conjunto de métodos
que permite:
6. Estadística descriptiva
• Está formada por procedimientos empleados para resumir y describir
las características importantes de un conjunto de mediciones.
• Hace uso de tablas, gráficas (barras, pasteles, líneas, histogramas,
etc.) o mediciones numéricas (media aritmética, desviación estándar,
etc.)
7. Estadística inferencial
Está formada por procedimientos empleados para hacer inferencias
(Generalizaciones) acerca de características poblacionales, a partir de
información contenida en una muestra extraída de una población.
Su objetivo es sacar conclusiones, hacer predicciones y tomar decisiones .
8. Objetivo de las Medidas de
tendencia central
El objetivo principal es
poder representar por
medio de un solo número al
conjunto de datos, es decir,
dar valores representativos
de la distribución de
frecuencias, situados en
algún lugar intermedio,
alrededor del cual, se
encuentran los otros
valores. Estas medidas nos
indican dónde tienden a
concentrarse los valores.
9. Medidas de tendencia central
La media aritmética: Se calcula al sumar los valores y dividir el total entre
el número de valores. Es más conocido como media.
Mediana (Me): Es la medida de tendencia central que implica el valor
intermedio, cuando los valores de los datos originales se presentan en
orden de magnitud creciente o decreciente.
La Moda (Mo): Es el valor que se presenta con mayor frecuencia.
Una desventaja de la media aritmética es su sensibilidad a cada valor, de
tal forma que una puntuación excepcional puede afectarla de manera
drástica. La mediana resuelve, en gran medida esa desventaja.
▪Si la distribución de datos tiene dos modas se dice que es bimodal.
▪Si la distribución presenta más de dos modas se dice que es multimodal.
10. 1. Genere una base de datos en el SPSS sobre los datos generales y
del estado nutricional de una muestra de niños/as de una comunidad
del Perú.
Actividad
11.
12. Medidas de dispersión: son valores que sirven para cuantificar la
homogeneidad (uniformidad) o dispersión (variabilidad) de los datos, es
decir, para medir la proximidad que tienen los datos entre sí.
Una medida de dispersión pequeña indica que los datos se acumulan
alrededor de la media aritmética, por consiguiente, la media se considera
representativa de los datos. Por el contrario, una medida de dispersión
grande indica que la media no es confiable, en tal caso, se asume a la
mediana como medida representativa del conjunto de datos.
Definición
13. Medidas de dispersión absolutas
1. Rango o recorrido (R):
Es la medida de dispersión más simple. Representa la diferencia entre
los valores máximo y mínimo de un conjunto de datos.
máx mín
R x x
= −
Propiedades:
• Fácil de calcular.
• Siempre asume valores positivos.
• Es la primera medida de dispersión que debe usarse porque permite
conocer el intervalo de variación de los datos.
• Una desventaja es que no describe la variabilidad de los datos que se
encuentran comprendidos entre los valores mínimo y máximo.
14. 2.Varianza: Se define como la media aritmética de las desviaciones de los
datos respecto a la media, elevadas al cuadrado.
3. Desviación estándar (σ): Se define como la raíz cuadrada de la varianza.
Nota: La varianza tiene una desventaja, las unidades son diferentes de las
unidades del conjunto original de datos.
15. Varianza Desviación estándar
• Siempre es positiva.
• Es única y siempre existe.
• Está afectada por los valores
extremos de los datos.
• Su unidad de medida es el
cuadrado de la unidad de
medida de los datos
originales.
• La varianza será siempre un
valor positivo o cero, en el
caso de que las
puntuaciones sean iguales.
• Siempre es positiva.
• Está afectada por los valores extremos de los
datos.
• Su unidad de medida es igual a la unidad de
medida de los datos originales.
• En el caso de que se desee comparar la
variabilidad de dos o más conjuntos, la
desviación estándar muestral puede usarse
únicamente si los conjuntos por compararse
tienen las mismas unidades de medida y si
las medias muestrales de los conjuntos de
datos tienen valores próximos entre sí.
Propiedades de la varianza y la desviación estándar
16. Coeficiente de variación (CV%): El coeficiente de variación de un conjunto de
datos muestrales o poblacionales, expresado como porcentaje, describe la
desviación estándar en relación con la media. Está dado de la siguiente
forma:
Coeficiente de
variación
Grado de Variabilidad
0 ≤ CV < 10 Datos muy homogéneos
10 ≤ CV < 15 Datos regularmente homogéneos
15 ≤ CV < 20 Datos regularmente variables
20 ≤ CV < 25 Datos variables
CV ≥ 25 Datos muy variables
Medidas de dispersión relativas
Interpretación:
17. Medidas de posición relativas
• Las medidas de posición relativa
o cuantiles son los valores que
determinan la posición de un dato
respecto a todos los demás datos
de una serie y que previamente
ha sido ordenada de menor a
mayor.
• Los cuantiles más importantes
dividen a los datos ordenados de
menor a mayor en 4; 10 y 100
partes iguales de datos,
denominados cuartiles, deciles y
centiles o percentiles
20. Los Percentiles dividen un
conjunto de datos en 100 partes
porcentualmente iguales.
Dado un percentil Pk, el K% de los datos son
menores o iguales al valor de Pk y el otro
(100-k)% superiores o iguales al valor de Pk
Percentiles
21. Coeficiente de Pearson: Mide el grado de deformación horizontal de una
distribución de datos cuantitativos.
•La deformación o asimetría se deduce comparando la distribución con
el modelo de la curva normal (o campana de Gauss)
Simetría
Asimetría
negativa
Asimetría
positiva
22. Coeficiente de asimetría (As)
Si As = 0
La distribución es simétrica, es decir no hay sesgo ya que:
Media = Me = Mo
Si As > 0
La distribución es asimétrica, además la asimetría es positiva ya
que el sesgo es hacia la derecha, donde: Mo < Me < Media
Si As < 0
La distribución es asimétrica, además la asimetría es negativa ya
que el sesgo es hacia la izquierda, donde: Media < Me < Mo
Si K > 0,263
La curva de distribución es Leptocúrtica. Los datos se concentran
más en la parte central que en las colas.
Si K = 0,263 La curva de distribución es Mesocúrtica o Normal
Si K < 0,263
La curva de distribución es Platicúrtica. Los datos están más
dispersos.
Curtosis (K)
23. Se entiende por curtosis (K), al grado de deformación vertical de una
distribución normal o aproximadamente normal. La distribución se mide en
comparación con la curva normal o mesocúrtica.
Curtosis (Cu o K)