ANALISIS EXPLORATORIO DE DATOS
INTRODUCCION. CONCEPTOS BASICOS

Dra. Luz Carbajal A
Departamento de Estadística, Demografía, Humanidades y Ciencias
Sociales

Setiembre, 2010
1
DEFINICIÓN DE LA ESTADÍSTICA
La
Estadística
estudia
los
métodos
científicos para recoger, organizar, resumir
y analizar datos, así como para sacar
conclusiones válidas y tomar decisiones
razonables basadas con tal análisis.

2
Areas de la Estadística:
Descriptiva
• Sistematizar, recolectar, ordenar y presentar los datos respecto a un fenómeno
que presenta variabilidad o incertidumbre para su estudio y describirla.
Inferencial
• Deducir las leyes que rigen esos fenómenos y poder realizar predicciones sobre los
mismos, tomar decisiones u obtener conclusiones a partir de una muestra .

N

n

3
TÉRMINOS ESTADÍSTICOS
 Población: Conjunto de todos los individuos que son
susceptibles a ser estudiados.

 Muestra: Subconjunto de la población y que tenemos
acceso para realizar el estudio. Debe tener ciertas
características que la definen como representativa de
la población a estudiar.

 Unidad de análisis: Individuo del cual se obtiene la
información.
 Marco Muestral: Es el listado de todos los individuos 4
TÉRMINOS ESTADÍSTICOS
Dato: valor aislado de una variable
Parámetro: Es una medida estadística (un
valor) que resume los datos de una
población. Es un valor fijo para la población
en estudio.
Estadístico: es una medida estadística que
resume los datos de una muestra. Es un
valor variable.

5
Simbología a utilizar
MEDIDAS

POBLACION
(parámetro)

MUESTRA
(estadístico)

Media aritmética

µ

x

Varianza

σ2

s2

Desviación estándar

σ

s

Proporción

π

p

Tamaño

N

n

6
Ejemplo:
Población: Pacientes del servicio de cardiología
del Hospital María Auxiliadora del 2009.
Se tiene interés en conocer en esta población:
◦ Frecuencia cardiaca promedio → (µ)
◦ Proporción de pacientes que consumía tabaco → (π)
En este caso µ y π se consideran parámetros y
para conocer sus valores debemos estudiar toda
la población de pacientes del servicio del 2009.
 Si el estudio se realiza mediante una muestra, se
calcula estadísticos como: media aritmética ( x ),
desviación estándar (s) y proporción (p).
 Veamos algunos ejemplos de medidas
estadísticas:

7
Variables estadísticas :





Variable: Cualquier característica de una
persona, medio ambiente o situación
experimental, que puede variar de persona a
persona, de un medio ambiente a otro, o de
una situación experimental a otra.
Clasificación:
Variable
cualitativa
(categórica).
Característica
que
se
expresa
cualitativamente.
Ejm: Género, raza, estado nutricional, estado
civil, etc.
Puede ser dicotómica o politómica
Variable
cuantitativa
(numérica) .
Característica
que
se
expresa
cuantitativamente

8
Población: Niños de 5 a 10 años de edad
 Variables:
–Peso
- Frecuencia respiratoria
–Talla
- Género
–Obesidad
- Nº de hermanos
–Perímetro abdominal - Lugar de procedencia
 Variables cualitativas :
◦ Dicotómica: Género, obesidad;
◦ Politómica: Lugar de procedencia;
 Variables cuantitativas :
◦ Discretas: Nº de hermanos, frec. resp.
◦ Continuas: Peso, talla, perímetro abdominal
9
Escalas de medición:
Nominal, ordinal, de intervalo y de razón
Nominal.Para cada unidad de análisis se determina la
pertenencia a una entre dos o más categorías
excluyentes. No es posible establecer
relación de orden entre las categorías. Si se
usan números estos cumplen la propiedad de
= ó ≠.
Ejm: Sexo, estado civil, procedencia, área de
desempeño laboral, grupo sanguíneo,
presencia o ausencia de un atributo, etc.
10

Analisis exploratorio de datos

  • 1.
    ANALISIS EXPLORATORIO DEDATOS INTRODUCCION. CONCEPTOS BASICOS Dra. Luz Carbajal A Departamento de Estadística, Demografía, Humanidades y Ciencias Sociales Setiembre, 2010 1
  • 2.
    DEFINICIÓN DE LAESTADÍSTICA La Estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas con tal análisis. 2
  • 3.
    Areas de laEstadística: Descriptiva • Sistematizar, recolectar, ordenar y presentar los datos respecto a un fenómeno que presenta variabilidad o incertidumbre para su estudio y describirla. Inferencial • Deducir las leyes que rigen esos fenómenos y poder realizar predicciones sobre los mismos, tomar decisiones u obtener conclusiones a partir de una muestra . N n 3
  • 4.
    TÉRMINOS ESTADÍSTICOS  Población:Conjunto de todos los individuos que son susceptibles a ser estudiados.  Muestra: Subconjunto de la población y que tenemos acceso para realizar el estudio. Debe tener ciertas características que la definen como representativa de la población a estudiar.  Unidad de análisis: Individuo del cual se obtiene la información.  Marco Muestral: Es el listado de todos los individuos 4
  • 5.
    TÉRMINOS ESTADÍSTICOS Dato: valoraislado de una variable Parámetro: Es una medida estadística (un valor) que resume los datos de una población. Es un valor fijo para la población en estudio. Estadístico: es una medida estadística que resume los datos de una muestra. Es un valor variable. 5
  • 6.
    Simbología a utilizar MEDIDAS POBLACION (parámetro) MUESTRA (estadístico) Mediaaritmética µ x Varianza σ2 s2 Desviación estándar σ s Proporción π p Tamaño N n 6
  • 7.
    Ejemplo: Población: Pacientes delservicio de cardiología del Hospital María Auxiliadora del 2009. Se tiene interés en conocer en esta población: ◦ Frecuencia cardiaca promedio → (µ) ◦ Proporción de pacientes que consumía tabaco → (π) En este caso µ y π se consideran parámetros y para conocer sus valores debemos estudiar toda la población de pacientes del servicio del 2009.  Si el estudio se realiza mediante una muestra, se calcula estadísticos como: media aritmética ( x ), desviación estándar (s) y proporción (p).  Veamos algunos ejemplos de medidas estadísticas: 7
  • 8.
    Variables estadísticas :   Variable:Cualquier característica de una persona, medio ambiente o situación experimental, que puede variar de persona a persona, de un medio ambiente a otro, o de una situación experimental a otra. Clasificación: Variable cualitativa (categórica). Característica que se expresa cualitativamente. Ejm: Género, raza, estado nutricional, estado civil, etc. Puede ser dicotómica o politómica Variable cuantitativa (numérica) . Característica que se expresa cuantitativamente 8
  • 9.
    Población: Niños de5 a 10 años de edad  Variables: –Peso - Frecuencia respiratoria –Talla - Género –Obesidad - Nº de hermanos –Perímetro abdominal - Lugar de procedencia  Variables cualitativas : ◦ Dicotómica: Género, obesidad; ◦ Politómica: Lugar de procedencia;  Variables cuantitativas : ◦ Discretas: Nº de hermanos, frec. resp. ◦ Continuas: Peso, talla, perímetro abdominal 9
  • 10.
    Escalas de medición: Nominal,ordinal, de intervalo y de razón Nominal.Para cada unidad de análisis se determina la pertenencia a una entre dos o más categorías excluyentes. No es posible establecer relación de orden entre las categorías. Si se usan números estos cumplen la propiedad de = ó ≠. Ejm: Sexo, estado civil, procedencia, área de desempeño laboral, grupo sanguíneo, presencia o ausencia de un atributo, etc. 10