SlideShare una empresa de Scribd logo
1 de 32
SEMINARIO DE POSGRADO

METODOLOGÍA DE INVESTIGACIÓN
Titular: Agustín Salvia
MÓDULO 2: MÉTODOS DE INVESTIGACIÓN
BASADOS EN EL ANÁLISIS DE VARIABLES.
BASES DE DATOS Y ESTADÍSTICA DESCRIPTIVA
TÉCNICAS DE ANÁLISIS ESTADÍSTICO

ESTADÍSTICA DESCRIPTIVA
(Medidas de tendencia central y dispersión)
TABLA DE CONTINGENCIA Y ANÁLISIS PORCENTUALES
(Diferencias porcentuales, perfiles y segmentos)

ANALISIS DE ASOCIACIÓN
(Correlación y coeficientes de asociación)
TECNICAS DE ANALISIS MULTIVARIADO
(Modelos Lazarsfeld, regresiones, factoriales, clusters)
MEDIDAS ESTADÍSTICAS
• LA ESTADÍSTICA DESCRIPTIVA TIENE COMO FUNCIÓN BRINDAR UN CONJUNTO DE
MEDIDAS QUE SINTETICEN LA INFORMACIÓN RELEVADA POR LOS DATOS. ESTUDIA
CARACTERES O ASPECTOS REFERIDOS A UN COLECTIVO DE PERSONAS, OBJETO O
ELEMENTOS DE NATURALEZA ESPECÍFICA.
• LA ESTADÍSTICA DESCRIPTIVA DISPONE DE UNA SERIE VARIADA DE HERRAMIENTAS
PARA RESUMIR INFORMACIÓN QUE CONTIENE UNA MUESTRA O POBLACIÓN: TABLAS,
GRÁFICOS, MEDIDAS DE TENDENCIA CENTRAL, DE DISPERSIÓN, ETC.
• LA EXTRAPOLACIÓN DE LOS RESULTADOS DE UNA MUESTRA A LA POBLACIÓN Y LA
ESTIMACIÓN DE EFECTOS CAUSALES ES EL CONTENIDO DE LA ESTADÍSTICA INFERENCIAL,
CUYA FUNCIÓN ES INFERIR CONCLUSIONES Y BRINDAR MEDIDAS QUE PERMITAN
CUANTIFICAR LA CONFIANZA DE TALES CONCLUSIONES.

EL EMPLEO DE UN DETERMINADO TIPO Y/O HERRAMIENTA ESTADÍSTICA
DEPENDE DEL TIPO DE PROBLEMA/OBJETO DE ESTUDIO Y DEL NIVEL DE
MEDIÓN DE LOS VALORES DE LA VARIABLE A CONSIDERAR.
LA BASE DE DATOS COMO PUNTO DE LLEGADA
DADO UN DISEÑO DE INVESTIGACIÓN
BASADO EN ENCUESTAS

FORMULACIÓN DE HIPÓTESIS, ELABORACIÓN DE LA MUESTRA Y EL
INSTRUMENTO

APLICACIÓN CONTROLADA DE CUESTIONARIO

CODIFICACIÓN, PROCESAMIENTO Y CARGA DE INFORMACIÓN

BASE DE DATOS
LOS TRES COMPONENTES DE UNA BASE DE DATOS

Registro (casos)
N°

V1

1

Atributo (variables)
V2

V3

V4

V5

20

2
¿A qué se
denomina
Unidad de
Análisis?

3
4
5
6

Valor
(categorías)

V.n
DE LOS CONCEPTOS A LOS INDICADORES

El proceso de operacionalización
 Determinar las preguntas de investigación e
hipótesis de trabajo (proposiciones conceptuales)
 Establecer las relaciones esperables entre
dimensiones y variables (proposiciones empíricas)
 Creación / selección de indicadores e índices
observables para cada dimensión / variables.
REGISTROS: UNIDADES DE OBSERVACIÓN

UNIDAD DE ANÁLISIS / OBSERVACIÓN
(los registros pueden ser de diversa naturaleza, dependiendo de los objetivos del
estudio)

Ej: personas, familias, empresas, huelgas,
palabras, avisos, muertes, etc.
 El número de registros está dado por el tamaño de la muestra de la población
objeto de estudio. Según las leyes de la estadística, cuanto mayor sea el número de
casos de una muestra probabilística, más confianza y generalizables podrán ser
nuestras estimaciones ¿Por qué…? ¿Y si la muestra no es probabilística?
VARIABLES: ATRIBUTOS DE LA POBLACIÓN

Propiedades o atributos observables de la población o
dimensión objeto de estudio.
Ej: edad, nivel socio-económico, preferencias, hábitos
de consumo, nivel educativo alcanzado, situación
ocupacional, condición de pobreza, etc.
 Las variables estadísticas pueden ser: causales o
independientes, contextuales o intervinientes y
descriptivas o dependientes. Los valores de una
variable deben ser excluyentes y exhaustivos.
VALORES DE LAS VARIABLES

Representación conceptual cualitativa o cuantitativa que
una propiedad o atributo objeto de medición.

Ej: 54 años, joven, varón, ocupado, católico, 150$ per
cápita, 12 años de instrucción, feliz, etc.
 MEDIR implica poner en correspondencia una teoría o concepto explicativo y los
atributos observables de un objeto a través de un lenguaje estándar cuyas reglas de
sintaxis permiten realizar operaciones lógico-matemáticas entre sus valores o
categorías. Ej. Masa-Peso / Nivel de Vida-Ingreso.
LAS VARIABLES ESTADÍSTICAS

NIVEL DE MEDICIÓN DE LAS VARIABLES
VARIABLES CATEGÓRICAS

División en clases

Operaciones básicas: moda,
porcentajes, tasas, razones.

VARIABLES MÉTRICAS

Discretas

Continuas

Medidas de tendencia central y de
posición, varianza, etc.
LAS VARIABLES ESTADÍSTICAS

Escalas de medida
NOMINAL O DE
CLASIFICACIÓN
Sexo, ciudad, situación
laboral, religión, etc.

DE ORDEN
JERÁRQUICO

INTERVALOS
IGUALES

RAZÓN

Clase social, nivel
educativo, escalas de
actitud, etc.

Fecha del
calendario,
factoriales, test,
etc.

Nº de hijos,
ingresos,
antigüedad, edad,
etc.
HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA

INFORMACIÓN RESUMEN DE
VARIABLES ALEATORIAS
TENDENCIA CENTRAL
HETEROGENEIDAD O DESVÍO
FORMA DE LA DISTRIBUCIÓN
HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA
VARIABLES

DESCRIPCIÓN

ESTADISTICOS Y GRÁFICOS

Cualitativas en
escala nominal

 Valores no
 Distribución de frecuencias
métricos con
 Moda, %, tasas, razones.
ausencia de orden
 Diagrama de barras
entre ellos

Cualitativas en
escala ordinal

 Valores no
 Mínimo
métricos con
 Máximo
presencia de orden
 Mediana
entre ellos.
 Cuartiles
 Percentiles
 Rangos intercuartilicos
 Gráficos de caja y bigotes
Estadística Descriptiva
Tabla de distribución de frecuencias
Una de los primeros pasos que se realizan en cualquier
estudio estadístico es la tabulación de resultados, es
decir, recoger la información de la muestra resumida en
una tabla, que denominaremos DISTRIBUCIÓN DE
FRECUENCIAS, en la que cada valor de la variable o
clase se le asocian el número de veces que ha
aparecido, su proporción con respecto a otros valores
de la variable, etc.
FRECUENCIAS: ABSOLUTAS O PORCENTUALES

En caso de que las variables estén al menos en escala
ordinal aparecen opcionalmente las frecuencias
acumuladas absolutas y acumuladas porcentuales.
Tabla de distribución de frecuencias
Definiremos como frecuencia de un dato el número de veces que este
aparece en el colectivo. Siendo N la suma de las respectivas frecuencias
de cada dato (N=ΣXi). Este N será denominado como frecuencia total. A
efectos prácticos, asumiremos las siguientes definiciones de frecuencias:
a) frecuencias absolutas : es el número de veces que aparece dicho valor
de la variable y se representa por fi.
b) frecuencias relativas: es el cociente entre la frecuencia absoluta y el
tamaño de la muestra. La denotaremos por fri
c) frecuencias absoluta acumulada: es el número de veces que ha
aparecido en la muestra un valor menor o igual que el de la variable, se
puede acumular, en la tabla estadística) en orden ascendente (fa↑) o
descendente (fa↓)
d) frecuencia relativa acumulada: al igual que en el caso anterior se
calcula como el cociente entre la frecuencia absoluta acumulada dividido por
el tamaño de la muestra (N).
GRÁFICOS ESTADÍSTICOS
Diagrama de barras: Se utilizan rectángulos separados, que tienen
como base a cada uno de los datos y como altura la frecuencia de ese
dato.
Ejemplo: En la siguiente tabla se muestra el total de vacunas aplicadas
durante el verano de l991 en un estado de la República Mexicana.
GRÁFICOS ESTADÍSTICOS
Gráfica de Torta:   Se forma al dividir un círculo en sectores circulares de
manera que: a) cada sector circular equivale al porcentaje
correspondiente al dato o grupo que representa; y b) la unión de los
sectores circulares forma el círculo y la suma de sus porcentajes es 100.
Estadística Descriptiva
• Variable nominal
PEA

PEA
5000000

Valid

Activo
Inactivo
Total

Frequency
4699861
1207374
5907235

Percent
79,6
20,4
100,0

Valid
Percent
79,6
20,4
100,0

Cumulativ
e Percent
79,6
100,0

4000000

3000000

Frequency

2000000

Statistics
PEA
N
Mode

1000000

0

Activo

Valid
Missing

5907235
0
1,00

PEA

TEMPORARY .
SELECT IF (h12>25 AND h12<45) .
FREQUENCIES
VARIABLES=cdea
/STATISTICS=MODE
/BARCHART FREQ
/ORDER ANALYSIS .

Cases w eighted by PONDERA

Inactivo
GRÁFICOS ESTADÍSTICOS
Ojiva de Frecuencias Acumuladas: Una gráfica de distribución de
frecuencias absolutas o relativas acumuladas es llamada una ojiva. Se
trazan los límites reales superiores contra las frecuencias acumuladas.
ESTADÍSTICA DESCRIPTIVA
Statistics
Grupos de edad
N
Valid
Missing
Median
Range
Minimum
Maximum
Percentiles
20
25
50
75
80

VARIABLE CUALITATIVA EN 
ESCALA ORDINAL
Grupos de edad

Valid

0.- 9 años y menos
1.- de 10 a 19 años
2.- de 20 a 29 años
3.- de 30 a 39 años
4.- de 40 a 49 años
5.- de 50 a 59 años
6.- 60 años y más
Total

Frequency
4077127
4506457
4023557
3053744
2917893
2326358
3361616
24266752

Percent
16,8
18,6
16,6
12,6
12,0
9,6
13,9
100,0

Valid
Percent
16,8
18,6
16,6
12,6
12,0
9,6
13,9
100,0

Cumulativ
e Percent
16,8
35,4
52,0
64,5
76,6
86,1
100,0

24266752
0
2,0000
6,00
,00
6,00
1,0000
1,0000
2,0000
4,0000
5,0000

Grupos de edad
5000000

4000000

3000000

2000000

Frequency

FREQUENCIES
VARIABLES=xgedad
/NTILES= 4
/PERCENTILES= 20 80
/STATISTICS=RANGE MINIMUM MAXIMUM MEDIAN
/BARCHART FREQ
/ORDER ANALYSIS .

1000000
Std. Dev = 2,02
Mean = 2,7
N = 24266752,0

0
0,0

1,0

Grupos de edad
Cases weighted by PONDERA

2,0

3,0

4,0

5,0

6,0
HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA 
VARIABLES CUANTITATIVAS
VARI ABLES

Cuantitativa en
escala de
intervalo o de
razón

DESCRIPCI ÓN

Cuantitativas:
 Discretas
 Continuas
 En escala de
intervalo

 En escala de
razón

ESTADI STICOS Y
GRÁFICOS
Media
Rango
Varianza
Desviación típica
Coeficiente de variación
Coef. de asimetría
Coef. de curtosis
Histograma
GRÁFICOS ESTADÍSTICOS
Histograma: Se utiliza en datos cuantitativos en distribuciones de
frecuencia. Son rectángulos verticales unidos entre sí, en donde sus lados
son los límites reales inferior y superior de clase y cuya altura es igual ala
frecuencia de clase.
ESTADÍSTICA DESCRIPTIVA

• Variable cuantitativa
Edad
Statistics

2000000

1000000

Std. Dev = 22,03
Mean = 32,1

0

N = 24266756,0

0
0,
10

,0
90

,0
80

,0
70

,0
60

,0
50

,0
40

,0
30

,0
20

,0
10

10
25
50
75
90

24.266.752
0
32,15
,00
28
21
22,03
485,49
,53
,00
-,64
,00
99
0
99
780.121.228
6
14
28
48
65

0
0,

Mean
Std. Error of Mean
Median
Mode
Std. Deviation
Variance
Skewness
Std. Error of Skewness
Kurtosis
Std. Error of Kurtosis
Range
Minimum
Maximum
Sum
Percentiles

Valid
Missing

Frequency

Edad
N

3000000

Edad
Cases weighted by PONDERA

FREQUENCIES
VARIABLES=xh12 /FORMAT=NOTABLE
/NTILES= 4
/PERCENTILES= 10 90
/STATISTICS=STDDEV VARIANCE RANGE MINIMUM MAXIMUM SEMEAN MEAN
MEDIAN MODE
SUM SKEWNESS SESKEW KURTOSIS SEKURT
/HISTOGRAM NORMAL
/ORDER ANALYSIS .
ESTADÍSTICA DESCRIPTIVA – MEDIA ARITMÉTICA
La MEDIA ARITMÉTICA O PROMEDIO es una medida
estadística de tendencia central. De una cantidad finita de
números, es igual a la suma de todos ellos dividida entre el
número de sumandos.
También la media aritmética puede ser denominada como
centro de gravedad de una distribución, el cual no es
necesariamente la mitad.
ESTADÍSTICA DESCRIPTIVA - DESVÍO ESTÁNDAR

La desviación estándar (o desviación típica) es
una medida de dispersión para variables de razón
(ratio o cociente) y de intervalo. Es una medida
(cuadrática) que informa de la media de distancias
que tienen los datos respecto de su media aritmética,
expresada en las mismas unidades que la variable.
Para tal fin nos valemos la varianza y la desviación
estándar. Ambas medidas están estrechamente
relacionadas ya que se define una a partir de la otra.
Expresión de la varianza:

Expresión de la desviación estándar:
HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA

UN TIPO PARTICULAR DE
DISTRIBUCIÓN PARA VARIABLES
ALEATORIAS MÉTRICAS
LA CURVA NORMAL
SUS PROPIEDADES
SUS ESTADÍSTICOS
ESTADÍSTICA DESCRIPTIVA – LA DISTRIBUCIÓN NORMAL
Muchas variables aleatorias presentan una función de densidad que
es simétrica y cuya gráfica tiene forma de campana.
Esta distribución es utilizada en aplicaciones estadísticas como
modelo o parámetro de comparación dada la frecuencia o normalidad
con la que ciertos fenómenos tienden a parecerse a esta distribución.
La distribución normal queda definida por dos parámetros:
LA MEDIA Y EL DESVIACIÓN ESTÁNDAR
ESTADÍSTICA DESCRIPTIVA - DISTRIBUCIÓN NORMAL
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas
de tendencia central, sino que necesitamos conocer también la desviación que
representan los datos en su distribución respecto de la media aritmética de dicha
distribución, con objeto de tener una visión de los mismos más acorde con la
realidad a la hora de describirlos e interpretarlos para la toma de decisiones.

La media indica la posición de la campana, de modo que para
diferentes valores de la gráfica es desplazada a lo largo del eje
horizontal. La desviación estándar determina el grado de
apuntamiento de la curva. Cuanto mayor sea su valor más se
dispersarán los datos. Un valor pequeño indica una gran probabilidad
de obtener datos cercanos al valor medio de la distribución.
ESTADÍSTICA DESCRIPTIVA – LA CURVA NORMAL
La curva de distribución normal presenta una única moda, que coincide con
la media y la mediana. La curva normal es asintótica al eje de abscisas. El
área total bajo la curva es igual a 1. El área bajo la curva comprendido entre
los valores situados a dos desviaciones estándar de la media es
aproximadamente igual a 0.95. Es decir, existe un 95% de posibilidades de
observar un valor comprendido en el intervalo -1,96 desvío estándar y +1,96
desvío estándar de la media.
ESTADÍSTICA DESCRIPTIVA - DISTRIBUCIÓN NORMAL
• El uso extendido de la distribución normal en las aplicaciones
estadísticas puede explicarse, además, por otras razones. Muchos
de los procedimientos estadísticos habitualmente utilizados asumen
la normalidad de los datos observados (p. e. el muestreo).
• Resulta recomendable contrastar siempre si se puede asumir o no
una distribución normal. Para ello, la simple exploración visual de
los datos puede sugerir la forma de su distribución.
• No obstante, existen medidas (simestría y kurtosis), gráficos de
normalidad y contrastes de hipótesis que pueden ayudarnos a
decidir, de un modo más riguroso, si la muestra de la que se dispone
procede o no de una distribución normal.
• Cuando los datos no sean normales, podremos o bien
transformarlos o emplear otros métodos estadísticos que no exijan
este tipo de restricciones (los llamados métodos no paramétricos).
GRÁFICOS ESTADÍSTICOS
En los gráficos PROBABILIDAD NORMAL P-P se confrontan las
proporciones acumuladas de una variable con las de una distribución
normal. Los gráficos permiten conocer la causa de esa desviación. Una
curva en forma de "U“ significa que la distribución es asimétrica,
mientras que un gráfico en forma de "S" significará que la distribución
tiene colas mayores o menores que la normal, esto es, que existen pocas
o demasiadas observaciones en las colas.
TRABAJO PRÁCTICO N° 1
• A partir de un tema propuesto formule un problema de investigación que
requiera de datos estadísticos. Elabore una conjetura o hipótesis general y otra
operativa.
• Identifique el dominio empírico al que remite el problema a investigar y elabore
un diseño de investigación a partir del cual identificar la población, las variables
y los atributos que deben ser estudiados.
• Sugiera el tipo de análisis estadístico descriptivo que deberá aplicar para
explorar o testear su hipótesis con la información obtenida.

Más contenido relacionado

La actualidad más candente

Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptivaemamai
 
Terminos basicos de las estadisticas
Terminos basicos de las estadisticasTerminos basicos de las estadisticas
Terminos basicos de las estadisticasatsanchez
 
Resumen estadistica descriptiva resumen
Resumen estadistica descriptiva resumenResumen estadistica descriptiva resumen
Resumen estadistica descriptiva resumenCarlo Herrera
 
Estadística, gráficos, tablas y estadígrafos.
Estadística, gráficos, tablas y estadígrafos.Estadística, gráficos, tablas y estadígrafos.
Estadística, gráficos, tablas y estadígrafos.Julia Bravo Gómez.
 
Presentacion # 1 Estadistica
Presentacion # 1 Estadistica Presentacion # 1 Estadistica
Presentacion # 1 Estadistica DanyaRamos
 
Medidas descriptivas
Medidas descriptivasMedidas descriptivas
Medidas descriptivasgrahbio14
 
Unidad-3-analisis-de-series-de-tiempo
Unidad-3-analisis-de-series-de-tiempoUnidad-3-analisis-de-series-de-tiempo
Unidad-3-analisis-de-series-de-tiempof2721
 
Organización de Datos estadísticos
Organización de Datos estadísticosOrganización de Datos estadísticos
Organización de Datos estadísticosjoseAngelRemacheCast
 
Estadística Medidas descriptivas de la distribución... 008
Estadística Medidas descriptivas de la distribución... 008Estadística Medidas descriptivas de la distribución... 008
Estadística Medidas descriptivas de la distribución... 008CESAR A. RUIZ C
 
Orientaciones estadísticas aplicadas a la investigación
Orientaciones estadísticas aplicadas a la investigaciónOrientaciones estadísticas aplicadas a la investigación
Orientaciones estadísticas aplicadas a la investigaciónOihane Korres Alonso
 
Series de tiempo pp
Series de tiempo ppSeries de tiempo pp
Series de tiempo ppEQUIPO7
 
Módulo 1 de Estadistica General de Forma Virtual.. 2012
Módulo 1 de Estadistica General de Forma Virtual.. 2012Módulo 1 de Estadistica General de Forma Virtual.. 2012
Módulo 1 de Estadistica General de Forma Virtual.. 2012hamlet mata mata
 
Paramentros estadísticos
Paramentros estadísticosParamentros estadísticos
Paramentros estadísticoseams93
 

La actualidad más candente (17)

Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptiva
 
Terminos basicos de las estadisticas
Terminos basicos de las estadisticasTerminos basicos de las estadisticas
Terminos basicos de las estadisticas
 
Resumen estadistica descriptiva resumen
Resumen estadistica descriptiva resumenResumen estadistica descriptiva resumen
Resumen estadistica descriptiva resumen
 
Estadística, gráficos, tablas y estadígrafos.
Estadística, gráficos, tablas y estadígrafos.Estadística, gráficos, tablas y estadígrafos.
Estadística, gráficos, tablas y estadígrafos.
 
08. distribucion de frecuencias
08. distribucion de frecuencias08. distribucion de frecuencias
08. distribucion de frecuencias
 
Presentacion # 1 Estadistica
Presentacion # 1 Estadistica Presentacion # 1 Estadistica
Presentacion # 1 Estadistica
 
Medidas descriptivas
Medidas descriptivasMedidas descriptivas
Medidas descriptivas
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Distribuciones bidimensionales y cronologías
Distribuciones bidimensionales y cronologíasDistribuciones bidimensionales y cronologías
Distribuciones bidimensionales y cronologías
 
Unidad-3-analisis-de-series-de-tiempo
Unidad-3-analisis-de-series-de-tiempoUnidad-3-analisis-de-series-de-tiempo
Unidad-3-analisis-de-series-de-tiempo
 
Organización de Datos estadísticos
Organización de Datos estadísticosOrganización de Datos estadísticos
Organización de Datos estadísticos
 
Estadística Medidas descriptivas de la distribución... 008
Estadística Medidas descriptivas de la distribución... 008Estadística Medidas descriptivas de la distribución... 008
Estadística Medidas descriptivas de la distribución... 008
 
Orientaciones estadísticas aplicadas a la investigación
Orientaciones estadísticas aplicadas a la investigaciónOrientaciones estadísticas aplicadas a la investigación
Orientaciones estadísticas aplicadas a la investigación
 
Series de tiempo pp
Series de tiempo ppSeries de tiempo pp
Series de tiempo pp
 
Módulo 1 de Estadistica General de Forma Virtual.. 2012
Módulo 1 de Estadistica General de Forma Virtual.. 2012Módulo 1 de Estadistica General de Forma Virtual.. 2012
Módulo 1 de Estadistica General de Forma Virtual.. 2012
 
Paramentros estadísticos
Paramentros estadísticosParamentros estadísticos
Paramentros estadísticos
 
Estadistica.yamii
Estadistica.yamiiEstadistica.yamii
Estadistica.yamii
 

Similar a Estadistica descriptiva

Similar a Estadistica descriptiva (20)

Estadistica 2020
Estadistica 2020Estadistica 2020
Estadistica 2020
 
Organizacion de datos
Organizacion de datosOrganizacion de datos
Organizacion de datos
 
Teoria y Ejemplo de Distribucion de Estadística General
Teoria y Ejemplo de Distribucion de Estadística GeneralTeoria y Ejemplo de Distribucion de Estadística General
Teoria y Ejemplo de Distribucion de Estadística General
 
Glosario de estadistica
Glosario de estadisticaGlosario de estadistica
Glosario de estadistica
 
Diccionario estadistico
Diccionario estadisticoDiccionario estadistico
Diccionario estadistico
 
Glosario estadistico
Glosario estadisticoGlosario estadistico
Glosario estadistico
 
GUÍA DE TÉRMINOS ESTADÍSTICO
GUÍA DE TÉRMINOS ESTADÍSTICO GUÍA DE TÉRMINOS ESTADÍSTICO
GUÍA DE TÉRMINOS ESTADÍSTICO
 
Libro estadistica conceptos
Libro estadistica conceptosLibro estadistica conceptos
Libro estadistica conceptos
 
Estadistica descriptiva Unidad I
Estadistica descriptiva Unidad IEstadistica descriptiva Unidad I
Estadistica descriptiva Unidad I
 
Glosario Estadística.pdf
Glosario Estadística.pdfGlosario Estadística.pdf
Glosario Estadística.pdf
 
Organizacion de los datos
Organizacion de los datos Organizacion de los datos
Organizacion de los datos
 
ESTADISTICA 1.ppt
ESTADISTICA 1.pptESTADISTICA 1.ppt
ESTADISTICA 1.ppt
 
ESTADISTICA DESCRIPTIVA .pdf
ESTADISTICA DESCRIPTIVA .pdfESTADISTICA DESCRIPTIVA .pdf
ESTADISTICA DESCRIPTIVA .pdf
 
Distribucion de Frecuecia
Distribucion de FrecueciaDistribucion de Frecuecia
Distribucion de Frecuecia
 
Estadística Descriptiva
Estadística DescriptivaEstadística Descriptiva
Estadística Descriptiva
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Estadistica
EstadisticaEstadistica
Estadistica
 

Estadistica descriptiva

  • 1. SEMINARIO DE POSGRADO METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia MÓDULO 2: MÉTODOS DE INVESTIGACIÓN BASADOS EN EL ANÁLISIS DE VARIABLES. BASES DE DATOS Y ESTADÍSTICA DESCRIPTIVA
  • 2. TÉCNICAS DE ANÁLISIS ESTADÍSTICO ESTADÍSTICA DESCRIPTIVA (Medidas de tendencia central y dispersión) TABLA DE CONTINGENCIA Y ANÁLISIS PORCENTUALES (Diferencias porcentuales, perfiles y segmentos) ANALISIS DE ASOCIACIÓN (Correlación y coeficientes de asociación) TECNICAS DE ANALISIS MULTIVARIADO (Modelos Lazarsfeld, regresiones, factoriales, clusters)
  • 3. MEDIDAS ESTADÍSTICAS • LA ESTADÍSTICA DESCRIPTIVA TIENE COMO FUNCIÓN BRINDAR UN CONJUNTO DE MEDIDAS QUE SINTETICEN LA INFORMACIÓN RELEVADA POR LOS DATOS. ESTUDIA CARACTERES O ASPECTOS REFERIDOS A UN COLECTIVO DE PERSONAS, OBJETO O ELEMENTOS DE NATURALEZA ESPECÍFICA. • LA ESTADÍSTICA DESCRIPTIVA DISPONE DE UNA SERIE VARIADA DE HERRAMIENTAS PARA RESUMIR INFORMACIÓN QUE CONTIENE UNA MUESTRA O POBLACIÓN: TABLAS, GRÁFICOS, MEDIDAS DE TENDENCIA CENTRAL, DE DISPERSIÓN, ETC. • LA EXTRAPOLACIÓN DE LOS RESULTADOS DE UNA MUESTRA A LA POBLACIÓN Y LA ESTIMACIÓN DE EFECTOS CAUSALES ES EL CONTENIDO DE LA ESTADÍSTICA INFERENCIAL, CUYA FUNCIÓN ES INFERIR CONCLUSIONES Y BRINDAR MEDIDAS QUE PERMITAN CUANTIFICAR LA CONFIANZA DE TALES CONCLUSIONES. EL EMPLEO DE UN DETERMINADO TIPO Y/O HERRAMIENTA ESTADÍSTICA DEPENDE DEL TIPO DE PROBLEMA/OBJETO DE ESTUDIO Y DEL NIVEL DE MEDIÓN DE LOS VALORES DE LA VARIABLE A CONSIDERAR.
  • 4. LA BASE DE DATOS COMO PUNTO DE LLEGADA DADO UN DISEÑO DE INVESTIGACIÓN BASADO EN ENCUESTAS FORMULACIÓN DE HIPÓTESIS, ELABORACIÓN DE LA MUESTRA Y EL INSTRUMENTO APLICACIÓN CONTROLADA DE CUESTIONARIO CODIFICACIÓN, PROCESAMIENTO Y CARGA DE INFORMACIÓN BASE DE DATOS
  • 5. LOS TRES COMPONENTES DE UNA BASE DE DATOS Registro (casos) N° V1 1 Atributo (variables) V2 V3 V4 V5 20 2 ¿A qué se denomina Unidad de Análisis? 3 4 5 6 Valor (categorías) V.n
  • 6. DE LOS CONCEPTOS A LOS INDICADORES El proceso de operacionalización  Determinar las preguntas de investigación e hipótesis de trabajo (proposiciones conceptuales)  Establecer las relaciones esperables entre dimensiones y variables (proposiciones empíricas)  Creación / selección de indicadores e índices observables para cada dimensión / variables.
  • 7. REGISTROS: UNIDADES DE OBSERVACIÓN UNIDAD DE ANÁLISIS / OBSERVACIÓN (los registros pueden ser de diversa naturaleza, dependiendo de los objetivos del estudio) Ej: personas, familias, empresas, huelgas, palabras, avisos, muertes, etc.  El número de registros está dado por el tamaño de la muestra de la población objeto de estudio. Según las leyes de la estadística, cuanto mayor sea el número de casos de una muestra probabilística, más confianza y generalizables podrán ser nuestras estimaciones ¿Por qué…? ¿Y si la muestra no es probabilística?
  • 8. VARIABLES: ATRIBUTOS DE LA POBLACIÓN Propiedades o atributos observables de la población o dimensión objeto de estudio. Ej: edad, nivel socio-económico, preferencias, hábitos de consumo, nivel educativo alcanzado, situación ocupacional, condición de pobreza, etc.  Las variables estadísticas pueden ser: causales o independientes, contextuales o intervinientes y descriptivas o dependientes. Los valores de una variable deben ser excluyentes y exhaustivos.
  • 9. VALORES DE LAS VARIABLES Representación conceptual cualitativa o cuantitativa que una propiedad o atributo objeto de medición. Ej: 54 años, joven, varón, ocupado, católico, 150$ per cápita, 12 años de instrucción, feliz, etc.  MEDIR implica poner en correspondencia una teoría o concepto explicativo y los atributos observables de un objeto a través de un lenguaje estándar cuyas reglas de sintaxis permiten realizar operaciones lógico-matemáticas entre sus valores o categorías. Ej. Masa-Peso / Nivel de Vida-Ingreso.
  • 10. LAS VARIABLES ESTADÍSTICAS NIVEL DE MEDICIÓN DE LAS VARIABLES VARIABLES CATEGÓRICAS División en clases Operaciones básicas: moda, porcentajes, tasas, razones. VARIABLES MÉTRICAS Discretas Continuas Medidas de tendencia central y de posición, varianza, etc.
  • 11. LAS VARIABLES ESTADÍSTICAS Escalas de medida NOMINAL O DE CLASIFICACIÓN Sexo, ciudad, situación laboral, religión, etc. DE ORDEN JERÁRQUICO INTERVALOS IGUALES RAZÓN Clase social, nivel educativo, escalas de actitud, etc. Fecha del calendario, factoriales, test, etc. Nº de hijos, ingresos, antigüedad, edad, etc.
  • 12. HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA INFORMACIÓN RESUMEN DE VARIABLES ALEATORIAS TENDENCIA CENTRAL HETEROGENEIDAD O DESVÍO FORMA DE LA DISTRIBUCIÓN
  • 13. HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA VARIABLES DESCRIPCIÓN ESTADISTICOS Y GRÁFICOS Cualitativas en escala nominal  Valores no  Distribución de frecuencias métricos con  Moda, %, tasas, razones. ausencia de orden  Diagrama de barras entre ellos Cualitativas en escala ordinal  Valores no  Mínimo métricos con  Máximo presencia de orden  Mediana entre ellos.  Cuartiles  Percentiles  Rangos intercuartilicos  Gráficos de caja y bigotes
  • 14. Estadística Descriptiva Tabla de distribución de frecuencias Una de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de resultados, es decir, recoger la información de la muestra resumida en una tabla, que denominaremos DISTRIBUCIÓN DE FRECUENCIAS, en la que cada valor de la variable o clase se le asocian el número de veces que ha aparecido, su proporción con respecto a otros valores de la variable, etc. FRECUENCIAS: ABSOLUTAS O PORCENTUALES En caso de que las variables estén al menos en escala ordinal aparecen opcionalmente las frecuencias acumuladas absolutas y acumuladas porcentuales.
  • 15. Tabla de distribución de frecuencias Definiremos como frecuencia de un dato el número de veces que este aparece en el colectivo. Siendo N la suma de las respectivas frecuencias de cada dato (N=ΣXi). Este N será denominado como frecuencia total. A efectos prácticos, asumiremos las siguientes definiciones de frecuencias: a) frecuencias absolutas : es el número de veces que aparece dicho valor de la variable y se representa por fi. b) frecuencias relativas: es el cociente entre la frecuencia absoluta y el tamaño de la muestra. La denotaremos por fri c) frecuencias absoluta acumulada: es el número de veces que ha aparecido en la muestra un valor menor o igual que el de la variable, se puede acumular, en la tabla estadística) en orden ascendente (fa↑) o descendente (fa↓) d) frecuencia relativa acumulada: al igual que en el caso anterior se calcula como el cociente entre la frecuencia absoluta acumulada dividido por el tamaño de la muestra (N).
  • 16. GRÁFICOS ESTADÍSTICOS Diagrama de barras: Se utilizan rectángulos separados, que tienen como base a cada uno de los datos y como altura la frecuencia de ese dato. Ejemplo: En la siguiente tabla se muestra el total de vacunas aplicadas durante el verano de l991 en un estado de la República Mexicana.
  • 17. GRÁFICOS ESTADÍSTICOS Gráfica de Torta:   Se forma al dividir un círculo en sectores circulares de manera que: a) cada sector circular equivale al porcentaje correspondiente al dato o grupo que representa; y b) la unión de los sectores circulares forma el círculo y la suma de sus porcentajes es 100.
  • 18. Estadística Descriptiva • Variable nominal PEA PEA 5000000 Valid Activo Inactivo Total Frequency 4699861 1207374 5907235 Percent 79,6 20,4 100,0 Valid Percent 79,6 20,4 100,0 Cumulativ e Percent 79,6 100,0 4000000 3000000 Frequency 2000000 Statistics PEA N Mode 1000000 0 Activo Valid Missing 5907235 0 1,00 PEA TEMPORARY . SELECT IF (h12>25 AND h12<45) . FREQUENCIES VARIABLES=cdea /STATISTICS=MODE /BARCHART FREQ /ORDER ANALYSIS . Cases w eighted by PONDERA Inactivo
  • 19. GRÁFICOS ESTADÍSTICOS Ojiva de Frecuencias Acumuladas: Una gráfica de distribución de frecuencias absolutas o relativas acumuladas es llamada una ojiva. Se trazan los límites reales superiores contra las frecuencias acumuladas.
  • 20. ESTADÍSTICA DESCRIPTIVA Statistics Grupos de edad N Valid Missing Median Range Minimum Maximum Percentiles 20 25 50 75 80 VARIABLE CUALITATIVA EN  ESCALA ORDINAL Grupos de edad Valid 0.- 9 años y menos 1.- de 10 a 19 años 2.- de 20 a 29 años 3.- de 30 a 39 años 4.- de 40 a 49 años 5.- de 50 a 59 años 6.- 60 años y más Total Frequency 4077127 4506457 4023557 3053744 2917893 2326358 3361616 24266752 Percent 16,8 18,6 16,6 12,6 12,0 9,6 13,9 100,0 Valid Percent 16,8 18,6 16,6 12,6 12,0 9,6 13,9 100,0 Cumulativ e Percent 16,8 35,4 52,0 64,5 76,6 86,1 100,0 24266752 0 2,0000 6,00 ,00 6,00 1,0000 1,0000 2,0000 4,0000 5,0000 Grupos de edad 5000000 4000000 3000000 2000000 Frequency FREQUENCIES VARIABLES=xgedad /NTILES= 4 /PERCENTILES= 20 80 /STATISTICS=RANGE MINIMUM MAXIMUM MEDIAN /BARCHART FREQ /ORDER ANALYSIS . 1000000 Std. Dev = 2,02 Mean = 2,7 N = 24266752,0 0 0,0 1,0 Grupos de edad Cases weighted by PONDERA 2,0 3,0 4,0 5,0 6,0
  • 21. HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA  VARIABLES CUANTITATIVAS VARI ABLES Cuantitativa en escala de intervalo o de razón DESCRIPCI ÓN Cuantitativas:  Discretas  Continuas  En escala de intervalo  En escala de razón ESTADI STICOS Y GRÁFICOS Media Rango Varianza Desviación típica Coeficiente de variación Coef. de asimetría Coef. de curtosis Histograma
  • 22. GRÁFICOS ESTADÍSTICOS Histograma: Se utiliza en datos cuantitativos en distribuciones de frecuencia. Son rectángulos verticales unidos entre sí, en donde sus lados son los límites reales inferior y superior de clase y cuya altura es igual ala frecuencia de clase.
  • 23. ESTADÍSTICA DESCRIPTIVA • Variable cuantitativa Edad Statistics 2000000 1000000 Std. Dev = 22,03 Mean = 32,1 0 N = 24266756,0 0 0, 10 ,0 90 ,0 80 ,0 70 ,0 60 ,0 50 ,0 40 ,0 30 ,0 20 ,0 10 10 25 50 75 90 24.266.752 0 32,15 ,00 28 21 22,03 485,49 ,53 ,00 -,64 ,00 99 0 99 780.121.228 6 14 28 48 65 0 0, Mean Std. Error of Mean Median Mode Std. Deviation Variance Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum Sum Percentiles Valid Missing Frequency Edad N 3000000 Edad Cases weighted by PONDERA FREQUENCIES VARIABLES=xh12 /FORMAT=NOTABLE /NTILES= 4 /PERCENTILES= 10 90 /STATISTICS=STDDEV VARIANCE RANGE MINIMUM MAXIMUM SEMEAN MEAN MEDIAN MODE SUM SKEWNESS SESKEW KURTOSIS SEKURT /HISTOGRAM NORMAL /ORDER ANALYSIS .
  • 24. ESTADÍSTICA DESCRIPTIVA – MEDIA ARITMÉTICA La MEDIA ARITMÉTICA O PROMEDIO es una medida estadística de tendencia central. De una cantidad finita de números, es igual a la suma de todos ellos dividida entre el número de sumandos. También la media aritmética puede ser denominada como centro de gravedad de una distribución, el cual no es necesariamente la mitad.
  • 25. ESTADÍSTICA DESCRIPTIVA - DESVÍO ESTÁNDAR La desviación estándar (o desviación típica) es una medida de dispersión para variables de razón (ratio o cociente) y de intervalo. Es una medida (cuadrática) que informa de la media de distancias que tienen los datos respecto de su media aritmética, expresada en las mismas unidades que la variable. Para tal fin nos valemos la varianza y la desviación estándar. Ambas medidas están estrechamente relacionadas ya que se define una a partir de la otra. Expresión de la varianza: Expresión de la desviación estándar:
  • 26. HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA UN TIPO PARTICULAR DE DISTRIBUCIÓN PARA VARIABLES ALEATORIAS MÉTRICAS LA CURVA NORMAL SUS PROPIEDADES SUS ESTADÍSTICOS
  • 27. ESTADÍSTICA DESCRIPTIVA – LA DISTRIBUCIÓN NORMAL Muchas variables aleatorias presentan una función de densidad que es simétrica y cuya gráfica tiene forma de campana. Esta distribución es utilizada en aplicaciones estadísticas como modelo o parámetro de comparación dada la frecuencia o normalidad con la que ciertos fenómenos tienden a parecerse a esta distribución. La distribución normal queda definida por dos parámetros: LA MEDIA Y EL DESVIACIÓN ESTÁNDAR
  • 28. ESTADÍSTICA DESCRIPTIVA - DISTRIBUCIÓN NORMAL Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer también la desviación que representan los datos en su distribución respecto de la media aritmética de dicha distribución, con objeto de tener una visión de los mismos más acorde con la realidad a la hora de describirlos e interpretarlos para la toma de decisiones. La media indica la posición de la campana, de modo que para diferentes valores de la gráfica es desplazada a lo largo del eje horizontal. La desviación estándar determina el grado de apuntamiento de la curva. Cuanto mayor sea su valor más se dispersarán los datos. Un valor pequeño indica una gran probabilidad de obtener datos cercanos al valor medio de la distribución.
  • 29. ESTADÍSTICA DESCRIPTIVA – LA CURVA NORMAL La curva de distribución normal presenta una única moda, que coincide con la media y la mediana. La curva normal es asintótica al eje de abscisas. El área total bajo la curva es igual a 1. El área bajo la curva comprendido entre los valores situados a dos desviaciones estándar de la media es aproximadamente igual a 0.95. Es decir, existe un 95% de posibilidades de observar un valor comprendido en el intervalo -1,96 desvío estándar y +1,96 desvío estándar de la media.
  • 30. ESTADÍSTICA DESCRIPTIVA - DISTRIBUCIÓN NORMAL • El uso extendido de la distribución normal en las aplicaciones estadísticas puede explicarse, además, por otras razones. Muchos de los procedimientos estadísticos habitualmente utilizados asumen la normalidad de los datos observados (p. e. el muestreo). • Resulta recomendable contrastar siempre si se puede asumir o no una distribución normal. Para ello, la simple exploración visual de los datos puede sugerir la forma de su distribución. • No obstante, existen medidas (simestría y kurtosis), gráficos de normalidad y contrastes de hipótesis que pueden ayudarnos a decidir, de un modo más riguroso, si la muestra de la que se dispone procede o no de una distribución normal. • Cuando los datos no sean normales, podremos o bien transformarlos o emplear otros métodos estadísticos que no exijan este tipo de restricciones (los llamados métodos no paramétricos).
  • 31. GRÁFICOS ESTADÍSTICOS En los gráficos PROBABILIDAD NORMAL P-P se confrontan las proporciones acumuladas de una variable con las de una distribución normal. Los gráficos permiten conocer la causa de esa desviación. Una curva en forma de "U“ significa que la distribución es asimétrica, mientras que un gráfico en forma de "S" significará que la distribución tiene colas mayores o menores que la normal, esto es, que existen pocas o demasiadas observaciones en las colas.
  • 32. TRABAJO PRÁCTICO N° 1 • A partir de un tema propuesto formule un problema de investigación que requiera de datos estadísticos. Elabore una conjetura o hipótesis general y otra operativa. • Identifique el dominio empírico al que remite el problema a investigar y elabore un diseño de investigación a partir del cual identificar la población, las variables y los atributos que deben ser estudiados. • Sugiera el tipo de análisis estadístico descriptivo que deberá aplicar para explorar o testear su hipótesis con la información obtenida.