Este documento proporciona una introducción a los conceptos básicos de estadística, incluidas definiciones de términos como muestra, población, censo, encuesta, medidas de tendencia central y dispersión. Explica las etapas del proceso estadístico como la recopilación de datos, tabulación, medición e inferencia. También describe diferentes formas de representar gráficamente datos estadísticos como diagramas de barras, sectores, histogramas, curvas y mapas.
2. CONCEPTOS BÁSICOS
MUESTRA: Una parte de la POBLACIÓN a estudiar que
sirve para representarla
MUESTREO: Procedimiento para obtener la muestra
TIPOS DE MUESTREO: No aleatorio o de juicio y muestre
aleatorio o de probabilidad
FORMAS DE OBSERVAR LA POBLACIÓN: DIRECTA,
INDIRECTA, CONTÍNUA,PERIÓDICA,
CIRCUNSTANCIAL.
CENSO: se efectúa a TODOS los elementos de la
población.
ENCUESTA: observaciones parciales a la muestra
3. ETAPAS DEL PROCESO
1º RECUENTO, RELEVAMIENTO O
COMPILACIÓN DE DATOS
2ª TABULACIÓN Y AGRUPAMIENTO DE
DATOS
3º MEDICIÓN DE DATOS
4º INFERENCIA ESTADÍSTICA - PREDICCIÓN
4. RECUENTO, RELEVAMIENTO
O COMPILACIÓN DE DATOS
CUALITATIVOS → CUALIDADES
ATRIBUTOS
CONTÍNUAS
CUANTITATIVOS
DISCRETAS
CUALITATIVOS → CARACTER
CUANTITATIVOS → VARIABLE
5. TABULACIÓN
SIN AGRUPAMIENTO DE DATOS
SERIE SIMPLE
CON AGRUPAMMIENTO DE DATOS
DISTRIBUCIÓN DE INTERVALOS DE CLASES
FRECUENCIAS
O SERIE DE FRECUENCIAS
6. MEDICIÓN DE DATOS
VALORES CENTRALES
MEDIDAS O PARÁMETROS DE POSICIÓN
MEDIA → x : Es el valor resultante que se obtiene al
dividir
la sumatoria de un conjunto de datos sobre el número
total de datos. Solo es aplicable para el tratamiento de
datos cuantitativos.
MEDIANA → Me: Valor que divide una serie de datos
en dos partes iguales. La cantidad de datos que queda
por debajo y por arriba de la mediana son iguales.
MODO O MODA → Mo : indica el valor que más se
repite, o la clase que posee mayor frecuencia.
7. MEDIDAS DE DISPERSIÓN
Medidas de dispersión: Son indicadores estadísticos
que muestran la distancia promedio que existe entre los
datos y la media aritmética.
DESVIACIÓN O DISPERSIÓN → d: la distancia de cada dato
respecto a una medida de tendencia central.
DESVIACIÓN MEDIA O PROMEDIO → dm: Equivale a la
división de la sumatoria del valor absoluto de las distancias
existentes entre cada dato y su media aritmética y el número
total de datos.
VARIANZA → σ 2:: Es el resultado de la división de la
sumatoria de las distancias existentes entre cada dato y su
media aritmética elevadas al cuadrado, y el número total de
datos.
DESVIACIÓN STANDARD → σ: Es igual a la raíz cuadrada
de la varianza.
9. n = número de observaciones
x = valores que toma la variable analizada
Σx
MEDIA ARITMÉTICA x=
n
Valor medio para n par
MEDIANA Promedio de los valores medios
para n impar
Valor de la variable al que le
MODO O MODA
corresponde la mayor frecuencia
DESVIACIÓN O DISPERSIÓN d=x-x
ΣІx–xΙ
DESVIACIÓN MEDIA O PROMEDIO dm=
n
Σ (x – x)2
VARIANZA σ2 =
n
√
Σ (x – x)2
DESVIACIÓN STANDARD → σ =
n
11. n = número de observaciones
x = valores que toma la variable analizada
Σxi.fi
MEDIA ARITMÉTICA x=
n
Observación cuya frecuencia acumulad
MEDIANA contiene a n/2
Valor de la variable al que le
MODO O MODA
corresponde la mayor frecuencia
ΣІx–xΙ.f
DESVIACIÓN MEDIA O PROMEDIO dm=
n
Σ (x – x)2 . f
VARIANZA σ2 =
n
√
Σ (x – x)2. f
DESVIAIÓN STANDARD → σ =
n
12. INTERVALOS DE CLASES
X fi
[150; 3
155)
[155; 10
160)
[160; 19
165)
[165; 12
170)
… …
[180; 3
185)
[185; 17
13. n = número de observaciones
x = valores que toma la variable analizada
Σ x im . f i
MEDIA ARITMÉTICA x=
n
Observación cuya frecuencia acumulada
MEDIANA contiene a n/2
Valor de la variable al que le
MODO O MODA
corresponde la mayor frecuencia
Σ І xm – x Ι . fi
DESVIACIÓN MEDIA O PROMEDIO dm=
n
Σ (xm – x)2 . fi
VARIANZA σ2 =
n
√
Σ (xm – x)2. fi
DESVIACIÓN STANDARD → σ =
n
15. DIAGRAMA DE BARRAS
Normalmente se emplea para representar atributos cuantitativos
discretos. Pueden representarse barras simples o múltiples que se
representan agrupadas. Las barras pueden ser horizontales o
verticales.
Consiste en dos ejes perpendiculares y una
barra o
rectángulo para cada valor de la variable.
Normalmente, se suele colocar en el eje
horizontal
los valores de la variable. El otro eje se gradúa
según
los valores de la frecuencia.
La representación gráfica consiste en dibujar
una barra o rectángulo para cada uno de los
17. DIAGRAMA DE SECTORES
Resulta útil cuando se quiere comparar datos.
Consiste en dividir un círculo en tantos
sectores como valores de la variable
La amplitud de cada sector debe ser
proporcional a la frecuencia del valor
correspondiente.
Normalmente los valores se encuentran
expresados en porcentuales.
19. HISTOGRAMA
Se emplea para representar una tabla de frecuencias en intervalo de cla
Sobre el eje horizontal se representan los
intervalos de clases y sobre el eje vertical las
frecuencias de los intervalos.
Consisten en rectángulos adyacentes de los
cuales se toma el punto medio de los lados
opuestos a las bases
21. CURVAS
Generalmente se emplean para representar la variación de la
variable a través del tiempo.
Es por ello que sobre el eje horizontal se representa los períodos
de tiempo,
10
AÑO f
9
1999 6 8
7
2000 5 6
5
2001 9
4
2002 1 3
2
2003 5 1
0
2004 4
1999 2000 2001 2002 2003 2004 2005 2006 2007
2005 1
2006 2
2007 2
22. MAPAS - CARTOGRAMAS
Se emplean para mostrar la distribución de los datos según las
zonas geográficas
Distribución y
porcentaje de
personas de pelo
rubio en el continente
y la cuenca
mediterránea
24. DISTRIBUCIÓN NORMAL
Características de las curvas
- No muestran frecuencias acumuladas.
- Se prefiere para el tratamiento de datos cuantitativos.
- El punto con mayor altura representa la mayor frecuencia.
- Suelen utilizarse para representar tablas de distribución en intervalos de
clases.
- Son más complicadas de elaborar que los gráficos anteriores.
- El área bajo la curva representa el 100% de los datos.
1º cuando coinciden los parámetros MEDIA, MEDIANA y MODO
Al dividir una distribución de
frecuencia mediante la
mediana, ambas áreas
resultantes son iguales, es
decir, los datos se distribuyen de
la misma forma y el
área abarcada por ambos lados
es equivalente (50% de los
datos se encuentran distribuidos
en ambas secciones).
25. 2º cuando NO coinciden los parámetros MEDIA, MEDIANA y MODO
ASIMÉTRICA A LA DERECHA ASIMÉTRICA A LA IZQUIERDA
CURVA BIMODAL
26. DISTRIBUCIÓN NORMAL
CURVA DE GAUSS
Intervalo [x-σ; x+σ] Intervalo [x-2σ; x+2σ]
Desviación standard (σ) pequeña
valores concentrados en torno al valor
medio
Desviación standard (σ) muy grande
valores muy dispersos
Intervalo [x-3σ; x+3σ]