2. La estadística descriptiva o análisis exploratorio
de datos ofrece modos de presentar y evaluar las
características principales de los datos a través de
tablas, gráficos y medidas resúmenes.
En esta presentación veremos formas simples de
resumir y representar gráficamente conjuntos de
datos.
El objetivo de construir gráficos es poder apreciar
los datos como un todo e identificar sus
características sobresalientes.
3. Una vez recolectados los datos, éstos pueden
consolidarse y resumirse para mostrar la siguiente
información:
• ¿Qué valores de la variable han sido medidos?
• ¿Con qué frecuencia se presenta cada uno de los
valores?
Para este fin, se puede construir una tabla de
frecuencias que se puede usar para mostrar los datos
gráficamente como una distribución de datos.
El tipo de gráfica que se escoja depende del tipo de
variable que se haya medido.
4. CONCEPTOS
FRECUENCIA ABSOLUTA: Es el numero de veces
que aparece determinado valor en un estudio
estadístico.
Se representa con fi
FRECUENCIA RELATIVA: es el cociente entre
frecuencia absoluta de un determinado valor y el
numero total de datos.
Se expresa en porcentaje % y en decimales 0,01.
Se representa por ni
5. Tabla de conteo
Cuando se cuenta con un lote de datos, es
necesario organizar la información, el primer
paso es realizar una tabla de conteo.
Ejemplo:
Variable: Sexo
Valores de la variable: FEMENINO -
MASCULINO
Tamaño de n: 55
7. SINTETIZANDO LOS DATOS
TABLA DE FRECUENCIAS
SEXO FRECUENCIA
ABSOLUTA (fi)
FRECUENCIAS RELATIVAS (ni)
PROPORCION PORCENTAJE
FEMENINO 44 0.8 80%
MASCULINO 11 0.2 20%
TOTALES n:55 = 1 =100 %
8. GRAFICO DE BARRAS DE LA VARIABLE “SEXO” EN
PORCENTAJE
0
10
20
30
40
50
60
70
80
90
SEXO
MASCULINO FEMENINO
X: SEXO
%
Y
X
9. Gráfico de barras ó Diagramas de barras.
Sobre un sistema de ejes cartesianos en uno de
los ejes se representan los distintos valores de la
variable (X) y en el otro los valores de la
frecuencia (Y).
Sobre cada valor se levantan rectángulos de la
misma base y altura proporcional (normalmente
igual) a la frecuencia.
10. Gráfico circular ó Diagrama de sectores.
Se traza una circunferencia de radio arbitrario y se divide
su círculo en sectores. Cada sector se asocia a un valor
siendo el ángulo correspondiente de cada sector
proporcional a la frecuencia de cada valor.
80%
20%
SEXO
FEMENINO
MASCULINO
11. VARIABLE CUANTITATIVA
NUMÉRICA
Esta variable siempre se representa a través de un Histograma.
Cuando los valores de la variable son demasiados, conviene
agruparlos en intervalos.
Para determinar la cantidad de intervalos se aplica la formula:
K= 1 + 3,3. (Log n)
Para sacar la amplitud de cada intervalo se aplica la siguiente
formula:
C= x máximo - x mínimo
K
Limite de clase: cada clase esta delimitada por un limite inferior y un
limite superior.
Marca de clase: es el punto medio de cada intervalo y es el valor que
representa a todo el intervalo para el calculo de algunos parámetros.
12. EJEMPLO:
Tipo de variable: cuantitativa – numérica
continua
Nombre de la variable: Edad
Valores de la variable: 17…37
Tamaño de n: 55
Lote de datos:
22 - 18- 19- 31- 19- 19- 33- 18- 20- 17- 19- 20-
23- 25- 19- 19- 19- 26- 19- 24- 19- 19- 21- 21-
21- 20- 19- 28- 37- 23- 23- 20- 20- 23- 22- 24-
20- 20- 22- 23- 20- 19- 21- 21- 20- 19- 19- 19-
19- 20- 22- 20- 19- 20- 20.
13. Tabla de conteo
valores valores
17 I = 1 28 1 =1
18 II = 2 29 -
19 IIII IIII IIII
II =
17
30 -
20 IIII IIII III
=13
31 I =1
21 IIII = 5 32 -
22 IIII = 4 33 I =1
23 IIII =5 34 -
24 II =2 35 -
25 I =1 36 -
26 I =1 37 I =1
27 -
14. CONSTRUCCIÓN DE INTERVALOS
K= 1 + 3,3.(Log n)
K= 1 + 3,3 . (1,74)
K= 1 + 5,74
K= 6,74 k= 7
C= x máximo- x mínimo
K
C= 37 – 17
6,74
C= 2,96 C= 3
16. Histograma en % para la variable
0
5
10
15
20
25
30
35
40
45
17-20 20-23 23-26 26-29 29-32 32-35 35-38
%
“EDAD”
17 20 23 26 29 32 35 38
Y
X
X: EDAD
17. Un histograma de frecuencia relativa, para un
conjunto de datos cuantitativo es una gráfica de
barras en la que la altura de la barra muestra “con
qué frecuencia” (medida como proporción o
frecuencia relativa) las mediciones caen en una
clase o sub-intervalo particular. Las clases o sub-
intervalos se grafican a lo largo del eje horizontal.
18. Interpretaciones
A partir del Histograma “Edad” podemos advertir
que la mayor parte de los estudiantes de
Estadística en Educación tienen entre 17 y 23
años, ya que representan un 76% y solo un 3% de
ellos tiene una edad entre 29 y 38 años.
20. Polígono de frecuencias es el nombre que recibe
una clase de gráfico que se crea a partir de
un histograma de frecuencia. Estos histogramas
emplean columnas verticales para
reflejar frecuencias: el polígono de frecuencia es
realizado uniendo los puntos de mayor altura de
estas columnas.
El punto de más altura de un polígono de frecuencia
equivale a la mayor frecuencia, mientras que el área
que se sitúa debajo de la curva incluye todos los
datos que existen.