Este documento presenta conceptos básicos de estadística descriptiva. Define términos como población, muestra, variable, dato y escalas de medición. Explica métodos para ordenar y agrupar datos como listas ordenadas, tablas de frecuencia y intervalos de clases. El objetivo es recolectar y organizar datos para resumirlos y analizarlos.
3. Introducción
La Estadística es una ciencia que
facilita la solución de problemas en
los cuales necesitamos conocer
características sobre el
comportamiento de algún suceso o
evento.
Nos permite inferir el
comportamiento de sucesos
iguales o similares sin necesidad
de que estos ocurran.Profa: Oderay Castrellón
4. Esto nos da la posibilidad de
tomar decisiones acertadas y a
tiempo, así como realizar
proyecciones del
comportamiento del suceso.
Sólo se realizan los cálculos y el
análisis con los datos obtenidos
de una muestra de la población y
no con toda la población.
Profa: Oderay Castrellón
5. Conceptos básicos
Estadística:
Es la ciencia que se encarga de recolectar, organizar,
resumir y analizar datos para después obtener
conclusiones. Se divide en
Estadística Descriptiva y Estadística Inferencial.
Estadística descriptiva:
Se encarga de la recolección,
organización, presentación y
análisis de los datos de una
población.
Profa: Oderay Castrellón
6. Estadística inferencial:
Se encarga de analizar la información
presentada por la estadística descriptiva
mediante técnicas que nos ayuden a
conocer, con determinado grado de
confianza, a la población. Lo que nos
permite tomar decisiones.
Profa: Oderay Castrellón
7. Población:
Conjunto definido de TODOS los INDIVIDUOS, de
donde se observa cierta característica.
Al número de integrantes de la población se
llama tamaño de la población y se representa
con la letra N.
Las poblaciones pueden ser finitas o infinitas.
Profa: Oderay Castrellón
8. Población Estadística:
Conjunto de TODOS los DATOS que se obtienen al
realizar la medición de una variable en los
elementos de una población.
Muestra:
Subconjunto de una población, que intenta reflejar las
características de la población lo mejor posible.
El número de individuos que integran la
muestra, llamado tamaño de la muestra se
representa con la letra n.Profa: Oderay Castrellón
9. Individuo:
Es el elemento de la población o de la muestra que
aporta información sobre lo que se estudia.
Variable:
Característica o propiedad de los individuos que se desea
estudiar y se puede medir o calificar; cambia o varía con el
tiempo en un individuo dado, o cambia o varía de elemento a
elemento.
Ej. Edad, peso, sexo, estado civil, número de hijos, etc.
Profa: Oderay Castrellón
10. Dato:
Valor que se obtiene al realizar la medición de la
característica de la variable en estudio.
Pueden ser univariados, bivariados o
multivariados.
La naturaleza de los datos pueden ser datos
cuantitativos o datos cualitativos.
Profa: Oderay Castrellón
11. Datos Cuantitativos
(números):
Valores obtenidos al medir peso,
estatura, temperatura, número
de hijos.
Datos Cualitativos
(categorías):
Se obtienen al calificar la
característica en cuestión
como el sexo, estado civil,
grado máximo de estudios.
Profa: Oderay Castrellón
12. Variable Dicotómica:
Sólo puede tomar dos valores (sí – no, 0 – 1, hombre –
mujer, bueno – malo, encendido – apagado).
En la variable CUANTITATIVA se pueden
distinguir dos tipos: continua y discreta.
Profa: Oderay Castrellón
13. Variable Continua:
Si la variable puede tomar cualquier
número real entre dos valores dados
(decimal o entero).
Ej. El peso de un individuo.
Variable Discreta:
Si la variable sólo puede tomar
números enteros.
Ej. El número de hijos de un
individuo.
Profa: Oderay Castrellón
15. Escala Nominal:
Está asociada a variables cualitativitas y es
denominada de este modo si no se pueden hacer
operaciones aritméticas entre sus valores, pues éstos
son únicamente ETIQUETAS.
Ejemplo: sexo, código postal, estado civil, número
telefónico, número al correr en un maratón, deporte
favorito, carrera a estudiar, etc.
Profa: Oderay Castrellón
16. Escala Ordinal:
Los valores de la variable que tienen un ORDEN con
un nivel específico, pero no se pueden hacer
operaciones aritméticas entre ellas.
Ejemplo:
Pésimo – Malo – Regular – Bueno – Excelente
Primaria – Secundaria – Preparatoria - Licenciatura
Profa: Oderay Castrellón
17. Escala de Intervalo:
En ella existe un orden entre los valores de la
variable y además una NOCIÓN DE DISTANCIA
aunque no se puedan realizar operaciones.
El cero o punto de inicio no es único, es más bien un
punto de referencia.
Ejemplo: Escalas de temperatura, la edad de la
Tierra, la línea del tiempo de la humanidad.
Profa: Oderay Castrellón
18. Escala de Razón:
La magnitud tiene SENTIDO FÍSICO, existe el cero
absoluto, existe orden, se puede determinar cuántas
veces es mayor uno que otro.
Ejemplo: peso, estatura, edad, distancia, dinero, etc.
Profa: Oderay Castrellón
19. Fuentes de información
Encuesta:
Recopilar los datos mediante el uso
de cuestionarios o entrevistas.
Experimento:
Procedimiento utilizado en la
investigación científica para obtener
información que permita conocer el
comportamiento de algún proceso.
Profa: Oderay Castrellón
20. Fuentes de Información
Investigación Documental:
Procedimiento para obtener
datos mediante la consulta de
información ya escrita y
concentrada en documentos
que se localicen en libros o
revistas en bibliotecas,
hemerotecas, o en centros
virtuales.
Profa: Oderay Castrellón
21. Orden de datos
La ordenación es el proceso mediante el cual los
datos están acomodados de tal manera que se
establece un orden (ascendente o descendente)
entre ellos.
Hay dos métodos comunes:
• Listado en orden ascendente
•Método de tallo y hojas
Profa: Oderay Castrellón
22. Ejemplo
Considera que la variable de estudio es el peso de 25
estudiantes. Los pesos se encuentran en la siguiente
tabla:
Peso de 25 estudiantes (en kg)
40 43 48 51 49
56 44 42 55 52
52 62 44 50 59
63 50 56 55 45
57 66 63 51 58
Profa: Oderay Castrellón
23. Listado en orden ascendente
El proceso consiste en ordenarlos de menor a mayor
Peso de 25 estudiantes (en kg)
42 40 48 51 49
56 44 43 55 52
52 62 44 50 59
63 50 56 55 45
57 66 63 51 58
Peso de 25 estudiantes (en kg)
40 42 43 44 44
45 48 49 50 50
51 51 52 52 55
55 5656 57 58
59 62 63 63 66
Profa: Oderay Castrellón
24. Método de tallo y hojas
Si los números de los datos están formados
por dos dígitos, se hace una columna con el
primer dígito (decenas) y a la derecha de cada
uno de ellos se escribe, en fila, sólo el
segundo dígito (unidades) de cada uno de los
datos que tengan el mismo primer dígito.
Profa: Oderay Castrellón
26. Doble tallo
Una variante de este método es en lugar de dividir
en un grupo las decenas, se divide en dos grupos.
El primero abarcando los dígitos del 0 al 4 y el
segundo del 5 al 9.
El ejemplo anterior
queda:
4 0,2,3,4,4
4 5,8,9
5 0,0,1,1,2,2,
5 5,5,6,6,7,8,9
6 2,3,3
6 6
Profa: Oderay Castrellón
27. Caso de variables cualitatitivas
El procedimiento es:
Se identifican todos los valores diferentes y se
acomodan en columna.
Se agrega una segunda columna en donde se van
registrando, mediante una línea vertical, la veces
que aparece el valor dado.
Profa: Oderay Castrellón
28. Ejemplo
Considera que la variable de estudio es el color de
playera de 25 estudiantes.
Los colores se encuentran en la siguiente tabla:
rosa azul blanco azul rosa
gris blanco café negro blanco
rosa azul café blanco blanco
gris azul blanco rosa gris
gris blanco café negro verde
Profa: Oderay Castrellón
29. rosa azul blanco azul rosa
gris blanco café negro blanco
rosa azul café blanco blanco
gris azul blanco rosa gris
gris blanco café negro verde
Color Frecuenc
ia
Azul
Blanco
Café
Gris
Negro
Rosa
Verde
I I I I
I I I I I
II I I
I I I I
I I
I I I I
I
Profa: Oderay Castrellón
30. Tabla de Frecuencia de Datos
Una vez que se tenga ordenados los datos,
se acomodan en la “Tabla de distribución
de frecuencias o tabla de frecuencias”.
La tabla es básicamente una tabla de
valores x-y, dónde “x” representa el dato y
“y” representa la frecuencia.
Profa: Oderay Castrellón
31. La frecuencia es el número de veces que aparece
cada dato.
Hay dos clases de tablas de frecuencias:
Para datos NO agrupados.
Para datos agrupados.
Profa: Oderay Castrellón
32. Tabla de frecuencias para
datos NO agrupados
Está formada por dos columnas: una para la
variable “xi” y la otra para su frecuencia “f”, a
esta frecuencia se le llama frecuencia absoluta o
frecuencia observada.
Profa: Oderay Castrellón
33. Ejemplo
Tabla de frecuencias de los pesos en kg de 25
alumnos.
Peso de 25 estudiantes (en kg)
40 42 43 44 44
45 48 49 50 50
51 51 52 52 55
55 5656 57 58
59 62 63 63 66
xi f
40
42
43
44
45
48
49
50
51
xi f
52
55
56
57
58
59
62
63
66
Total
1
1
1
2
1
1
1
2
2
2
2
2
1
1
1
1
2
1
25
Profa: Oderay Castrellón
34. Frecuencia relativa y acumulada
Por lo regular, se agregan dos columnas: la de la
frecuencia relativa “fr” y la de la frecuencia
acumulada “fa”.
La frecuencia relativa se obtiene mediante el
cociente de la frecuencia y el número total de datos,
esto es fr = f/n.
La frecuencia acumulada se obtiene sumando las
frecuencias anteriores a las frecuencias de un dato
dado.
Profa: Oderay Castrellón
35. Ejemplo
xi f fr fa
40 1
42 1
43 1
44 2
45 1
48 1
49 1
50 2
51 2
xi f fr fa
52 2
55 2
56 2
57 1
58 1
59 1
62 1
63 2
66 1
Tot
al
25
0.04
0.04
0.04
0.04
0.04
0.04
0.04
0.04
0.04
0.04
0.04
0.08
0.08
0.08
0.08
0.08
0.08
0.08
1/25
2/25
1
2
3
5
6
7
8
10
12
14
16
18
19
20
21
22
24
25
1
Siempre
es el
número
total
Siempre es 1Profa: Oderay Castrellón
36. Intervalo de clase
En ocasiones es conveniente acomodar los datos en pequeños
grupos de igual tamaño, llamados intervalos de clase.
El punto medio o marca de clase “xi”, se obtiene con:
El tamaño del intervalo se obtiene mediante la diferencia
de los límites superior e inferior.
Marca de clase
=
Límite inferior + límite
superior 2
Profa: Oderay Castrellón
38. Límite verdadero del intervalo
Frontera de clase o límite verdadero del intervalo:
Intervalo de clase Punto medio “xi”
37.5 – 42.5 40
42.5 – 47.5 45
47.5 – 52.5 50
52.5 – 57.5 55
57.5 – 62.5 60
62.5 – 67.5 65
40 – 2.5 40 + 2.5
Profa: Oderay Castrellón
39. Tabla de intervalos con
límites verdaderos
Usando símbolos de
desigualdad
Usando paréntesis
y corchetes
Intervalo de
clase
Punto
medio
“xi”
37.5 ≤ x < 42.5 40
42.5 ≤ x < 47.5 45
47.5 ≤ x < 52.5 50
52.5 ≤ x < 57.5 55
57.5 ≤ x < 62.5 60
62.5 ≤ x < 67.5 65
Intervalo de
clase
Punto
medio
“xi”
[37.5 , 42.5) 40
[42.5 , 47.5) 45
[47.5 , 52.5) 50
[52.5 , 57.5) 55
[57.5 , 62.5) 60
[62.5 , 67.5) 65
Está incluido No está incluido Está incluido No está incluido
El tamaño del intervalo es de
Profa: Oderay Castrellón
40. CALCULAR EL NÚMERO DE INTERVALOS
Y ANCHURA DEL INTERVALO
Si por alguna razón no es fácil decidir el ancho del
intervalo y el número de ellos, se pueden utilizar
las siguientes fórmulas:
K = 1 + 3.3 log (n)
Donde K = número aproximado de clases
n = número de datos.
Amplitud de los intervalos = Rango / K
Donde Rango = diferencia entre el dato
mayor y el dato
menor.
Profa: Oderay Castrellón
41. Ejemplo
Para el ejemplo de los datos de los pesos de 25
alumnos, el valor de K:
Y la amplitud de los intervalos sería:
K = 1 + 3.3 log (n) = 1 + 3.3 log (25) = 5.6.
Por lo tanto se requieren aproximadamente 6
intervalos.
Amplitud = Rango / K = (66 – 40) / 5.6 =
4.64.
Aproximadamente 5 unidades es la amplitud
de los intervalos.Profa: Oderay Castrellón
42. Tabla de distribución de frecuencias para
datos agrupados
Se elabora con los intervalos de clase, sus puntos
medios y las frecuencias correspondientes para
cada uno de los intervalos.
xi f
40 1
42 1
43 1
44 2
45 1
48 1
49 1
50 2
51 2
52 2
55 2
56 2
57 1
58 1
59 1
62 1
63 2
66 1
Total 25
Datossinagrupar
Intervalo
de clase
Punto
medio “xi”
f
38 – 42 40
43 – 47 45
48 – 52 50
53 – 57 55
58 – 62 60
63 - 67 65
Total
Datos agrupados
2
4
8
5
3
3
2Profa: Oderay Castrellón
43. Tabla de distribución de frecuencias para
datos agrupados
Se agregan las columnas de frecuencia relativa “fr” y
frecuencia acumulada “fa”:
Interval
o de
clase
Punto
medio
“xi”
f fr Fa
38 – 42 40 2
43 – 47 45 4
48 – 52 50 8
53 – 57 55 5
58 – 62 60 3
63- 68 65 3
Total 25
0.08
0.16
0.32
0.20
0.12
0.12
1
2
6
14
19
22
25
2/25
4/25
8/25
Profa: Oderay Castrellón
44. Tabla de distribución de
frecuencias para datos agrupados
Por último se agregan las columnas:
Frecuencia porcentual, “f%” ó “%f”, se
obtiene multiplicando la frecuencia relativa “fr” x
100.
Frecuencia relativa acumulada “fra”, se
obtiene sumando las frecuencias relativas
anteriores a un dato dado.
Frecuencia porcentual acumulada, “f%a”,
se obtiene sumando las frecuencias porcentuales
acumuladas a un dato dado.
Profa: Oderay Castrellón
45. Tablas de frecuencias absoluta, relativa y
acumulada
Interval
o de
clase
Punto
medio
“xi”
f fr f% fa fra f%a
38 – 42 40 2 0.08 2
43 – 47 45 4 0.16 6
48 – 52 50 8 0.32 14
53 – 57 55 5 0.20 19
58 – 62 60 3 0.12 22
63- 68 65 3 0.12 25
Total 25 1
8
16
32
20
12
12
100
0.08
0.24
0.56
0.76
0.88
1
8
24
56
76
88
100
0.08 x
100
2/25
0.08 x
100
Profa: Oderay Castrellón
46. Gráfica de Datos
Existen dos tipos de gráficas mas usuales:
Polígono de Frecuencias
Histograma
Otros gráficos:
Gráfica de barras
Pictograma
Gráfico Circular o de pastel.
Profa: Oderay Castrellón
47. Polígono de Frecuencias
Es la representación mediante un gráfico de
línea. En él se muestra la distribución de
frecuencias y está formado por segmentos de
línea que unen los puntos correspondientes
a la frecuencia de cada una de las clases.
El eje “x” representa el dato “xi”
y el eje “y” las frecuencias.
0
10
2 0
3 0
4 0
50
6 0
Profa: Oderay Castrellón
52. Histograma
Es la representación gráfica de
los datos mediante una sucesión
de rectángulos.
Está formado por rectángulos cuya anchura
representa a cada uno de los intervalos y la
altura corresponde a la frecuencia.
En el eje “x” estarán los límites verdaderos,
los puntos medios y en el eje “y” las
frecuencias.
0.95 2.95 4.95
0
2
4
6
8
10
12
14
Profa: Oderay Castrellón
56. Pirámide Poblacional
Una variante en el histograma es colocar
en el eje “x” de tal manera que las
columnas quedarán en forma horizontal,
es muy común en datos poblacionales.
Profa: Oderay Castrellón
57. Ojiva
Es la representación gráfica de las
frecuencias acumuladas mediante un gráfico
de línea. Se muestra la distribución de
frecuencias acumuladas de los datos.
En el eje “x” estarán los puntos medios y en
el eje “y” las frecuencias acumuladas.
Profa: Oderay Castrellón
58. Ejemplo
Interval
o de
clase
Punto
medio
“xi”
f fr fa
38 – 42 40 2 0.08 2
43 – 47 45 4 0.16 6
48 – 52 50 8 0.32 14
53 – 57 55 5 0.20 19
58 – 62 60 3 0.12 22
63- 68 65 3 0.12 25
Total 25 1
Profa: Oderay Castrellón
63. Gráfico Circular
También es llamado gráfico de pastel.
Sólo se representan datos de frecuencias relativas o
frecuencias porcentuales.
Se debe dividir el área del círculo de manera
proporcional a las frecuencias.
13%
17%
57%
13%
PERRO
PAJARO
HAMSTER
GATO
Profa: Oderay Castrellón
64. Agregaremos una columna a nuestra tabla
de frecuencias “Frecuencia relativa al
círculo”, multiplicando (fr)(360°), para
mostrar la parte proporcional de círculo
medida en grados que corresponde a cada
intervalo.
Profa: Oderay Castrellón
65. Ejemplo 1
Intervalo
de clase
Punto
medio “xi”
f fr (fr )
(360°)
38 – 42 40 2 0.08
43 – 47 45 4 0.16
48 – 52 50 8 0.32
53 – 57 55 5 0.20
58 – 62 60 3 0.12
63- 68 65 3 0.12
Total 25 1
28.8°
0.08 x
360°
0.16 x
360°
57.6°
115.2°
72°
43.2°
43.2°
360°
Profa: Oderay Castrellón
67. Ejemplo 2
Color Frecuenc
ia
Conteo
Azul 4
Blanco 7
Café 3
Gris 4
Negro 2
Rosa 4
Verde 1
I I I I
I I I I I
II I I
I I I I
I I
I I I I
I
Profa: Oderay Castrellón
68. Otros Gráficos
La gráfica de barras se traza similar al
Histograma, sólo que las barras se dibujan
separadas unas de otras.
La escala en el eje “x” es para mostrar
categorías o intervalos de números NO
consecutivos.
0
10
20
30
40
50
60
PERRO PAJARO HAMSTER GATO
Frecuenciaabsoluta
Profa: Oderay Castrellón
70. Pictograma
Similar al de barras, sólo que se sustituyen por
figuras, generalmente relacionadas con la variable
estudiada.
Profa: Oderay Castrellón