1. 1
PROFESOR MARIO RODRIGUEZ L.
CONCEPTOS BÁSICOS DE
ESTADÍSTICA DESCRIPTIVA
UNIVERSIDAD LOS LEONES
ESTADÍSTICA Y ANÁLISIS DE DATOS
ESCUELA DE PSICOLOGÍA
2. 2
Conceptos Generales
La Estadística Descriptiva es aquella área de la Estadística encargada
de desarrollar herramientas destinadas a describir el comportamiento
de una serie de datos, definida mediante una base de datos,
pertenecientes a una población o a una muestra.
Población: conjunto de elementos que tienen algunas características
comunes.
Muestra: subconjunto representativo de elementos de la población.
Variable: característica interés de estudio
Base de Datos: Se entiende por base de datos un conjunto de
elementos cuantitativos o cualitativos que corresponden a los valores
que toma la variable.
3. 3
Análisis de datos en Psicología
El profesional de la Psicología en su ámbito laboral y de investigación
generalmente maneja y procesa gran cantidad de información tanto de
tipo cuantitativo como cualitativo, en este sentido, frecuentemente está
enfrentado a fenómenos que requiere analizar, los cuales están
definidos en función de características (o variables) sean éstas
cuantitativas o cualitativas. Para el análisis de información, el psicólogo
debe conocer las metodologías que le permiten organizar la información
y así analizar el comportamiento de las principales características o
variables de interés de estudiar. En este curso se propondrán y
estudiarán una diversidad de herramientas útiles para describir el
comportamiento de la información asociada a las variables interés de
estudio del psicólogo.
4. 4
Organización y Representación de Datos.
Definida la información acerca del fenómeno que se desea estudiar
surge la etapa de “organización y representación de datos” para el
desarrollo de la cual es necesario, en primer lugar, clasificar la(s)
variable(s) a estudiar.
Clasificación de una variable
Discreta
Cuantitativa
Continúa
Variable
Ordinal
Cualitativa
Nominal
5. 5
Variable Cuantitativa es aquella que se expresa en términos de cantidad,
de manera que tiene magnitud y dimensión.
Variable Cualitativa es aquella que se expresa en términos de cualidad o
calidad, de modo que carece de magnitud y dimensión.
Variable Cuantitativa Discreta (VCD) es aquella característica
cuantitativa que en un intervalo cualquiera toma un número finito o
infinito numerable de valores, es decir, toma un número reducido de
valores o un número contable (ó numerable) de valores.
Variable Cuantitativa Continua (VCC) es aquella característica
cuantitativa que en un intervalo cualquiera toma un número infinito de
valores (siempre entre dos valores es posible encontrar un tercero).
6. 6
Variable Cualitativa Ordinal (VCO) es aquella característica cualitativa
que es susceptible de ordenar (de forma creciente o decreciente), por lo
tanto, esta variable acepta cualquier condición de orden (igual, menor,
mayor, menor o igual ó a lo más, mayor o igual ó a lo menos).
Variable Cualitativa Nominal (VCN) es aquella característica cualitativa
que no admite ser ordenada, sólo tiene incidencia su nombre, de allí su
patronímico de “nominal”.
7. 7
Ejemplos de Variables y su clasificación.
Número de pacientes con déficit atencional VCD
Rendimiento académico de un grupo de estudiantes VCC
Nivel Educativo de un grupo de trabajadores VCO
Creencia religiosa de un grupo de personas VCN
Número de patologías de un grupo de estudiantes VCD
Grado de aprendizaje de un grupo de escolares VCO
Región de origen de los pacientes de una consulta VCN
Consumo de fármacos anti ansiolíticos VCC
Nivel de gravedad de un paciente con depresión VCO
Estatura de un grupo de personas VCC
Número de personas del grupo familiar VCD
8. 8
Distribución de Frecuencias.
Es una herramienta estadística diseñada para tabular (ordenar) la
información relativa a una variable en un cuadro o una tabla estadística
que muestra o describe el comportamiento de la variable.
Caso Variable Cuantitativa Discreta.
Una D. de F. consta, verticalmente, de dos cuerpos, uno referido a los
valores de la variable y el otro que corresponde a la frecuencia que
toman los distintos valores de la variable (frecuencias absoluta simple,
relativa simple, absoluta acumulada, relativa acumulada);
horizontalmente se ubican los valores de los intervalos de clase de la
variable.
10. 10
Elementos de la Distribución de Frecuencias VCD
Clase i: corresponde al subíndice i que permite distinguir los distintos
valores de la variable definida por la una D de F.
Valores xi: define cada uno de los valores de la variable
Frecuencia absoluta simple: ni es el número de elementos pertenecientes
al valor xi
Frecuencia relativa simple: hi porcentaje o proporción de elementos que
pertenecen al valor xi
Frecuencia absoluta Acumulada: Ni es el número de elementos que toman
a lo más el valor xi
Frecuencia relativa simple: Hi porcentaje o proporción de elementos que
11. 11
Ejemplo de D de F de VCD
Considere la información relativa al número de estudiantes con déficit
atencional en 30 cursos de un instituto educativo de la Región
Metropolitana, señalada en la siguiente base de datos:
Construya la D de F de la variable en estudio
1° Se debe determinar el valor menor (0) y el valor mayor (5), esto
significa que el recorrido de la variable es 0, 1, 2, 3, 4, 5
2° En una tabla vaciar la información de la B de D, y determinar la
frecuencia absoluta simple (ni), frecuencia relativa simple (hi),
frecuencia absoluta acumulada (Ni) y frecuencia relativa acumulada (Hi).
3 2 4 0 2 4 1 4 1 1
0 1 2 0 2 3 2 5 1 1
1 2 0 1 5 1 1 1 3 3
12. 12
Obteniéndose la siguiente D de F.
La cual permite estudiar el comportamiento de la variable en estudio,
número de estudiantes con déficit atencional, de acuerdo a preguntas
que se pueden plantear, como las siguientes:
a. ¿En cuántos cursos existen dos estudiantes con déficit atencional?
Respuesta: n3 = 6; lo cual significa que en seis cursos existen dos
estudiantes con déficit atencional.
i Xi ni hi Ni Hi
1 0 4 0,13 4 0,13
2 1 11 0,37 15 0,50
3 2 6 0,20 21 0,70
4 3 4 0,13 25 0,83
5 4 3 0,10 28 0,93
6 5 2 0,07 30 1,00
30 1,00
13. 13
b. ¿En qué proporción o porcentaje de cursos hay cuatro estudiantes con
déficit atencional? Respuesta: h5 = 0,10; es decir, en un 10% de los
cursos hay cuatro estudiantes con déficit atencional.
c. ¿En cuántos cursos existen a lo más tres estudiantes con déficit
atencional? Respuesta: N4 = 25; o sea, en 25 de los cursos existen a lo
más tres estudiantes con déficit atencional.
d. ¿En qué porcentaje de cursos hay a lo más dos estudiantes con déficit
atencional? Respuesta: H3 = 0,70; significa que en el 70% de los cursos
hay a lo más dos estudiantes con déficit atencional.
e. ¿En cuántos cursos hay más de dos estudiantes con déficit atencional?
Respuesta: n – N3 = 30 – 21 = 9; quiere decir que en 9 cursos hay más dos
estudiantes con déficit atencional.
14. 14
f. ¿En qué porcentaje de cursos hay más de tres estudiantes con déficit
atencional? Respuesta: 1 – H4 = 1 - 0,83 = 0,17; en el 17% de los cursos
hay más tres estudiantes con déficit atencional.
g. ¿En cuántos cursos hay entre 1 y 3 estudiantes (ambos incluidos) con
déficit atencional? N4 – N1 = 24 – 3 = 21; en 21 cursos hay entre 1 y 3
estudiantes con déficit atencional.
De este modo se pueden plantear muchas otras preguntas que van a
permitir describir el comportamiento de la variable en estudio, número
de estudiantes con déficit atencional.
15. 15
Caso D de F de una VCC.
Igual que en el caso de una D. de F. de VCD, ésta consta, verticalmente,
de dos cuerpos, uno referido a los valores de la variable y el otro que
corresponde a la frecuencia que toman los distintos valores de la
variable (frecuencias absoluta simple, relativa simple, absoluta
acumulada, relativa acumulada); horizontalmente se ubican los valores de
los intervalos de clase de la variable.
En este caso, por tratarse de una variable cuantitativa continúa, surgen
los intervalos de clase, que permiten identificar subclases de valores
entre la totalidad de valores, y las marcas de clase, que son valores
representativos de cada una de las clases o intervalos de clase.
17. 17
Elementos de la Distribución de Frecuencias VCC
Clase i: corresponde al subíndice i que permite distinguir los distintos
intervalos de clase de la variable definida en la una D de F.
Intervalo de clase: Y’i-1 – Y’i: recorrido entre el límite inferior y superior
de la clase i-ésima;
Marca de clase: Yi: elemento representativo de la clase, se calcula como
el promedio aritmético de los límites de la clase i-ésima;
Frecuencia absoluta simple: ni es el número de elementos pertenecientes
al intervalo de clase i-ésima;
Frecuencia relativa simple: hi porcentaje o proporción de elementos que
pertenecen al intervalo de clase i-ésima;
Frecuencia absoluta Acumulada: Ni es el número de elementos que toman
a lo más el valor Y’i (límite superior de la clase i-ésima)
Frecuencia relativa simple: Hi porcentaje o proporción de elementos que
toman a lo más el valor xi
18. 18
Ejemplo de D de F de VCC
Considere la información sobre el Rendimiento Académico, en puntos, de
un grupo de 70 estudiantes de un instituto educativo.
Construya una D de F de nueve intervalos de clase (m = 9) de amplitud
constante.
3,2 5,5 4,0 5,8 3,1 3,9 3,2 3,9 4,2 6,5
2,5 2,8 3,4 5,6 6,3 4,4 5,4 4,8 5,0 5,7
4,7 6,9 5,1 4,0 5,2 3,8 3,8 7,0 5,5 3,3
3,4 4,9 4,8 2,8 5,0 3,2 5,5 3,7 4,1 2,9
5,9 5,5 2,6 3,0 3,4 4,0 4,4 5,6 3,8 4,6
6,4 5,3 4,4 4,2 3,5 3,9 6,4 4,7 6,6 6,7
4,9 3,6 5,4 3,3 4,0 2,6 4,4 4,1 2,6 3,0
19. 19
Para construir la D de F del Rendimiento Académico del grupo de
estudiantes se debe seguir el siguiente algoritmo:
En primer lugar se debe identificar el valor menor (y21 = 2,5) y el valor
mayor de la variable (y38 = 7,0) y así se calcula el recorrido:
R = Ymáx – Ymín = 7,0 – 2,5 = 4,5 (eso quiere decir que en un recorrido de
4,5 puntos se encuentran todos los valores de la variable en estudio).
Luego, se calcula la amplitud (constante) como la relación entre el
recorrido (R = 4,5) y el número de clases de la D de F (m = 9), entonces
la amplitud es: c = R/m = 4,5/9 = 0,5, y así se generan los nueve
intervalos de clase: 2,5 – 3,0; 3,0 – 3,5;… y así sucesivamente.
En seguida, se determina la marca de clase (elemento representativo de
cada clase) Yi, como la semi-suma (ó promedio) de los límites de cada
intervalo: Yi = (Y’i-1+Y’i)/2 el que es utilizado como el elemento
representativo de cada intervalo de clase.
Finalmente se cuentan los elementos pertenecientes a cada intervalo de
clase generándose la frecuencia absoluta simple: ni. (en cada clase se
incluye hasta su límite superior).
20. 20
Obteniéndose la siguiente D de F.
Obsérvese que al realizar el conteo de los elementos pertenecientes a
cada clase, el valor 3,0 se considera en la primera clase y no en la
segunda (los intervalos de clase son cerrados con relación al límite
superior Y’i)
i Y'i-1 Y'i Yi ni hi Ni Hi
1 2,50 3,00 2,75 9 0,13 9 0,13
2 3,00 3,50 3,25 10 0,14 19 0,27
3 3,50 4,00 3,75 12 0,17 31 0,44
4 4,00 4,50 4,25 8 0,11 39 0,56
5 4,50 5,00 4,75 9 0,13 48 0,69
6 5,00 5,50 5,25 9 0,13 57 0,81
7 5,50 6,00 5,75 5 0,07 62 0,89
8 6,00 6,50 6,25 4 0,06 66 0,94
9 6,50 7,00 6,75 4 0,06 70 1,00
70 1,00
21. 21
Algunas preguntas sobre esta D de F.
-¿Cuántos estudiantes obtienen rendimiento entre 5,0 y 5,5 puntos?
Respuesta n6 = 9; existen 9 estudiantes con rendimiento entre 5,0 y 5,5
puntos.
-¿Qué proporción o porcentaje de estudiantes tienen entre 3,5 y 4,0
puntos?
Respuesta h3 = 0,17; significa que hay un 17% de estudiantes que tienen
entre 3,5 y 4,0 puntos.
-¿Cuántos estudiantes obtienen a lo más 5,0 puntos?
Respuesta: N5 = 48; hay 48 estudiantes que obtienen a lo más 5,0
puntos.
-¿Qué porcentaje de estudiantes obtienen a lo más 4,0 puntos?
Respuesta H3 = 0,44; quiere decir que un 44% de los estudiantes
obtienen a lo más 4,0 puntos.
-¿Cuántos estudiantes obtienen entre 3,50 y 6,00 puntos?
Respuesta N7 – N2 = 62 – 19 = 43; existen 43 estudiantes cuyo
rendimiento está entre 3,50 y 6,00 puntos.
22. 22
Caso Variables Cualitativas.
En el caso de las variables cualitativas la D de F es simple, lo único que
debe tenerse en cuenta es el conjunto de valores que toma la variable y
la frecuencia con que ocurren.
Por ejemplo para una variable ordinal como el nivel educativo la D de F
adquiere la siguiente estructura:
Existen cuatro valores. Lea e interprete el significado de las siguientes
cifras: n3 = 15; h2 = 0,4; N2 = 30; H3 = 0,9.
Para una VCN, la situación es de simplísima, puesto que sólo tienen
sentido las fas (ni) y frs (hi).
i
Nivel
Educativo
ni hi Ni Hi
1 Pre escolar 10 0,2 10 0,2
2 Básico 20 0,4 30 0,6
3 Medio 15 0,3 45 0,9
4 Superior 5 0,1 50 1,0
50 1,0
23. 23
Representación Gráfica.
La representación gráfica será tratada mediante el uso del software
Excel y se revisa en una clase que se realiza en el laboratorio de
computación utilizando un algoritmo desarrollado para esta finalidad.
Se desarrollan gráficos para:
fas (ni): histograma;
frs (hi): gráfico circular;
FAA (Ni): ojiva