Estadistica_Descriptiva_II (1).pptx

Estadística Descriptiva I
(Análisis estadístico de datos)
Profesor: Javier Tomás Morales López

• Frecuencias y porcentajes
• Medidas de tendencia central
• Medidas de posición
• Medidas de dispersión
• Medidas de distribución
Estadística
descriptiva
• Tablas
• Gráficas
• Media
• Mediana
• Moda
• Mediana
• Percentiles
• Cuartiles
• Varianza muestral
• Desviación estándar
• Rango
• Asimetría
• Curtosis
Estadística descriptiva

• en una investigación. Son todos aquellos atributos que
se pueden medir, controlar y estudiar
• Son construcciones hipotéticas o propiedades que se
estudian.
• Es una propiedad que adquiere distintos valores a la
que se le asignan números o valores.
Variables
• Categóricas
(Cualitativas)
• Numéricas
(Cuantitativas)
El fenómeno tiene valores referidos a clasificaciones o categorías sin
un correlato numérico directo. Ejemplo: Sexo (hombres y mujeres),
estado civil (soltero, casado, divorciado, etc.).
Los valores se presentan en números. Esto es, las respuestas a las
preguntas van a ser datos numéricos. Ejemplo: Edad, Peso, Talla, etc.
Variables

Estado civil
Dicotómica Politómica
• Con pareja
• Sin pareja
• Soltero
• Casado
• Viudo
• Divorciado
• Unión libre
• Dicotómicas
• Politómicas
Sólo existen dos valores. Se refiere a la existencia o no
existencia de la característica. Clasificación en dos
categorías. Ejemplo: Sexo: Masculino y femenino.
El fenómeno puede presentarse en grados, magnitudes o
medidas distintas. Ejemplo: Edad, religión, estado civil,
sueldo, estatura, etc.

La edad es una variable numérica por naturaleza, pero en ocasiones
debe convertirse en categórica para el mejor manejo de la
información, como se muestra a continuación:
Ejemplo…
Edad
Edad categórica Adolescentes Jóvenes Adultos jóvenes
Edad numérica 11, 12, 13, 14, 15 16, 17, 18, 19, 20 21, 22, 23, 24, 25

Escalas de medición
(Niveles)
• Es el nivel de medida más básico.
• Agrupa unidades en categorías con
base en uno o más atributos.
• No existe un correlato numérico.
• Las categorías no reflejan ningún orden
o jerarquía entre unas y otras.
Ejemplos:
Sexo, estado civil, carrera,
religión, deporte favorito,
ocupación, pasatiempo,
etc.
Nominal

• Las observaciones pueden colocarse en un orden
jerárquico.
• No existe una diferencia exacta entre un valor y
otro. Esto es, no se sabe si hay la misma distancia
entre una categoría y otra.
• No hay indicación de cuanto se posee del atributo.
Ordinal
Ejemplos: Escolaridad,
grado académico, puesto en el trabajo,
semestre, etc.

• Son valores numéricos consecutivos: marcan
intervalos o cantidades iguales entre ellos.
• No tienen un cero absoluto, esto es, el cero no
representa la ausencia de la característica, puede
ser un valor más de la escala.
• Se sabe cuanto se diferencian los sujetos, uno de
otro, con respecto a la media poblacional.
Intervalo
Ejemplo: La diferencia
Entre un CI de 120 a 125, es la
misma que entre 112 y 117
(diferencia= 5).

• Tiene las mismas características que los de
intervalo, pero el cero es absoluto, esto es, indica
la ausencia de la característica.
• Inicia la medición a partir de cero, y se puede
comparar un sujeto con respecto al cero absoluto.
• Las medidas físicas, en su mayoría, tienen este
nivel de medición.
Razón o
proporción
Ejemplos: Longitud,
tiempo, peso, área, costo por
estudiante, calificaciones,
etc.

Características de los niveles de medición
Nominal Ordinal Intervalo Razón
A es diferente de B √ √ √ √
A es mayor que B √ √ √
A excede en (x) unidades a B √ √
A excede en (x %) a B √
Nominal Ordinal Intervalo
Sexo Escolaridad Edad
• Hombre
• Mujer
• Primaria
• Secundaria
• Bachillerato
• Licenciatura
• 6
• 8
• 12
• 17
Dicotómica Politómica Politómica

Aplicaciones
en Psicología
• Nominal: Pacientes clasificados por padecimientos,
fumadores y no fumadores, personas que tienen
una enfermedad o no la tienen.
• Ordinal: Nivel de patología: Ausente, leve,
moderado, alto.
• Intervalo: Calificación de inteligencia, autoestima,
depresión.
• Razón: Tiempo en el que la rata cruza un laberinto,
tiempo de reacción, promedio escolar.

Frecuencias
La recolección de datos constituye la materia prima con la que
trabaja un investigador. La información estadística puede
comunicarse más fácilmente si se organiza en tablas y se muestra
en gráficas.
Al resumir grandes colecciones de datos, resulta útil distribuirlos
en clases o categorías, y determinar el número de individuos que
pertenecen a cada clase, lo cual se denomina frecuencia de clase.
Así, las frecuencias son el número de veces que ocurre un evento.

Una disposición tabular de los datos por clases junto con las
correspondientes frecuencias de clase se conoce como distribución
de frecuencias o tabla de frecuencias. Existen dos tipos de tablas de
frecuencia:
Tablas de frecuencias
• De datos no agrupados
• De datos agrupados
Tablas de
frecuencias

La distribución de frecuencias no agrupadas contiene en una
columna todos los valores y en la otra la cantidad de veces que este
valor o categoría se presenta. Esto es, su frecuencia (f ). Ejemplos:
La tabla 1 muestra la distribución del sexo de 800 empleados, donde
600 son hombres y 200 mujeres.
Tabla de frecuencia
de datos no agrupados…

En la tabla 2 se observa
que se entrevistaron a 40 personas
entre 60 y 74 años, donde las edades
más frecuentes fueron
67 y 71 años.

Categoría
(x )
Frecuencia
absoluta
( f )
Frecuencia
acumulada
(f a )
Frecuencia
relativa
(f r)
F. relativa
acumulada
(f a )
Frecuencia
porcentual
(% )
F. porcentual
acumulada
(% a )
Total
17 18 15 16 19
20 16 18 17 18
19 17 15 16 19
16 20 18 17 18
20 15 19 18 20
18 16 17 15 19
19 - - - -
Datos
(x )
Tabla de frecuencia de datos no agrupados: ejercicio

Categoría
(x )
Frecuencia
absoluta
( f )
Frecuencia
acumulada
(f a )
Frecuencia
relativa
(% )
F. relativa
acumulada
(% a )
Frecuencia
porcentual
F. porcentual
acumulada
15 4 4 0.129 0.129 12.9 % 12.9 %
16 5 9 0.161 0.290 16.1 % 29.0 %
17 5 14 0.161 0.451 16.1 % 45.1 %
18 7 21 0.226 0.667 22.6 % 66.7 %
19 6 27 0.194 0.871 19.4 % 87.1 %
20 4 31 0.129 1 12.9 % 100 %
Total n = 31 _ 1 _ 100 % _
17 18 15 16 19
20 16 18 17 18
19 17 15 16 19
16 20 18 17 18
20 15 19 18 20
18 16 17 15 19
19 - - - -
Datos
(x )
Tabla de frecuencia de datos no agrupados: ejercicio

Sus valores se presentan en intervalos. Se utilizan únicamente con
variables numéricas y cuando la variabilidad de los datos es muy
amplia.
Tabla de frecuencia de datos agrupados…
1. Calcular el rango (r )
2. Determinar el número de intervalos (k )
3. Determinar el ancho del intervalo (w )
4. Especificar los límites del intervalo
5. Hallar las frecuencias de clase
Pasos para
construir una distribución
de frecuencia agrupada:

1. Calcular el rango: El rango es la diferencia entre el valor más
grande y el valor más pequeño de la distribución de datos.
Suponiendo que
el mayor dato sea 20 y
el menor sea 15, el rango
corresponde a:
20 – 15 = 5.
Rango: r = x máx – x mín

2. Determinar el número de intervalos: Lo más indicado es tomar
entre 5 y 20 intervalos de clase, según la distribución de los datos.
Generalmente se utilizan 7, pero esto depende de los objetivos del
investigador, y de la variabilidad de datos. Así, si los datos varían
poco es recomendable agruparlos en pocos intervalos y viceversa.
Otro método
es usar la regla de Sturges :
k = 1+ 3,322 log n
Regla de Sturges: k = 1+ 3,322 log n

3. Determinar el ancho del intervalo (w): Se calcula dividiendo el
rango (r ) entre el número de intervalos (k ). Siempre debe ser un
número entero o redondearse para que lo sea.
𝑤 =
𝑟
𝑘
• Rango= r
• número de intervalos= k

4. Especificar los límites del intervalo: Deben ser estandarizados para
evitar las decisiones contrarias en cada caso:
• Límite inferior: El primer intervalo comienza con el múltiplo de w (amplitud
o ancho del intervalo) que sea menor o igual al mínimo del r (rango).
Ejemplo: si w = 3, y el valor mínimo de la distribución es 62 deberá iniciarse
en 60.
• Límite superior: Debe sumarse el límite inferior de cada intervalo con el
resultado de restar una al rango. El intervalo debe comenzar con un múltiplo
de w. El primer intervalo comienza con el múltiplo de w que sea menor o
igual al mínimo del rango: límites inferiores + (w-1).
5. Hallar las frecuencias de clase: Contar los valores que caen en cada
intervalo para encontrar la frecuencia de cada intervalo.

Hagamos un ejemplo
con los siguientes datos…
1. Calcular el rango: El rango es la diferencia
entre el valor más grande y el valor más
pequeño de la distribución de datos.
El dato mayor es 74
y el menor 60, el rango corresponde
a: 74 – 60 = 14.
Rango = 14

𝒘 =
𝒓
𝒌
𝒘 =
14
5
= 2.8
𝒘 =
𝑟𝑎𝑛𝑔𝑜
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠
2. Determinar el número de intervalos (k ): Se toman entre 5 y 20
intervalos de clase. Generalmente se utilizan 7, así que para el
ejemplo, inclusive podemos tomar el 5.
3. Determinar el ancho del intervalo (w): Se calcula dividiendo el
rango (r ) entre el número de intervalos (k ).
Redondeado:
W = 3

4. Especificar los límites del intervalo:
• Límite inferior: es el valor menor con incrementos de w: 60, 63, 66, 69, 72.
• Limite superior: a los límites inferiores les aplicamos (w-1): 62, 65, 68, 71, 74.
De este lado
está el límite inferior
De este lado
está el límite superior

5. Hallar las frecuencias de clase:
Contar los valores que caen en cada
intervalo para encontrar su frecuencia.
Es importante considerar
que no siempre resulta exacto el
número de intervalos debido
a la regla de los rangos.

Frecuencias relativas o porcentajes (%): La frecuencia relativa de una
clase es su frecuencia dividida por la frecuencia total de todas las clases
y multiplicada por 100. Se expresa generalmente como porcentaje.
• La frecuencia relativa (F) de la clase (66–68), de la tabla de frecuencias, es 13.
Después se divide entre el total que es 40, y se multiplica por 100:
13
40
(100) = 32.5

Tabla de frecuencia de datos agrupados: ejercicio
Las notas de 35 alumnos, en un examen de estadística, van del 0 al 10. Con los
datos proporcionados, elabora una tabla de frecuencias con 5 intervalos o clases.
• Datos: 0; 0; 0; 0; 1; 1; 1; 1; 2; 2; 2; 3; 3; 3; 3; 4; 4; 4; 4; 5; 5; 5; 5; 6; 6; 6; 7; 7; 7; 8;
8; 8; 9; 10; 10.
Intervalo
Marca
de clase
(x )
Frecuencia
absoluta
( f )
Frecuencia
acumulada
(f a )
Frecuencia
relativa
(f r)
F. relativa
acumulada
(f a )
Frecuencia
porcentual
(% )
F. porcentual
acumulada
(% a )
[ )
[ )
[ )
[ )
[ ] 35 1 100
Total 35 1 100

Intervalo
Marca
de clase
Frecuencia
absoluta
( f )
Frecuencia
acumulada
(f a )
Frecuencia
relativa
(f r)
F. relativa
acumulada
(f a )
Frecuencia
porcentual
(% )
F. porcentual
acumulada
(% a )
[0-2) 1 8 8 0.229 0.229 22.9 22.9
[2-4) 3 7 15 0.200 0.429 20 42.9
[4-6) 5 8 23 0.229 0.658 22.9 65.8
[6-8) 7 6 29 0.171 0.829 17.1 82.9
[8-10] 9 6 35 0.171 1 17.1 100
Total 35 1 100
Solución:
• Hallamos el rango: r = x máx – x mín = 10 – 0 = 10.
• El número de intervalos: k = 5.
• Calculamos la amplitud de clase: w = r/k = 10/5 = 2
• Ahora hallamos los límites inferiores y superiores de cada clase, y elaboramos la tabla de
frecuencias.

Medidas de tendencia central y dispersión
(Para datos no agrupados)
=
𝑥
𝑛
Media
Recuerda que la
moda (Mo) es el dato más
frecuente, y que mediana (Md)
es la posición central.

𝑆 =
𝑥 − 𝑥 2
𝑛
𝑠2
=
𝑥 − 𝑥 2
𝑛
El concepto
de dispersión se refiere a la
variabilidad entre un conjunto de
observaciones.
Varianza
Desviación estándar
Dispersión
Aleatoria Uniforme Agrupada

Mediana (Md) para datos no agrupados…
Procedimiento: Ordenar
los datos de manera ascendente o descendente.
Identificar la posición de la mediana, mediante alguna
de las siguientes fórmulas:
El resultado de la fórmula se
busca en las frecuencias
acumuladas. A ese dato se le
conoce como posición de la
mediana.

Medidas de tendencia central y dispersión
(Para datos agrupados)
=
𝑓𝑥
𝑁
Media
En donde: x = punto medio
o marca de clase, f = frecuencia
n = número de datos.

Md = 𝑳𝒊 +
𝒏
𝟐
− 𝒇𝒂 −𝟏
𝒇
𝒘
Mediana:
Descripción de la mediana:
• Li = límite inferior del intervalo
•
𝒏
𝟐
= número de datos dividido
entre dos.
• ( fa - 1 ) = frecuencia acumulada
del intervalo anterior.
• f = frecuencia absoluta del
intervalo.
• w = amplitud (ancho) del
intervalo.

Mo = 𝑳𝒊 +
𝒇− 𝒇−𝟏
[𝒇 − 𝒇−𝟏 ]+[𝒇 −(𝒇+𝟏)]
𝒘
Moda:
Descripción de la mediana:
• Li = límite inferior del
intervalo.
• (f + 1 ) = frecuencia del
intervalo posterior.
• ( f - 1 ) = frecuencia del
intervalo anterior.
• f = frecuencia absoluta
del intervalo.
• w = amplitud (ancho) del
intervalo.

σ =
𝑓 𝑥−𝜇 2
𝑁
σ 2 =
𝑓 𝑥−𝜇 2
𝑁
Varianza
En este caso, se
trata de las medidas de dispersión
de la población.

𝑆 =
𝑓 𝑥 − 𝑥 2
𝑛 − 1
𝑠2
=
𝑓 𝑥 − 𝑥 2
𝑛 − 1
Varianza
Y aquí están
las medidas de dispersión
de la muestra.

Intervalo x f f x 𝒙 − 𝒙 𝒙 − 𝒙 𝟐 𝒇 𝒙 − 𝒙 𝟐
[0-2) 1 8
[2-4) 3 7
[4-6) 5 8
[6-8) 7 6
[8-10] 9 6
Total n= 35 - -
Con los datos de la anterior tabla de frecuencias para datos
agrupados, calcular media, varianza y desviación estándar de la
muestra (por ahora no calcular la Mo y la Md).
Marca de clase

Intervalo x f f x 𝒙 − 𝒙 𝒙 − 𝒙 𝟐
f 𝒙 − 𝒙 𝟐
[0-2) 1 8 8 -3.71 13.77 110.11
[2-4) 3 7 21 -1.71 2.92 20.44
[4-6) 5 8 40 0.29 0.08 0.64
[6-8) 7 6 42 2.29 5.24 31.44
[8-10] 9 6 54 4.29 18.40 110.40
Total n = 35 165 - - 273.03
Solución:
• 𝒙 = 4.71
• s 2 = 8.03
• s = 2.83
Marca de clase
Para una muestra

Intervalo x f f x 𝒙 − 𝝁 𝒙 − 𝝁 𝟐 𝒇 𝒙 − 𝝁 𝟐
[0-2) 1 8
[2-4) 3 7
[4-6) 5 8
[6-8) 7 6
[8-10] 9 6
Total n = 35 - -
Si suponemos que el total de alumnos (n = 35) representa la
población, calcular la varianza y desviación estándar
Marca de clase

Intervalo X f f x 𝒙 − μ 𝒙 − μ 𝟐 f 𝒙 − μ 𝟐
[0-2) 1 8 8 -3.71 13.77 110.11
[2-4) 3 7 21 -1.71 2.92 20.44
[4-6) 5 8 40 0.29 0.08 0.64
[6-8) 7 6 42 2.29 5.24 31.44
[8-10] 9 6 54 4.29 18.40 110.40
Total n = 35 165 - - 273.03
Solución:
• μ = 4.71
• σ 2 = 7.80
• σ = 2.79
Para una población
Marca de clase

Intervalo
Marca
de clase
(x)
Frecuencia
absoluta
( f )
Frecuencia
acumulada
(f a )
[0-2) 1 8 8
[2-4) 3 7 15
*[4-6) 5 8 23
[6-8) 7 6 29
[8-10] 9 6 35
Total 35
Ahora llego el
momento de calcular la mediana…
Md = 𝑳𝒊 +
𝒏
𝟐
− 𝒇𝒂 −𝟏
𝒇
𝒘
Media = 4.71
Posición = 18
Posición =
𝑛+1
2
=
36
2
= 18

Intervalo
Marca
de clase
(x)
Frecuencia
absoluta
( f )
Frecuencia
acumulada
(f a )
[0-2) 1 8 8
[2-4) 3 7 15
*[4-6) 5 8 23
[6-8) 7 6 29
[8-10] 9 6 35
Total 35
Md = 𝑳𝒊 +
𝒏
𝟐
− 𝒇𝒂 −𝟏
𝒇
𝒘
• Li = 4
•
𝒏
𝟐
= 17.5
• (fa -1) = 15
• f = 8
• w = 2
Md = 4 +
17.5 −15
8
2 = 4.62
Media = 4.71
Posición = 18

Intervalo
Marca
de clase
(x)
Frecuencia
absoluta
( f )
Frecuencia
acumulada
(f a )
[0-2) 1 8 8
[2-4) 3 7 15
*[4-6) 5 8 23
[6-8) 7 6 29
[8-10] 9 6 35
Total 35
• Li = 4
• (f - 1) = 7
• (f +1) = 6
• f = 8
• w = 2
Mo = 4 +
8 −7
(8−7)+(8−6)
2
Ahora
calcular la moda…
Mo = 𝑳𝒊 +
𝒇− 𝒇−𝟏
[𝒇 − 𝒇−𝟏 ]+[𝒇 −(𝒇+𝟏)]
𝒘
Mo = 4 +
1
(1)+(2)
2 = 4.66

Ejercicio: con los datos de la tabla calcula la mediana y la moda…
Intervalo
Marca
de clase
(x )
Frecuencia
absoluta
( f )
Frecuencia
acumulada
(f a )
[0-20) 10 9 9
[20-40 ) 30 11 20
[40-60) 50 15 35
[60-80) 70 9 44
[80-100] 90 7 51
Total - N= 51 -
Md = 𝑳𝒊 +
𝒏
𝟐
− 𝒇𝒂 −𝟏
𝒇
𝒘
Mo = 𝑳𝒊 +
𝒇− 𝒇−𝟏
[𝒇 − 𝒇−𝟏 ]+[𝒇 −(𝒇+𝟏)]
𝒘

Mediana
Intervalo
Marca
de clase
(x )
Frecuencia
absoluta
( f )
Frecuencia
acumulada
(f a )
[0-20) 10 9 9
[20-40 ) 30 11 20
*[40-60) 50 15 35
[60-80) 70 9 44
[80-100] 90 7 51
Total - N= 51 -
Md = 𝑳𝒊 +
𝒏
𝟐
− 𝒇𝒂 −𝟏
𝒇
𝒘
• Li = 40
•
𝒏
𝟐
= 25.5
• (fa -1) = 20
• f = 15
• w = 20
Md = 40 +
25.5−20
15
20 = 47.33

Intervalo
Marca
de clase
(x )
Frecuencia
absoluta
( f )
Frecuencia
acumulada
(f a )
[0-20) 10 9 9
[20-40 ) 30 11 20
[40-60) 50 15 35
[60-80) 70 9 44
[80-100] 90 7 51
Total - N= 51 -
Mo = 𝑳𝒊 +
𝒇− 𝒇−𝟏
[𝒇 − 𝒇−𝟏 ]+[𝒇 −(𝒇+𝟏)]
𝒘
Moda
• Li = 40
• (f -1) = 11
• (f +1) = 9
• f = 15
• w = 20
Mo = 40 +
15−11
(15−11)+(15 −9)
20
Mo = 40 +
4
(4)+(6)
20 = 48

Bibliografía
González, F., Escoto Ponce de León, M. & Chávez, J. (2017). Estadística aplicada en
Psicología y Ciencias de la Salud. México: El Manual Moderno.
Hernández-Sampieri, R., Fernández C. & Baptista, P. (2003). Metodología de la in-
vestigación (3ª ed). México: Mc Graw Hill.
Kerlinger, F. N. & Lee, H. B. (2002). Investigación del comportamiento (4ª ed). México:
Mc Graw Hill.
Marques-Dos Santos, M.J. (2004). Probabilidad y estadística para ciencias químico
biológicas (2ª ed). México: Universidad Nacional Autónoma de México.

Estadistica_Descriptiva_II (1).pptx

Estadistica_Descriptiva_II (1).pptx

Recomendados

Recomendados

Más contenido relacionado

Similar a Estadistica_Descriptiva_II (1).pptx

Similar a Estadistica_Descriptiva_II (1).pptx (20)

Último

Último (20)

Estadistica_Descriptiva_II (1).pptx