SlideShare una empresa de Scribd logo
1 de 18
Descargar para leer sin conexión
Medidas de dispersión 
167 
CAPÍTULO 15 
MEDIDAS DE DISPERSIÓN 
En el capítulo anterior se estudiaron las medidas de tendencia central, que son un indicador de 
cómo los datos se agrupan o concentran en una parte central del conjunto. Sin embargo, para una 
información completa de dicho conjunto de datos hace falta saber el comportamiento opuesto, es 
decir, de qué manera se dispersan o se alejan al-gunos 
datos de esa parte central. 
Por ejemplo, al tomar las temperaturas en una 
región “A” durante diferentes épocas del año y a 
distintas horas del día, se registraron los datos 
que se muestran en la columna “A” ; por su par-te, 
las de otra región diferente “B”, son las de la 
columna “B” . 
Al obtener la media, en ambos casos resultó 
que la temperatura promedio fue de 20.68º, cuya 
interpretación podría ser que en torno, al rededor 
o cerca a 20.68º fluctúan los demás valores. 
A B 
19.3º - 3º 
20º 0º 
20.2º 6º 
20.4º 22º 
21º 31.5º 
21.3º 34º 
21.3º 36º 
22º 39º 
Promedio: 20.68º 20.68º
Medidas de dispersión 
Como puede verse, eso es bastante aproximado para los datos de la columna “A”, no así para los 
de la “B”. Los datos más alejados en “A” son 19.3º y 22º, que realmente están próximos a 20.68º; 
en cambio, los datos más alejados en “B” son -3º y 39º, que están muy distantes del promedio. 
¿Por qué si en ambos casos se tiene igual promedio, no se puede afirmar lo mismo de los valores 
que están a su alrededor?. La respuesta está en que no se ha tomado en cuenta la dispersión, es 
decir, la manera en que se disgregan los datos respecto de la media, pues en “A” casi no se disper-san 
mientras que en “B” sí, .Cabría decir que el conjunto de datos “A” es bastante compacto 
168 
mientras que el “B” es muy dilatado. 
Las principales medidas de dispersión son tres: El rango, la desviación media y la desviación 
estándar. De manera semejante a las medidas de tendencia central, las medidas de dispersión deben 
considerarse en sus dos opciones: cuando no están agrupados los datos y cuando están por interva-los. 
15.1 EL RANGO 
El rango es la diferencia entre los datos mayor y menor del conjunto. También se le suele llamar 
“recorrido” . 
En un conjunto de datos, mientras mayor sea el rango, mayor será su dispersión y, a la inversa, 
mientras menor sea su rango, menor su dispersión. 
En los casos de las temperaturas del ejemplo anterior, el rango de “A” es R = 22 - 19.3 = 2.7, 
en cambio, el de “B” es B = 39 - (-3) = 42. 
15.2 LA DESVIACIÓN MEDIA 
Dado un conjunto de datos cuya media aritmética o promedio es x , la diferencia o la distancia 
de cada valor nominal x a la media aritmética se llama desviación del dato x con respecto a la 
media x . Es decir, es una medición de cuánto se alejó cada valor nominal x de la media.
Medidas de dispersión 
169 
Por ejemplo, de los datos mostrados en la 
tabla de la derecha, la media aritmética es 
450 75 
6 
x = = 
entonces 
La desviación del dato x = 50 con res-pecto 
de la media es d = 50 - 75 = - 25. Lo 
mismo puede decirse de los demás datos. 
Resulta obvio que siendo la media arit-mética 
x el punto central de todos los valo-res 
de los datos x, existan simétricamente 
x d 
50 50 - 75 = - 25 
60 60 - 75 = - 15 
70 70 - 75 = - 5 
80 80 - 75 = 5 
90 90 - 75 = 15 
100 100 - 75 = 25 
Σx = 450 
valores positivos y negativos, o lo que es lo 
mismo, la suma de todas las desviaciones a la media siempre es cero. Para evitar lo anterior, dicha 
suma se toma como valor absoluto, esto es 
La desviación del dato x = 50 con respecto de la media x es d = 50 − 75 = 25 
La desviación del dato x = 60 con respecto de la media x es d = 60 − 75 = 15 
y así sucesivamente. 
15.2.1 LA DESVIACIÓN MEDIA PARA FRECUENCIAS SIMPLES 
Cuando los datos recolectados han sido organizados en una tabla de frecuencias simples, es 
decir, sin agrupar, la desviación media DM se calcula por medio de la fórmula:
Medidas de dispersión 
f x x 
170 
DM 
n 
− 
= Σ 
Por lo tanto, deben añadirse a la tabla original tres columnas: la primera encabezada con fx, que 
servirá para calcular la media aritmética; la segunda encabezada con x − x , que servirá para 
obtener la tercera, f x − x con la que se obtiene el numerador de la fórmula luego de realizar su 
sumatoria. 
Ejemplo 1: Obtener la desviación media del conjunto de datos 
mostrado en la tabla de la derecha. 
Solución: La tabla de la derecha es la original a la que deben 
agregársele tres columnas: 
a) la primera columna agregada se encabeza con 
fx que representa la multiplicación de cada fre-cuencia 
f por su respectivo valor nominal x . 
Al concluir de llenar esta columna se debe efec-tuar 
la sumatoria Σ f x para calcular la media 
aritmética. Ver la tabla completa en la siguiente 
página. 
b) la segunda columna agregada se encabeza con 
x − x , que representa el valor absoluto de la 
resta de cada valor nominal x menos la media 
x obtenida en el paso anterior, y 
edad 
x f 
45 2 
46 1 
47 3 
48 3 
49 5 
50 6 
51 2 
52 4 
53 2 
28
Medidas de dispersión 
c) la tercera columna agregada se encabeza con f x − x , que representa la multipli-cación 
de cada frecuencia f (2ª columna) por el valor absoluto correspondiente 
x f fx x − x f x − x 
45 2 90 4.357 8.714 
46 1 46 3.357 3.357 
47 3 141 2.357 7.071 
48 3 144 1.357 4.071 
49 5 245 0.357 1.785 
50 6 300 0.643 3.858 
51 2 102 1.643 3.286 
52 4 208 2.643 10.572 
53 2 106 3.643 7.286 
28 1382 50 
171 
obtenido en la 4ª columna. 
Al concluir de llenar esta columna se debe efectuar la sumatoria Σ f x − x . 
La tabla, con esas columnas agregadas, queda así: 
f x 
x 
f 
= Σ 
Σ
Medidas de dispersión 
1382 49 357 
28 
x = = . 
172 
Por lo tanto 
f x x 
DM 
− 
f 
= Σ 
Σ 
50 1 785 
28 
DM = = . 
Esto significa que el promedio de alejamiento de todos los valores respecto de la media 
(de 49.357) es de 1.785. 
C U E S T I O N A R I O 11 
1) Obtener la desviación media de los datos organizados en el cuestionario 2.
Medidas de dispersión 
15.2.2 LA DESVIACIÓN MEDIA CON TABLAS POR INTERVALOS 
Cuando los datos han sido organizados en clases o intervalos, la desviación media se obtiene de 
manera similar a los procesos anteriores, es decir, con la misma fórmula aplicada a la organización 
de frecuencias simples, solamente que x debe ser el punto medio del intervalo. 
Esto significa que al conjunto de datos original deben añadirse a la tabla ahora cuatro columnas: 
la primera encabezada con x para señalar el punto medio de cada intervalo; la segunda encabezada 
con fx que servirá para calcular la media aritmética; la tercera encabezada con x − x que servirá 
para obtener la cuarta, y la cuarta con f x − x que servirá para obtener el numerador de la 
fórmula luego de realizar su sumatoria. 
Ejemplo 1: Cien datos recolectados se organizaron en 
siete intervalos, los que se muestran en la 
tabla de la derecha. Obtener la desviación 
media. 
Solución: La tabla de la derecha es la original a la que 
deben agregársele cuatro columnas: 
a) la primera columna agregada se encabeza 
con x que representa el punto medio de 
cada intervalo. Ver la tabla completa en la 
siguiente página. 
b) la segunda columna agregada se encabeza con fx. 
Al concluir de llenar esta columna se debe efectuar la sumatoria Σ f x para calcu-lar 
la media aritmética: 
173 
intervalo f 
4 - 9 12 
10 - 15 11 
16 - 21 13 
22 - 27 19 
28 - 33 21 
34 - 39 16 
40 - 45 8 
100
Medidas de dispersión 
Σ 
f x 
= Σ 
2486 24 86 
x = = . 
174 
x 
f 
100 
c) la tercera columna agregada se encabeza con x − x que representa el valor absolu-to 
de la resta de cada punto medio x del intervalo menos la media x obtenida en el 
paso anterior. Esta columna podría omitirse y directamente construir la del inciso d). 
d) la cuarta columna agregada se encabeza con f x − x que representa la multiplica-ción 
de cada frecuencia f (2ª columna) por el valor absoluto correspondiente obteni-do 
en la 5ª columna. Al concluir de llenar esta columna se debe efectuar la sumatoria 
Σ f x − x . 
intervalo f x fx x − x f x − x 
4 - 9 12 6.5 78 18.36 220.32 
10 - 15 11 12.5 137.5 12.36 135.96 
16 - 21 13 18.5 240.5 6.36 82.68 
22 - 27 19 24.5 465.5 0.36 6.84 
28 - 33 21 30.5 640.5 5.64 118.44 
34 - 39 16 36.5 584 11.64 186.24 
40 - 45 8 42.5 340 17.64 141.12 
100 2486 891.6
Medidas de dispersión 
= Σ 
891 6 8 916 
DM = . = . 
175 
f x x 
DM 
n 
− 
100 
Esto significa que el promedio de alejamiento de todos los valores respecto de la media, 
es de 8.916. 
C U E S T I O N A R I O 12 
1) Obtener la desviación media de los datos organizados en el cuestionario 3.
Medidas de dispersión 
176 
15.3 LA DESVIACIÓN ESTÁNDAR 
La tercera medida de dispersión se llama desviación estándar, porque con ella se pueden estan-darizar 
en todos los casos, todas las desviaciones de datos recolectados, como se verá más adelante. 
La desviación estándar se simboliza con la letra griega σ si se trata de una población y con la 
letra s si se trata de una muestra. 
Aquí el truco para quitar los valores negativos de la resta de x − x es, aproximadamente, elevar 
al cuadrado y luego regresar con una raíz cuadrada. 
15.3.1 LA DESVIACIÓN ESTÁNDAR PARA FRECUENCIAS SIMPLES 
Cuando los datos están ordenados en una distribución de frecuencias simples, la desviación 
estándar para una población se calcula mediante la fórmula 
( )2 f x x 
n 
σ 
− 
= Σ 
en donde σ = desviación estándar de la población 
f = frecuencia 
x = valor nominal 
x = media aritmética 
Cuando los datos están ordenados en una distribución de frecuencias simples, la desviación 
estándar para una muestra se calcula mediante la fórmula 
( )2 
1 
f x x 
s 
n 
− 
= 
− 
Σ
Medidas de dispersión 
en donde s = desviación estándar de la muestra 
177 
f = frecuencia 
x = valor nominal 
x = media aritmética 
Significa que a la tabla original hay que agregarle cuatro columnas, aunque la segunda es 
opcional. La primera encabezada con fx, servirá para calcular la media aritmética. La segunda 
(opcional) encabezada con ( x − x ) . La tercera con los cuadrados de la anterior, es decir con 
( )2 . Y la cuarta con el producto de la frecuencia f por la anterior, o sea . x − x ( )2 f x − x 
Ejemplo 1: Obtener la desviación estándar del conjunto de datos 
de la muestra de la siguiente tabla. 
Solución: La tabla de la derecha es la original a la que deben 
agregársele cuatro columnas: 
a) la primera columna agregada se encabeza con fx 
que representa la multiplicación de cada frecuencia 
f por su respectivo valor nominal x. Al concluir de 
llenar esta columna se debe efectuar la sumatoria 
Σ f x para calcular la media aritmética: 
f x 
x 
= Σ 
n 
1382 49 357 
28 
x = = . 
x f 
45 2 
46 1 
47 3 
48 3 
49 5 
50 6 
51 2 
52 4 
53 2 
28
Medidas de dispersión 
(ver tabla completa de la siguiente página) 
b) la segunda columna agregada se encabeza con ( x − x ) que representa la resta de 
cada valor nominal x menos la media x obtenida en el paso anterior. Esta columna 
es opcional, pues directamente se puede elevar al cuadrado y el respectivo valor 
vaciarlo en la columna que se especifica en el siguiente inciso; de la siguiente forma: 
primera fila: x − x = 45 - 49.3571 = - 4.3571 
segunda fila: x − x = 46 - 49.3571 = - 3.3571 
tercera fila: x − x = 47 - 49.3571 = - 2.3571 
cuarta fila: x − x = 48 - 49.3571 = - 1.3571 
quinta fila: x − x = 49 - 49.3571 = - 0.3571 
c) la tercera columna agregada, o segunda en caso de haber omitido la anterior, se 
encabeza con ( )2 que representa el cuadrado de cada valor obtenido en la x − x 
columna anterior: 
primera fila: ( )2 = (- 4.3571)2 = 18.9843 x − x 
segunda fila: ( )2 = (- 3.3571)2 = 11.2701 x − x 
tercera fila : ( )2 = (- 2.3571)2 = 5.5559 x − x 
cuarta fila: ( )2 = (- 1.3571)2 = 1.8417 x − x 
quinta fila: ( )2 = (- 0.3571)2 = 0.1275 x − x 
d) la siguiente columna agregada se encabeza con ( )2 que representa el pro- f x − x 
ducto de cada frecuencia f por su correspondiente cuadrado obtenido en la columna 
anterior. 
178
Medidas de dispersión 
La tabla con esas columnas agregadas queda así: 
x f fx ( )2 x − x ( )2 f x − x 
45 2 90 18.9834 37.9668 
46 1 46 11.2694 11.2694 
47 3 141 5.5554 16.6662 
48 3 144 1.8414 5.5242 
49 5 245 0.1274 0.6370 
50 6 300 0.4134 2.4804 
51 2 102 2.6994 5.3988 
52 4 208 6.9854 27.9416 
53 2 106 13.2714 26.5428 
28 1382 134.4272 
Se tiene con esta tabla toda la información requerida para utilizar la fórmula de la 
desviación estándar para una muestra: 
s = . 
179 
( )2 
1 
f x x 
s 
n 
− 
= 
− 
Σ 
134 4272 
28 − 
1 
s = 2.231
Medidas de dispersión 
Para calcular la desviación estándar de una muestra a veces puede resultar más simple emplear 
la siguiente fórmula: 
Σ Σ 
x f x2 fx2 fx 
45 2 2025 4050 90 
46 1 2116 2116 46 
47 3 2209 6627 141 
48 3 2304 6912 144 
49 5 2401 12005 245 
50 6 2500 15000 300 
51 2 2601 5202 102 
52 4 2704 10816 208 
53 2 2809 5618 106 
28 68346 1382 
180 
( )2 
2 
1 
f x 
f x 
− 
s n 
n 
= 
− 
Aplicándola a la tabla del ejemplo anterior, se tiene que 
( )2 1382 
68346 
28 
28 1 
s 
− 
= 
−
Medidas de dispersión 
s . 
68346 62 9851 
181 
− 
27 
= 
s = 2.231 
C U E S T I O N A R I O 13 
1) Obtener la desviación estándar de los datos organizados en el cuestionario 2.
Medidas de dispersión 
15.3.2 LA DESVIACIÓN ESTÁNDAR PARA FRECUENCIAS POR INTERVALOS 
Cuando los datos han sido organizados en clases o intervalos, la desviación estándar se obtiene 
de manera similar a los procesos anteriores, es decir, con la misma fórmula aplicada a la organiza-ción 
de frecuencias simples, solamente que x debe ser el punto medio del intervalo. 
Ejemplo 1: Cien datos recolectados en una muestra se organizaron en los siete intervalos de la 
siguiente tabla. Obtener la desviación estándar. 
Solución: La tabla de la derecha es la original a la que 
deben agregársele cuatro columnas: 
a) la primera columna agregada se encabeza 
con x que representa el punto medio de cada 
intervalo. 
b) la segunda columna agregada se encabeza 
con fx que representa la multiplicación de 
cada frecuencia f por su respectivo punto 
medio x del intervalo. Al concluir de llenar 
esta columna se debe efectuar la sumatoria 
Σ f x para calcular la media aritmética. 
La tabla completa se muestra en la siguiente página. 
182 
f x 
x 
= Σ 
n 
2486 2 486 
10 
x = = . 
intervalo f 
4 - 9 12 
10 - 15 11 
16 - 21 13 
22 - 27 19 
28 - 33 21 
34 - 39 16 
40 - 45 8 
100
Medidas de dispersión 
c) la tercera columna agregada se encabeza con x − x que representa la resta de cada 
punto medio x del intervalo menos la media x obtenida en el paso anterior. Aunque 
debe recordarse que esta columna es opcional si el estudiante puede sin equivocarse 
obtener directamente sus cuadrados. 
d) la cuarta columna agregada se encabeza con ( )2 que representa los cuadrados x − x 
de cada resta obtenidos en la columna anterior. 
e) la quinta columna agregada se encabeza con ( )2 en donde se vaciarán los f x − x 
resultados de cada producto de la frecuencia f por el respectivo valor de la columna 
anterior. 
La tabla, con esas columnas agregadas, queda así: 
intervalo f x fx ( )2 x − x ( )2 f x − x 
4 - 9 12 6.5 78 337.0896 4 045.0752 
10 - 15 11 12.5 137.5 152.7697 1 680.4656 
16 - 21 13 18.5 240.5 40.4496 525.8448 
22 - 27 19 24.5 465.5 0.1296 2.4624 
28 - 33 21 30.5 640.5 31.8096 668.0016 
34 - 39 16 36.5 584 135.4896 2 167.8336 
40 - 45 8 42.5 340 311.1696 2 489.3568 
100 2 486 11 579.04 
183
Medidas de dispersión 
Sustituyendo en la fórmula de la desviación estándar 
s = . 
184 
( )2 
1 
f x x 
s 
n 
− 
= 
− 
Σ 
11579 04 
100 − 
1 
s = 10.8148 
C U E S T I O N A R I O 14 
1) Obtener la desviación estándar de los datos organizados en el cuestionario 3.

Más contenido relacionado

La actualidad más candente

Presentacion de power point
Presentacion de power pointPresentacion de power point
Presentacion de power pointEzekiel Simao
 
ORGANIZACIÓN DE LOS DATOS
ORGANIZACIÓN DE LOS DATOSORGANIZACIÓN DE LOS DATOS
ORGANIZACIÓN DE LOS DATOSJuanRengel2
 
Cuartiles probabilidad y estadistica
Cuartiles probabilidad y estadisticaCuartiles probabilidad y estadistica
Cuartiles probabilidad y estadisticaJuan Jose Montero
 
Proceso estadístico de ana
Proceso estadístico de anaProceso estadístico de ana
Proceso estadístico de anaANACUMESBOCEL
 
Presentacion de power point
Presentacion de power pointPresentacion de power point
Presentacion de power pointShindu Yael
 
Proceso estadístico 1
Proceso estadístico 1Proceso estadístico 1
Proceso estadístico 1Maria Xep
 
Estadistica
EstadisticaEstadistica
Estadisticaulises
 
Cumpu estadistica
Cumpu estadisticaCumpu estadistica
Cumpu estadisticaxoquic
 
Tema iii medidas de centralizacion uts
Tema iii medidas de centralizacion utsTema iii medidas de centralizacion uts
Tema iii medidas de centralizacion utsJulio Barreto Garcia
 
Division de un segmento en una razon dada
Division de un segmento en una razon dadaDivision de un segmento en una razon dada
Division de un segmento en una razon dadaisolf
 
Pruebas de contraste chi cuadrado x²
Pruebas de contraste chi cuadrado   x²Pruebas de contraste chi cuadrado   x²
Pruebas de contraste chi cuadrado x²Ldlsantostej
 
Mayra selena bocel cuxulic
Mayra selena bocel cuxulicMayra selena bocel cuxulic
Mayra selena bocel cuxulicmayrab10
 
Distancia entre dos puntos
Distancia entre dos puntosDistancia entre dos puntos
Distancia entre dos puntoskaroldavila
 

La actualidad más candente (16)

Presentacion de power point
Presentacion de power pointPresentacion de power point
Presentacion de power point
 
Razon
RazonRazon
Razon
 
ORGANIZACIÓN DE LOS DATOS
ORGANIZACIÓN DE LOS DATOSORGANIZACIÓN DE LOS DATOS
ORGANIZACIÓN DE LOS DATOS
 
Cuartiles probabilidad y estadistica
Cuartiles probabilidad y estadisticaCuartiles probabilidad y estadistica
Cuartiles probabilidad y estadistica
 
Proceso estadístico de ana
Proceso estadístico de anaProceso estadístico de ana
Proceso estadístico de ana
 
Presentacion de power point
Presentacion de power pointPresentacion de power point
Presentacion de power point
 
Proceso estadístico 1
Proceso estadístico 1Proceso estadístico 1
Proceso estadístico 1
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Cumpu estadistica
Cumpu estadisticaCumpu estadistica
Cumpu estadistica
 
Tema iii medidas de centralizacion uts
Tema iii medidas de centralizacion utsTema iii medidas de centralizacion uts
Tema iii medidas de centralizacion uts
 
Tarea seminario 5
Tarea seminario 5Tarea seminario 5
Tarea seminario 5
 
Division de un segmento en una razon dada
Division de un segmento en una razon dadaDivision de un segmento en una razon dada
Division de un segmento en una razon dada
 
Pruebas de contraste chi cuadrado x²
Pruebas de contraste chi cuadrado   x²Pruebas de contraste chi cuadrado   x²
Pruebas de contraste chi cuadrado x²
 
Mayra selena bocel cuxulic
Mayra selena bocel cuxulicMayra selena bocel cuxulic
Mayra selena bocel cuxulic
 
Distancia entre dos puntos
Distancia entre dos puntosDistancia entre dos puntos
Distancia entre dos puntos
 
Tabla de frecuencia
Tabla de frecuenciaTabla de frecuencia
Tabla de frecuencia
 

Destacado

Building Compatible Bases on Graphs, Images, and Manifolds
Building Compatible Bases on Graphs, Images, and ManifoldsBuilding Compatible Bases on Graphs, Images, and Manifolds
Building Compatible Bases on Graphs, Images, and ManifoldsDavide Eynard
 
Role of dimensionality reduction in segment-based classification of damaged b...
Role of dimensionality reduction in segment-based classification of damaged b...Role of dimensionality reduction in segment-based classification of damaged b...
Role of dimensionality reduction in segment-based classification of damaged b...Kourosh Khoshelham
 
Hiperactividad. (1)
Hiperactividad. (1)Hiperactividad. (1)
Hiperactividad. (1)lucascavero
 
Grupo Visión México 2030, El municipio: una institución diseñada para el frac...
Grupo Visión México 2030, El municipio: una institución diseñada para el frac...Grupo Visión México 2030, El municipio: una institución diseñada para el frac...
Grupo Visión México 2030, El municipio: una institución diseñada para el frac...CICMoficial
 
Informe empleo2013 enviroo
Informe empleo2013 envirooInforme empleo2013 enviroo
Informe empleo2013 envirooenviroo
 
Webinar: Metadata Enrichment in Publishing
Webinar: Metadata Enrichment in PublishingWebinar: Metadata Enrichment in Publishing
Webinar: Metadata Enrichment in PublishingOntotext
 
Crisis de la institucionalidad política simposio 2011
Crisis de la institucionalidad política simposio 2011Crisis de la institucionalidad política simposio 2011
Crisis de la institucionalidad política simposio 2011María Isabel Puerta Riera
 
Traffic Signal Movie Preview
Traffic Signal Movie PreviewTraffic Signal Movie Preview
Traffic Signal Movie PreviewKapil Mohan
 
Fujitsu France IT Future 2013 : Evolution du Data Center adapter la productio...
Fujitsu France IT Future 2013 : Evolution du Data Center adapter la productio...Fujitsu France IT Future 2013 : Evolution du Data Center adapter la productio...
Fujitsu France IT Future 2013 : Evolution du Data Center adapter la productio...Fujitsu France
 
Marisol Ramìrez
Marisol RamìrezMarisol Ramìrez
Marisol Ramìrezmary920204
 
Electronica y circuitos tecnologia
Electronica y circuitos tecnologiaElectronica y circuitos tecnologia
Electronica y circuitos tecnologiacristiarcilacsj
 
Infraestructura para el desarrollo de las energías renovables, reunión region...
Infraestructura para el desarrollo de las energías renovables, reunión region...Infraestructura para el desarrollo de las energías renovables, reunión region...
Infraestructura para el desarrollo de las energías renovables, reunión region...CICMoficial
 

Destacado (20)

Building Compatible Bases on Graphs, Images, and Manifolds
Building Compatible Bases on Graphs, Images, and ManifoldsBuilding Compatible Bases on Graphs, Images, and Manifolds
Building Compatible Bases on Graphs, Images, and Manifolds
 
Role of dimensionality reduction in segment-based classification of damaged b...
Role of dimensionality reduction in segment-based classification of damaged b...Role of dimensionality reduction in segment-based classification of damaged b...
Role of dimensionality reduction in segment-based classification of damaged b...
 
Hiperactividad. (1)
Hiperactividad. (1)Hiperactividad. (1)
Hiperactividad. (1)
 
MY HEART DESIRE
MY HEART DESIREMY HEART DESIRE
MY HEART DESIRE
 
Manual del sistema
Manual del sistemaManual del sistema
Manual del sistema
 
Existe el infierno(2.1)
Existe el infierno(2.1)Existe el infierno(2.1)
Existe el infierno(2.1)
 
Grupo Visión México 2030, El municipio: una institución diseñada para el frac...
Grupo Visión México 2030, El municipio: una institución diseñada para el frac...Grupo Visión México 2030, El municipio: una institución diseñada para el frac...
Grupo Visión México 2030, El municipio: una institución diseñada para el frac...
 
Informe empleo2013 enviroo
Informe empleo2013 envirooInforme empleo2013 enviroo
Informe empleo2013 enviroo
 
Np 24 de Marzo 2012
Np 24 de Marzo 2012Np 24 de Marzo 2012
Np 24 de Marzo 2012
 
Webinar: Metadata Enrichment in Publishing
Webinar: Metadata Enrichment in PublishingWebinar: Metadata Enrichment in Publishing
Webinar: Metadata Enrichment in Publishing
 
Hoja/full 27/01/16
Hoja/full 27/01/16Hoja/full 27/01/16
Hoja/full 27/01/16
 
Rompecabezas Europa
Rompecabezas EuropaRompecabezas Europa
Rompecabezas Europa
 
Crisis de la institucionalidad política simposio 2011
Crisis de la institucionalidad política simposio 2011Crisis de la institucionalidad política simposio 2011
Crisis de la institucionalidad política simposio 2011
 
Traffic Signal Movie Preview
Traffic Signal Movie PreviewTraffic Signal Movie Preview
Traffic Signal Movie Preview
 
Fujitsu France IT Future 2013 : Evolution du Data Center adapter la productio...
Fujitsu France IT Future 2013 : Evolution du Data Center adapter la productio...Fujitsu France IT Future 2013 : Evolution du Data Center adapter la productio...
Fujitsu France IT Future 2013 : Evolution du Data Center adapter la productio...
 
Marisol Ramìrez
Marisol RamìrezMarisol Ramìrez
Marisol Ramìrez
 
Electronica y circuitos tecnologia
Electronica y circuitos tecnologiaElectronica y circuitos tecnologia
Electronica y circuitos tecnologia
 
Gambero
GamberoGambero
Gambero
 
Infraestructura para el desarrollo de las energías renovables, reunión region...
Infraestructura para el desarrollo de las energías renovables, reunión region...Infraestructura para el desarrollo de las energías renovables, reunión region...
Infraestructura para el desarrollo de las energías renovables, reunión region...
 
Venezia
VeneziaVenezia
Venezia
 

Similar a Medidas dispersión datos

Similar a Medidas dispersión datos (20)

Formulas estadisticas
Formulas estadisticasFormulas estadisticas
Formulas estadisticas
 
Organización de datos (estadística)
Organización de datos (estadística)Organización de datos (estadística)
Organización de datos (estadística)
 
Teo estadist.
Teo estadist.Teo estadist.
Teo estadist.
 
Tabla de distribución de frecuencias
Tabla de distribución de frecuenciasTabla de distribución de frecuencias
Tabla de distribución de frecuencias
 
Yamilet.saia
Yamilet.saiaYamilet.saia
Yamilet.saia
 
Presentacion Nro 2 saia
Presentacion Nro 2 saiaPresentacion Nro 2 saia
Presentacion Nro 2 saia
 
Distribución de frecuencia
Distribución de frecuencia Distribución de frecuencia
Distribución de frecuencia
 
Estadística Cálculo de Media y desviación 009
Estadística Cálculo de Media y desviación 009Estadística Cálculo de Media y desviación 009
Estadística Cálculo de Media y desviación 009
 
Mg y ma
Mg y maMg y ma
Mg y ma
 
Mg y ma
Mg y maMg y ma
Mg y ma
 
Estadística
EstadísticaEstadística
Estadística
 
Estadística 1
Estadística 1Estadística 1
Estadística 1
 
Proceso estadístico
Proceso estadísticoProceso estadístico
Proceso estadístico
 
Medidas de tedencia_central_posicion_y_dispersion.pdf
Medidas de tedencia_central_posicion_y_dispersion.pdfMedidas de tedencia_central_posicion_y_dispersion.pdf
Medidas de tedencia_central_posicion_y_dispersion.pdf
 
Clase 4 medidas de tendencia no central
Clase 4 medidas de tendencia no centralClase 4 medidas de tendencia no central
Clase 4 medidas de tendencia no central
 
Métodos Estadísticos y tabulación
Métodos Estadísticos y tabulación Métodos Estadísticos y tabulación
Métodos Estadísticos y tabulación
 
Tema Estadística
Tema EstadísticaTema Estadística
Tema Estadística
 
Estadistica
Estadistica Estadistica
Estadistica
 
Unidad Iii Estadistica 3
Unidad Iii Estadistica 3Unidad Iii Estadistica 3
Unidad Iii Estadistica 3
 
O
OO
O
 

Más de Marlon Melara

09. radicales marloner
09. radicales marloner09. radicales marloner
09. radicales marlonerMarlon Melara
 
Ob a6fb2f propiedades-algebraicas-2 marlon
Ob a6fb2f propiedades-algebraicas-2 marlonOb a6fb2f propiedades-algebraicas-2 marlon
Ob a6fb2f propiedades-algebraicas-2 marlonMarlon Melara
 
Sistemas no-lineales de marlon
Sistemas no-lineales de marlonSistemas no-lineales de marlon
Sistemas no-lineales de marlonMarlon Melara
 
Marlon ernesto melara
Marlon ernesto melaraMarlon ernesto melara
Marlon ernesto melaraMarlon Melara
 

Más de Marlon Melara (7)

09. radicales marloner
09. radicales marloner09. radicales marloner
09. radicales marloner
 
Ob a6fb2f propiedades-algebraicas-2 marlon
Ob a6fb2f propiedades-algebraicas-2 marlonOb a6fb2f propiedades-algebraicas-2 marlon
Ob a6fb2f propiedades-algebraicas-2 marlon
 
Sistemas no-lineales de marlon
Sistemas no-lineales de marlonSistemas no-lineales de marlon
Sistemas no-lineales de marlon
 
Marlon ecuaciones
Marlon ecuacionesMarlon ecuaciones
Marlon ecuaciones
 
Tema4 marlonernesto
Tema4 marlonernestoTema4 marlonernesto
Tema4 marlonernesto
 
Marlon ernesto
Marlon ernestoMarlon ernesto
Marlon ernesto
 
Marlon ernesto melara
Marlon ernesto melaraMarlon ernesto melara
Marlon ernesto melara
 

Medidas dispersión datos

  • 1. Medidas de dispersión 167 CAPÍTULO 15 MEDIDAS DE DISPERSIÓN En el capítulo anterior se estudiaron las medidas de tendencia central, que son un indicador de cómo los datos se agrupan o concentran en una parte central del conjunto. Sin embargo, para una información completa de dicho conjunto de datos hace falta saber el comportamiento opuesto, es decir, de qué manera se dispersan o se alejan al-gunos datos de esa parte central. Por ejemplo, al tomar las temperaturas en una región “A” durante diferentes épocas del año y a distintas horas del día, se registraron los datos que se muestran en la columna “A” ; por su par-te, las de otra región diferente “B”, son las de la columna “B” . Al obtener la media, en ambos casos resultó que la temperatura promedio fue de 20.68º, cuya interpretación podría ser que en torno, al rededor o cerca a 20.68º fluctúan los demás valores. A B 19.3º - 3º 20º 0º 20.2º 6º 20.4º 22º 21º 31.5º 21.3º 34º 21.3º 36º 22º 39º Promedio: 20.68º 20.68º
  • 2. Medidas de dispersión Como puede verse, eso es bastante aproximado para los datos de la columna “A”, no así para los de la “B”. Los datos más alejados en “A” son 19.3º y 22º, que realmente están próximos a 20.68º; en cambio, los datos más alejados en “B” son -3º y 39º, que están muy distantes del promedio. ¿Por qué si en ambos casos se tiene igual promedio, no se puede afirmar lo mismo de los valores que están a su alrededor?. La respuesta está en que no se ha tomado en cuenta la dispersión, es decir, la manera en que se disgregan los datos respecto de la media, pues en “A” casi no se disper-san mientras que en “B” sí, .Cabría decir que el conjunto de datos “A” es bastante compacto 168 mientras que el “B” es muy dilatado. Las principales medidas de dispersión son tres: El rango, la desviación media y la desviación estándar. De manera semejante a las medidas de tendencia central, las medidas de dispersión deben considerarse en sus dos opciones: cuando no están agrupados los datos y cuando están por interva-los. 15.1 EL RANGO El rango es la diferencia entre los datos mayor y menor del conjunto. También se le suele llamar “recorrido” . En un conjunto de datos, mientras mayor sea el rango, mayor será su dispersión y, a la inversa, mientras menor sea su rango, menor su dispersión. En los casos de las temperaturas del ejemplo anterior, el rango de “A” es R = 22 - 19.3 = 2.7, en cambio, el de “B” es B = 39 - (-3) = 42. 15.2 LA DESVIACIÓN MEDIA Dado un conjunto de datos cuya media aritmética o promedio es x , la diferencia o la distancia de cada valor nominal x a la media aritmética se llama desviación del dato x con respecto a la media x . Es decir, es una medición de cuánto se alejó cada valor nominal x de la media.
  • 3. Medidas de dispersión 169 Por ejemplo, de los datos mostrados en la tabla de la derecha, la media aritmética es 450 75 6 x = = entonces La desviación del dato x = 50 con res-pecto de la media es d = 50 - 75 = - 25. Lo mismo puede decirse de los demás datos. Resulta obvio que siendo la media arit-mética x el punto central de todos los valo-res de los datos x, existan simétricamente x d 50 50 - 75 = - 25 60 60 - 75 = - 15 70 70 - 75 = - 5 80 80 - 75 = 5 90 90 - 75 = 15 100 100 - 75 = 25 Σx = 450 valores positivos y negativos, o lo que es lo mismo, la suma de todas las desviaciones a la media siempre es cero. Para evitar lo anterior, dicha suma se toma como valor absoluto, esto es La desviación del dato x = 50 con respecto de la media x es d = 50 − 75 = 25 La desviación del dato x = 60 con respecto de la media x es d = 60 − 75 = 15 y así sucesivamente. 15.2.1 LA DESVIACIÓN MEDIA PARA FRECUENCIAS SIMPLES Cuando los datos recolectados han sido organizados en una tabla de frecuencias simples, es decir, sin agrupar, la desviación media DM se calcula por medio de la fórmula:
  • 4. Medidas de dispersión f x x 170 DM n − = Σ Por lo tanto, deben añadirse a la tabla original tres columnas: la primera encabezada con fx, que servirá para calcular la media aritmética; la segunda encabezada con x − x , que servirá para obtener la tercera, f x − x con la que se obtiene el numerador de la fórmula luego de realizar su sumatoria. Ejemplo 1: Obtener la desviación media del conjunto de datos mostrado en la tabla de la derecha. Solución: La tabla de la derecha es la original a la que deben agregársele tres columnas: a) la primera columna agregada se encabeza con fx que representa la multiplicación de cada fre-cuencia f por su respectivo valor nominal x . Al concluir de llenar esta columna se debe efec-tuar la sumatoria Σ f x para calcular la media aritmética. Ver la tabla completa en la siguiente página. b) la segunda columna agregada se encabeza con x − x , que representa el valor absoluto de la resta de cada valor nominal x menos la media x obtenida en el paso anterior, y edad x f 45 2 46 1 47 3 48 3 49 5 50 6 51 2 52 4 53 2 28
  • 5. Medidas de dispersión c) la tercera columna agregada se encabeza con f x − x , que representa la multipli-cación de cada frecuencia f (2ª columna) por el valor absoluto correspondiente x f fx x − x f x − x 45 2 90 4.357 8.714 46 1 46 3.357 3.357 47 3 141 2.357 7.071 48 3 144 1.357 4.071 49 5 245 0.357 1.785 50 6 300 0.643 3.858 51 2 102 1.643 3.286 52 4 208 2.643 10.572 53 2 106 3.643 7.286 28 1382 50 171 obtenido en la 4ª columna. Al concluir de llenar esta columna se debe efectuar la sumatoria Σ f x − x . La tabla, con esas columnas agregadas, queda así: f x x f = Σ Σ
  • 6. Medidas de dispersión 1382 49 357 28 x = = . 172 Por lo tanto f x x DM − f = Σ Σ 50 1 785 28 DM = = . Esto significa que el promedio de alejamiento de todos los valores respecto de la media (de 49.357) es de 1.785. C U E S T I O N A R I O 11 1) Obtener la desviación media de los datos organizados en el cuestionario 2.
  • 7. Medidas de dispersión 15.2.2 LA DESVIACIÓN MEDIA CON TABLAS POR INTERVALOS Cuando los datos han sido organizados en clases o intervalos, la desviación media se obtiene de manera similar a los procesos anteriores, es decir, con la misma fórmula aplicada a la organización de frecuencias simples, solamente que x debe ser el punto medio del intervalo. Esto significa que al conjunto de datos original deben añadirse a la tabla ahora cuatro columnas: la primera encabezada con x para señalar el punto medio de cada intervalo; la segunda encabezada con fx que servirá para calcular la media aritmética; la tercera encabezada con x − x que servirá para obtener la cuarta, y la cuarta con f x − x que servirá para obtener el numerador de la fórmula luego de realizar su sumatoria. Ejemplo 1: Cien datos recolectados se organizaron en siete intervalos, los que se muestran en la tabla de la derecha. Obtener la desviación media. Solución: La tabla de la derecha es la original a la que deben agregársele cuatro columnas: a) la primera columna agregada se encabeza con x que representa el punto medio de cada intervalo. Ver la tabla completa en la siguiente página. b) la segunda columna agregada se encabeza con fx. Al concluir de llenar esta columna se debe efectuar la sumatoria Σ f x para calcu-lar la media aritmética: 173 intervalo f 4 - 9 12 10 - 15 11 16 - 21 13 22 - 27 19 28 - 33 21 34 - 39 16 40 - 45 8 100
  • 8. Medidas de dispersión Σ f x = Σ 2486 24 86 x = = . 174 x f 100 c) la tercera columna agregada se encabeza con x − x que representa el valor absolu-to de la resta de cada punto medio x del intervalo menos la media x obtenida en el paso anterior. Esta columna podría omitirse y directamente construir la del inciso d). d) la cuarta columna agregada se encabeza con f x − x que representa la multiplica-ción de cada frecuencia f (2ª columna) por el valor absoluto correspondiente obteni-do en la 5ª columna. Al concluir de llenar esta columna se debe efectuar la sumatoria Σ f x − x . intervalo f x fx x − x f x − x 4 - 9 12 6.5 78 18.36 220.32 10 - 15 11 12.5 137.5 12.36 135.96 16 - 21 13 18.5 240.5 6.36 82.68 22 - 27 19 24.5 465.5 0.36 6.84 28 - 33 21 30.5 640.5 5.64 118.44 34 - 39 16 36.5 584 11.64 186.24 40 - 45 8 42.5 340 17.64 141.12 100 2486 891.6
  • 9. Medidas de dispersión = Σ 891 6 8 916 DM = . = . 175 f x x DM n − 100 Esto significa que el promedio de alejamiento de todos los valores respecto de la media, es de 8.916. C U E S T I O N A R I O 12 1) Obtener la desviación media de los datos organizados en el cuestionario 3.
  • 10. Medidas de dispersión 176 15.3 LA DESVIACIÓN ESTÁNDAR La tercera medida de dispersión se llama desviación estándar, porque con ella se pueden estan-darizar en todos los casos, todas las desviaciones de datos recolectados, como se verá más adelante. La desviación estándar se simboliza con la letra griega σ si se trata de una población y con la letra s si se trata de una muestra. Aquí el truco para quitar los valores negativos de la resta de x − x es, aproximadamente, elevar al cuadrado y luego regresar con una raíz cuadrada. 15.3.1 LA DESVIACIÓN ESTÁNDAR PARA FRECUENCIAS SIMPLES Cuando los datos están ordenados en una distribución de frecuencias simples, la desviación estándar para una población se calcula mediante la fórmula ( )2 f x x n σ − = Σ en donde σ = desviación estándar de la población f = frecuencia x = valor nominal x = media aritmética Cuando los datos están ordenados en una distribución de frecuencias simples, la desviación estándar para una muestra se calcula mediante la fórmula ( )2 1 f x x s n − = − Σ
  • 11. Medidas de dispersión en donde s = desviación estándar de la muestra 177 f = frecuencia x = valor nominal x = media aritmética Significa que a la tabla original hay que agregarle cuatro columnas, aunque la segunda es opcional. La primera encabezada con fx, servirá para calcular la media aritmética. La segunda (opcional) encabezada con ( x − x ) . La tercera con los cuadrados de la anterior, es decir con ( )2 . Y la cuarta con el producto de la frecuencia f por la anterior, o sea . x − x ( )2 f x − x Ejemplo 1: Obtener la desviación estándar del conjunto de datos de la muestra de la siguiente tabla. Solución: La tabla de la derecha es la original a la que deben agregársele cuatro columnas: a) la primera columna agregada se encabeza con fx que representa la multiplicación de cada frecuencia f por su respectivo valor nominal x. Al concluir de llenar esta columna se debe efectuar la sumatoria Σ f x para calcular la media aritmética: f x x = Σ n 1382 49 357 28 x = = . x f 45 2 46 1 47 3 48 3 49 5 50 6 51 2 52 4 53 2 28
  • 12. Medidas de dispersión (ver tabla completa de la siguiente página) b) la segunda columna agregada se encabeza con ( x − x ) que representa la resta de cada valor nominal x menos la media x obtenida en el paso anterior. Esta columna es opcional, pues directamente se puede elevar al cuadrado y el respectivo valor vaciarlo en la columna que se especifica en el siguiente inciso; de la siguiente forma: primera fila: x − x = 45 - 49.3571 = - 4.3571 segunda fila: x − x = 46 - 49.3571 = - 3.3571 tercera fila: x − x = 47 - 49.3571 = - 2.3571 cuarta fila: x − x = 48 - 49.3571 = - 1.3571 quinta fila: x − x = 49 - 49.3571 = - 0.3571 c) la tercera columna agregada, o segunda en caso de haber omitido la anterior, se encabeza con ( )2 que representa el cuadrado de cada valor obtenido en la x − x columna anterior: primera fila: ( )2 = (- 4.3571)2 = 18.9843 x − x segunda fila: ( )2 = (- 3.3571)2 = 11.2701 x − x tercera fila : ( )2 = (- 2.3571)2 = 5.5559 x − x cuarta fila: ( )2 = (- 1.3571)2 = 1.8417 x − x quinta fila: ( )2 = (- 0.3571)2 = 0.1275 x − x d) la siguiente columna agregada se encabeza con ( )2 que representa el pro- f x − x ducto de cada frecuencia f por su correspondiente cuadrado obtenido en la columna anterior. 178
  • 13. Medidas de dispersión La tabla con esas columnas agregadas queda así: x f fx ( )2 x − x ( )2 f x − x 45 2 90 18.9834 37.9668 46 1 46 11.2694 11.2694 47 3 141 5.5554 16.6662 48 3 144 1.8414 5.5242 49 5 245 0.1274 0.6370 50 6 300 0.4134 2.4804 51 2 102 2.6994 5.3988 52 4 208 6.9854 27.9416 53 2 106 13.2714 26.5428 28 1382 134.4272 Se tiene con esta tabla toda la información requerida para utilizar la fórmula de la desviación estándar para una muestra: s = . 179 ( )2 1 f x x s n − = − Σ 134 4272 28 − 1 s = 2.231
  • 14. Medidas de dispersión Para calcular la desviación estándar de una muestra a veces puede resultar más simple emplear la siguiente fórmula: Σ Σ x f x2 fx2 fx 45 2 2025 4050 90 46 1 2116 2116 46 47 3 2209 6627 141 48 3 2304 6912 144 49 5 2401 12005 245 50 6 2500 15000 300 51 2 2601 5202 102 52 4 2704 10816 208 53 2 2809 5618 106 28 68346 1382 180 ( )2 2 1 f x f x − s n n = − Aplicándola a la tabla del ejemplo anterior, se tiene que ( )2 1382 68346 28 28 1 s − = −
  • 15. Medidas de dispersión s . 68346 62 9851 181 − 27 = s = 2.231 C U E S T I O N A R I O 13 1) Obtener la desviación estándar de los datos organizados en el cuestionario 2.
  • 16. Medidas de dispersión 15.3.2 LA DESVIACIÓN ESTÁNDAR PARA FRECUENCIAS POR INTERVALOS Cuando los datos han sido organizados en clases o intervalos, la desviación estándar se obtiene de manera similar a los procesos anteriores, es decir, con la misma fórmula aplicada a la organiza-ción de frecuencias simples, solamente que x debe ser el punto medio del intervalo. Ejemplo 1: Cien datos recolectados en una muestra se organizaron en los siete intervalos de la siguiente tabla. Obtener la desviación estándar. Solución: La tabla de la derecha es la original a la que deben agregársele cuatro columnas: a) la primera columna agregada se encabeza con x que representa el punto medio de cada intervalo. b) la segunda columna agregada se encabeza con fx que representa la multiplicación de cada frecuencia f por su respectivo punto medio x del intervalo. Al concluir de llenar esta columna se debe efectuar la sumatoria Σ f x para calcular la media aritmética. La tabla completa se muestra en la siguiente página. 182 f x x = Σ n 2486 2 486 10 x = = . intervalo f 4 - 9 12 10 - 15 11 16 - 21 13 22 - 27 19 28 - 33 21 34 - 39 16 40 - 45 8 100
  • 17. Medidas de dispersión c) la tercera columna agregada se encabeza con x − x que representa la resta de cada punto medio x del intervalo menos la media x obtenida en el paso anterior. Aunque debe recordarse que esta columna es opcional si el estudiante puede sin equivocarse obtener directamente sus cuadrados. d) la cuarta columna agregada se encabeza con ( )2 que representa los cuadrados x − x de cada resta obtenidos en la columna anterior. e) la quinta columna agregada se encabeza con ( )2 en donde se vaciarán los f x − x resultados de cada producto de la frecuencia f por el respectivo valor de la columna anterior. La tabla, con esas columnas agregadas, queda así: intervalo f x fx ( )2 x − x ( )2 f x − x 4 - 9 12 6.5 78 337.0896 4 045.0752 10 - 15 11 12.5 137.5 152.7697 1 680.4656 16 - 21 13 18.5 240.5 40.4496 525.8448 22 - 27 19 24.5 465.5 0.1296 2.4624 28 - 33 21 30.5 640.5 31.8096 668.0016 34 - 39 16 36.5 584 135.4896 2 167.8336 40 - 45 8 42.5 340 311.1696 2 489.3568 100 2 486 11 579.04 183
  • 18. Medidas de dispersión Sustituyendo en la fórmula de la desviación estándar s = . 184 ( )2 1 f x x s n − = − Σ 11579 04 100 − 1 s = 10.8148 C U E S T I O N A R I O 14 1) Obtener la desviación estándar de los datos organizados en el cuestionario 3.