SlideShare una empresa de Scribd logo
1 de 32
Descargar para leer sin conexión
CONTENIDO
INTRODUCCIÓN
DEFINICIÓN DE ESTADÍSTICA
ESTADÍSTICA DESCRIPTIVA
CONCEPTOS BÁSICOS
POBLACIÓN
VARIABLE: Cualitativas o Categóricas y Cuantitativas (Discretas y
Continuas)
MUESTRA
TAMAÑO MUESTRAL
DATO
DISTRIBUCIONES DE FRECUENCIAS
FRECUENCIA ABSOLUTA
FRECUENCIA RELATIVA
FRECUENCIA ACUMULADA
FRECUENCIA RELATIVA ACUMULADA
DISTRIBUCIONES DE FRECUENCIAS AGRUPADAS
MÉTODOS GRÁFICOS
DIAGRAMA DE BARRAS
DIAGRAMA DE SECTORES O DE PASTEL
HISTOGRAMA
MEDIDAS DESCRIPTIVAS DE POSICIÓN Y DISPERSIÓN
MEDIDAS DE POSICIÓN
MEDIDAS DE POSICIÓN CENTRAL
MEDIA ARITMÉTICA
MEDIANA
MODA
MEDIDAS DE POSICIÓN NO CENTRALES
PERCENTILES
CUARTILES
MEDIDAS DE DISPERSIÓN
MEDIDAS DE DISPERSIÓN ABSOLUTAS
VARIANZA
DESVIACIÓN TÍPICA
RECORRIDO INTERCUARTÍLICO
MEDIDAS DE DISPERSIÓN RELATIVAS
COEFICIENTE DE VARIACIÓN DE PEARSON
OTRAS MEDIDAS DESCRIPTIVAS
TIPIFICACIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS
ESTADISTICA DESCRIPTIVA
INTRODUCCION
1.1 DEFINICIÓN DE ESTADÍSTICA: es un conjunto de teorías y métodos
desarrollados para la recopilación, representación y el uso de datos sobre una
o varias características de interés con el objeto de tomar decisiones, extraer
conclusiones o emprender acciones.
1.2 ESTADÍSTICA DESCRIPTIVA: es la parte de la estadística que se encarga
de organizar, resumir y describir las características principales de los datos.
Generalmente se resumen en forma tabular, grafica o numérica. El análisis se
limita en si mismo a los datos coleccionados y no se realiza inferencia alguna o
generalizaciones acerca de la totalidad de donde provienen esas
observaciones.
1.3 ESTADÍSTICA INFERENCIAL: Es la que trata de estimar las
características de una población a través del estudio de una muestra.
1.4 CONCEPTOS BÁSICOS:
POBLACIÓN: Es una colección finita o infinita de elementos con
características comunes. Ejemplo: las personas, libros de una biblioteca, etc.
Algunas poblaciones son finitas y pueden conocerse; otras pueden ser infinitas
y abstractas: Ej. el conjunto de hoteles, establecimientos comerciales de una
ciudad o el conjunto de todas las piezas fabricadas por una máquina.
VARIABLE: Toda característica que puede tomar diferentes valores (Ej.
número de hijos, precio de la habitación) Las variables se suelen denotar por
letras mayúsculas: X, Y,...
Tipos de variables:
1. Cualitativas o Categóricas: aquellas que no son medibles, es decir,
aquellas cuyas observaciones no tienen carácter numérico. Expresan
cualidades o categorías. Ej. estado civil, sexo o profesión.(A las variables
cualitativas también se les llama atributos).
2. Cuantitativas: aquellas que son medibles, es decir sus observaciones
tienen carácter numérico. Estas se dividen a su vez en:
•Discretas: toman valores enteros en un conjunto numerable. Ej.
Número de habitaciones de un hotel, número de hijos de una familia, número
de obreros de una fábrica.
•Continuas: toman valores en un conjunto no numerable (los números
reales o un intervalo). Ej. peso, estatura.
MUESTRA: Es un subconjunto de la población. Se denota por n.
DATO: cada valor observado de la variable. Si representamos por X a la
variable, representaremos por xi cada dato diferente observado en la muestra,
el subíndice “i” indica el lugar que ocupa si los ordenamos de menor a mayor.
Prof. Simón Cabrera página 2 de 32
ESTADISTICA DESCRIPTIVA
MEDICIÓN: La asignación o magnitud que se aplica a las categorías o clases
de acuerdo a ciertas reglas o símbolos. Una medición se puede definir como la
manera de obtener símbolos para representar propiedades de personas,
objetos, eventos o estados cuyos símbolos tienen la misma relación relevante
entre si igual a las entidades que representan.
ESCALAS DE MEDICIÓN DE LAS VARIABLES
Las escalas de medición son el conjunto de los posibles valores que
determinada variable puede tomar. Por tal razón, los tipos de escala de
medición están íntimamente ligadas con los tipos de variables a estudiar. Las
magnitudes de las observaciones cuantitativas se conocen como los valores
que una variable puede asumir. Dependiendo de la medición y de la esencia de
las variables, se obtienen diversas clases de datos que originan diferentes
escalas. Resulta imprescindible conocer el tipo de escala que representan los
datos, debido a que, de su esencia dependen las técnicas estadísticas que se
deberán aplicar para su análisis.
Al elaborar estadísticas con datos y su característica es necesario contarlas,
jerarquizarlas y medirlas, es por ello que, se utilizan las escalas de medición
como el proceso de asignar números o establecer una correspondencia uno a
uno entre objetivos y observaciones. Las escalas de medición sé clasifican de
la siguiente forma: Escala Nominal, Escala Ordinal, Escala de Intervalos y
Escalas de razón o Proporción.
Escala de Medición Nominal: Consiste en clasificar a los elementos,
personas, animales, etc, asignándoles símbolos o nombres. Los datos que se
obtienen para una variable cualitativa se miden en una escala nominal y
simplemente se clasifican en distintas categorías que no implican orden. La
escala nominal es la forma más débil de medición porque no se puede aplicar
operaciones aritméticas ni intentar el conteo de las diferencias dentro de una
categoría determinada o especificar cualquier orden o dirección a lo largo de
las diversas categorías.
Propiedades de la Escala Nominal
1. No intervienen mediciones, ni escala, en vez de esto solo hay cuentas o
conteos.
2. No existe un orden específico para esta categoría.
3. No presentan el cero.
4. No se basa en diferencia cuantitativa.
Ejemplos: Una muestra de personas puede clasificarse con base en la religión
profesada: (1) Cristianos; (2) Judíos; (3) Musulmanes; (4) Otros; y (5) Sin
Creencia alguna. O bien podrían clasificarse según el sexo, el color de los
ojos, algún partido político, etcétera. Otros ejemplos de escala nominal puede
ser el numero de placa de los vehículos, los números de los teléfonos de una
ciudad, la Cedula de Identidad de los habitantes de un país, etcétera.
Prof. Simón Cabrera página 3 de 32
ESTADISTICA DESCRIPTIVA
El tipo de operación estadística más utilizada en la escala nominal es el conteo
de las frecuencias (distribuciones de frecuencias), con que se presentan las
características en las unidades de las respectivas subclases. Estas frecuencias
pueden ser presentadas con números absolutos, porcentajes y proporciones.
Además, puede calcularse la moda, razones, tasas de incremento, y el
coeficiente de contingencia. Tipos de gráficos: Diagrama de Barras.
Escala de Medición Ordinal: Establece una relación de orden entre los
elementos (personas, animales, objetos, etc.), en atención a una característica,
sin que reflejen distancia entre ellos. La diferencia entre dos números ordinales
no tiene significado cuantitativo, sólo expresan, por ejemplo, que una situación
es mejor que otra, pero no dice cuanto es uno que el otro.
La escala ordinal sigue siendo una forma de medición débil porque no se
pueden hacer planteamientos numéricos significativos con respecto a las
diferencias entre las categorías. Es decir, la ordenación establece sólo cuál
categoría es “mayor”, “mejor” o “preferida”; y no se habla cuánto es “mayor”,
“mejor” o más “preferida”.’Esta escala se emplea, cuando un estudio esta
basado en ciertas normas que se asignan a un conjunto de objetos, personas
o características o a un conjunto de categorías ordenadas. Las categorías de
la escala se ordenan dé acuerdo con la cantidad de rasgos o características
que representan cada una de ellas ya que la escala ordinal distingue los
diferentes valores de la variable, ubicando las características en orden, desde
la más alta hasta la más baja.
La diferencia fundamental entre una escala nominal y una ordinal es que en la
ordinal rige no sólo la relación de igualdad, de identidad, sino también la
relación de “mayor que”.
Propiedades de la Escala Ordinal
1. Las observaciones o elementos se les ordena en rangos o categorías
diferentes.
2. Las categorías son mayores o menores que otras categorías, es decir,
que existe una clasificación de mayor a menor (jerarquía).
3. Las categorías son mutuamente excluyentes y exhaustivas.
4. No presentan el cero.
Ejemplos:
Calificaciones de Estudiantes de Estadística en el Semestre 2005-2006
Calificaciones Nº de calificaciones
Excelente 3
Sobresaliente 6
Distinguido 10
Bueno 38
Satisfactorio 25
Deficiente 50
Muy Deficiente 0
Prof. Simón Cabrera página 4 de 32
ESTADISTICA DESCRIPTIVA
Se pueden clasificar los habitantes de una ciudad de acuerdo a su situación
económica, a los estudiantes tomando en cuenta a su rendimiento académico,
el orden jerárquico de los militares (Subteniente, Teniente, Capitán, Mayor,
Teniente Coronel, Coronel, General) y la clasificación académica de los
profesores universitarios (Instructor, Asistente, Agregado, Asociado, Titular),
etcétera. Aunque la escala ordinal resulta en cierta forma más precisa que la
nominal, no alcanza el grado de precisión deseado en una investigación.
El tipo de operación estadística más utilizada en la escala ordinal es la
mediana, percentiles, cuartiles, mínimo y máximo. Tipos de gráficos: Diagrama
de barras (con un orden) y gráficos de caja.
Escala de Medición de Intervalos: Tiene todas las características de una
escala ordinal, además permite conocer la distancia entre dos números
cualquiera. Esta escala se caracteriza por tener una unidad de medida y un
origen (cero) arbitrario. La escala de intervalos a diferencia de la nominal y
ordinal, es una escala efectivamente cuantitativamente. Una escala de intervalo
es una escala ordenada en la cual la diferencia entre las mediciones es una
cantidad significativa.
La escala de intervalos posee además, de las características de la escala
nominal y ordinal, la propiedad de que la distancia entre dos valores es de una
magnitud conocida, lo que le permite a esta escala un mayor grado de
perfección, ya que proporciona números que manifiestan diferencias palpables
entre individuos, objetos o cosas.
La razón entre dos intervalos es siempre independiente del punto cero y de la
unidad que se emplee en la medición. En el caso de las escalas de intervalos
las unidades de medición son iguales.
Propiedades de la escala de Intervalo:
1. Esta escala implica la cuantificación de los datos
2. En estás medidas se utilizan unidades constantes de medición
(capacidad, peso, Céntimos, grados Fahrenheit o centígrados) los
cuales producen intervalos iguales entre puntos de la escala.
3. Proporcionan números que manifiestan diferencias palpables entre
individuos, objetos o cosas.
4. En esta escala de intervalos el punto cero (0) y la unidad de medida es
arbitrario.
5. Se pueden aplicar todas las medidas estadísticas más conocidas, con
excepción del coeficiente de variación.
6. Son mutuamente exclusivas y exhaustivas.
Prof. Simón Cabrera página 5 de 32
ESTADISTICA DESCRIPTIVA
Ejemplos:
Calificación de una prueba de Estadística realizada en la UCV
Puntuación Nº de Estudiantes
90-99 2
80-89 6
70-79 15
60-69 30
Menos de 60 60
Otro ejemplo de esta escala lo constituyen las escalas utilizadas para medir
temperatura, bien sea en grados Centígrados o Fahrenheit. En estas escalas la
diferencia entre 80º y 85º es igual a la que existe entre 90º y 95º o entre dos
puntos cualesquiera de la escala.
Las estadísticas apropiadas para esta escala son: media, desviación estándar,
rango, varianza, coeficiente de variación, asimetría y kurtosis. Tipos de
gráficos: histograma, polígono de frecuencias y gráfico de tallos y hojas.
Escala de Medición de Razón o Proporción: Esta constituye el nivel más alto
de medición, posee todas las características de las escalas nominales,
ordinales y de intervalos; además tiene un cero absoluto o natural que tiene
significado físico. Si en ella la medición es cero, significa ausencia o
inexistencia total de la propiedad considerada. Son posibles todas las
operaciones aritméticas. Los números indican los valores concretos de la
propiedad que sé esta midiendo; peso, estatura, ingresos monetarios y gastos
directos, son ejemplos de medidas con una escala de razón.
Cuando se emplea este tipo de escala, los números indican razones o
cocientes entre ciertas magnitudes de los objetos, y los datos obtenidos con
tales escalas pueden ser sometidos a los tratamientos más elaborados.
Propiedades de la escala a razón:
1. La distancia entre los números es un tamaño conocido y constante.
2. Los datos tienen un punto cero significativo.
3. Puede utilizarse cualquier prueba de tipo estadístico, incluyendo el
coeficiente de variación.
4. Permite hacer comparaciones entre los números verdaderos con un cero
aritmético siendo arbitrario únicamente la unidad de medida.
Ejemplo de escala a razón:
Computadores vendidos en el último trimestres del año 2006
Meses Nº de computadores
Octubre 4.000
Noviembre 6.000
Diciembre 15.000
Prof. Simón Cabrera página 6 de 32
ESTADISTICA DESCRIPTIVA
Otros ejemplos de esta escala son: la medición del peso o altura de un grupo
de personas, el ingreso familiar, la intensidad de corriente eléctrica de un cable,
la edad de un grupo de personas, etc.
Generalmente, se supone que los datos que se obtienen para una variable
cuantitativa se miden en escalas de intervalo o de razón. Estas escalas
constituyen los niveles más elevados de medición. Son formas más fuertes de
medición que la escala nominal y ordinal, porque permiten comprender no sólo
cuál de los valores de un estudio es mayor o menor, sino por cuántas
unidades de medida. Las escalas de razón son medidas de Longitud, peso,
capacidad, etc., los números reflejan razones entre particularidades y los datos
obtenidos según tales escalas pueden ser sometidas a cualquier tratamiento
estadístico
Prof. Simón Cabrera página 7 de 32
ESTADISTICA DESCRIPTIVA
ORGANIZACIÓN DE LOS DATOS
2. DISTRIBUCIONES DE FRECUENCIAS
La distribución de frecuencia es una disposición tabular de datos estadísticos,
ordenados ascendente o descendentemente, de acuerdo a la frecuencia de
cada dato. Las frecuencias pueden ser:
2.1 FRECUENCIA ABSOLUTA (fi):
Es el número de veces que se repite un determinado valor de la variable (xi).
Se designa por fi.
PROPIEDAD: la suma de todas las frecuencias absolutas es igual al total de
observaciones (n).
2.2 FRECUENCIA ACUMULADA (Fi):
Las frecuencias acumuladas de una distribución de frecuencias son aquellas
que se obtienen de las sumas sucesivas de las fi que integran cada una de las
filas de una distribución de frecuencia, esto se logra cuando la acumulación de
las frecuencias se realiza tomando en cuenta la primera fila hasta alcanzar la
ultima. Las frecuencias acumuladas se designan con las letras Fi. Se calcula:
∑=
− +==
i
j
iiji fFfF
1
1
PROPIEDAD: La última frecuencia acumulada absoluta es igual al total de
observaciones.
2.3 FRECUENCIA RELATIVA (hi):
Es aquella que resulta de dividir cada una de las frecuencias absolutas entre el
número total de datos. Las frecuencias relativas se designan con las letras hi.
Se calcula,
n
f
h i
i =
PROPIEDAD: la suma de todas las frecuencias relativas es igual a la unidad.
.
2.4 FRECUENCIA RELATIVA ACUMULADA (Hi):
Es aquella que resulta de dividir cada una de las frecuencias acumuladas entre
número total de datos. Se designa con las letras Hi . Se calcula;
n
F
H i
i =
PROPIEDAD: La última frecuencia relativa acumulada es la unidad.
Prof. Simón Cabrera página 8 de 32
ESTADISTICA DESCRIPTIVA
DISTRIBUCION DE FRECUENCIAS ABSOLUTAS
Es la representación estructurada en forma de tabla de toda la información que
se ha recogido sobre la variable que se estudia, es decir, es una tabla que
presenta de manera ordenada los distintos valores de una variable y sus
correspondientes frecuencias. Su forma mas común es la siguiente:
Variable (xi) fi Fi hi Hi
x1 f1 F1 h1= f1/n h1
x2 f2 f1+f2 h2= f2/n h1+h2
... ... ... ... ...
xn fn f1+f2+ … + fn hn= fn/n h1+h2+ … + hn
Σfi=n Σhi=1
Ejemplo 1:
El gobierno desea averiguar si el número medio de hijos por familia ha
descendido respecto de la década anterior. Para ello ha encuestado a 50
familias respecto al número de hijos, y ha obtenido los siguientes datos:
0 0 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 5 6
Se pide:
a. Construir la tabla de frecuencias absolutas
b. ¿Cuál es el número de familias que tiene como máximo dos hijos?
c. ¿Cuántas familias tienen más de 1 hijo pero como máximo 3?
d. ¿Qué porcentaje de familias tiene más de 3 hijos?
Solución:
a. Para construir la tabla de frecuencias hay que tener en cuenta que la
variable en estudio es el número de hijos (discreta), que toma los valores
existentes entre 0 y 6 hijos y las frecuencias son el conjunto de familias, de
esta forma tenemos:
xi fi Fi hi Hi
0 2 2 0.04 0.04
1 4 6 0.08 0.12
2 21 27 0.42 0.54
3 15 42 0.3 0.84
4 6 48 0.12 0.96
5 1 49 0.02 0.98
6 1 50 0.02 1
n=50
b. En la columna de las fi: 2+4+21=27 ó en la columna de las Fi: F2= 27
c. En la columna de las fi: 21+15=36 ó en la columna de las Fi: 42-6=36
d. En la columna de las hj: 0.12+0.02+0.02=0.16, que supone un 16% ó en
la columna de las Hi: 1-0.84=0.16, 16%
Prof. Simón Cabrera página 9 de 32
ESTADISTICA DESCRIPTIVA
DISTRIBUCIONES DE FRECUENCIAS AGRUPADAS
Es aquella distribución en la que la disposición tabular de los datos estadísticos
se encuentran ordenados en clases y con la frecuencia en cada clase; es decir,
los datos originales de varios valores adyacentes del conjunto se combinan
para formar un intervalo de clase. No existen normas establecidas para
determinar cuándo es apropiado utilizar datos agrupados o datos no
agrupados; sin embargo, se sugiere que cuando el número total de datos (N)
es igual o superior 50 y además el rango o recorrido de la serie de datos es
mayor de 20, entonces, se utilizará la distribución de frecuencia para datos
agrupados, también se utilizará este tipo de distribución cuando se requiera
elaborar gráficos lineales como el histograma, el polígono de frecuencia o la
ojiva.
La razón fundamental para utilizar la distribución de frecuencia de clases es
proporcionar mejor comunicación acerca del patrón establecido en los datos y
facilitar la manipulación de los mismos. Los datos se agrupan en clases con el
fin de sintetizar, resumir, condensar o hacer que la información obtenida de una
investigación sea manejable con mayor facilidad.
Al agrupar los datos en una distribución de frecuencia de clase se pierde parte
de la información. La reducción o agrupamiento a que son sometidos los datos
de una serie de valores cuando existen muchos valores diferentes, originan los
denominados errores de agrupamiento; sin embargo, estos errores son en
general muy pequeños, razón por la cual la distribución de frecuencia de clase
tiene una validez estadística práctica.
Para agrupar los datos en intervalos de clase se deben seguir las siguientes
reglas generales:
• El numero de intervalos de clase se toma entre 5 y 15 dependiendo de
los datos.
• Cada observación debe estar incluida en una y solo una clase o
intervalo.
• El valor mas pequeño y mas grande deben entrar en la clasificación.
• No deben existir brechas o vacíos entre clases sucesivas.
• Los intervalos no se deben sobreponer.
• En la medida de lo posible, se debe utilizar la misma amplitud para todos
los intervalos.
COMPONENTES DE UNA DISTRIBUCIÓN DE FRECUENCIAS DE CLASES
1.- Clase o Intervalo de clase.- Son divisiones o categorías en las cuales se
agrupan un conjunto de datos ordenados con características comunes. Para
organizar los valores de la serie de datos hay que determinar un número de
clases que sea conveniente. En otras palabras, que ese número de intervalos
no origine un número pequeño de clases ni muy grande. Un número de clases
pequeño puede ocultar la naturaleza natural de los datos y un número muy alto
puede provocar demasiados detalles como para observar alguna información
de gran utilidad en la investigación. A las fronteras del intervalo, la llamaremos,
límites inferior y superior de la clase y los denotaremos por Li-1, Li.
Prof. Simón Cabrera página 10 de 32
ESTADISTICA DESCRIPTIVA
2.- Punto medio o Marca de clase ( X& ).- Es la semisuma del límite inferior y
superior de una clase, tal como lo indica la siguiente formula:
2
1−
• +
= ii
i
LL
X .
3.- Amplitud , Longitud o Tamaño del Intervalo.- Los intervalos de clases
pueden ser de tres tipos: Clases de igual tamaño, clases de tamaños
desiguales y clases abiertas. En términos generales, las clases de igual tamaño
son los mas utilizados y recomendados para los cálculos estadísticos. Se
designa por las letras Ic.
Nota: Al número de observaciones de una clase se le llama frecuencia de
clase, si dividimos esta frecuencia por el número total de observaciones, se
llama frecuencia relativa de clase, y del mismo modo que lo hacíamos para
datos sin agrupar definiríamos Hi, y Fi.
PROCEDIMIENTO PARA CONSTRUIR UNA DISTRIBUCIÓN DE
FRECUENCIAS AGRUPADA EN INTERVALOS
1. Determinar el máximo y mínimo entre los valores que tenemos en la
muestra y calcular el recorrido de la variable o rango, es decir,
R=Xmax-Xmin
2. Calcular el número de clases a utilizar. Existen diversos criterios para
determinar el numero de clases, ante tanta diversidad de criterios, se ha
considerado que lo mas importante es dar un ancho o longitud de clases
a todos los intervalos de tal manera que respondan a la naturaleza de
los datos y al objetivo que se persigue y esto se logra con la practica.
Existe una forma para determinar el numero de clases y la misma puede
ilustrarse en el siguiente cuadro:
Numero de Datos Numero de Intervalos
10 - 100 De 4 a 8
100 - 1.000 De 8 a 11
1.000 - 10.000 De 11 a 14
Cuando se tenga dudas en determinar el numero de intervalos de clases, es de
gran utilidad utilizar el método sugerido por Hebert A. Sturges, el cual establece
que: K= 1+3,322 log(n) = numero de intervalos. En este curso se utilizará este
método siempre y cuando el mismo sea aplicable.
3. Determinamos la amplitud o tamaño de los intervalos través de la
siguiente formula:
ervalosdeN
R
Ic
intº
= = ancho o tamaño del intervalo.
Prof. Simón Cabrera página 11 de 32
ESTADISTICA DESCRIPTIVA
Ejemplo 2
Un nuevo hotel va abrir sus puertas en una cierta ciudad. Antes de decidir el
precio de sus habitaciones, el gerente investiga los precios por habitación de
40 hoteles de la misma categoría de esta ciudad. Los datos obtenidos (en miles
de pesetas) fueron:
3.3 3.3 3.7 3.8 3.9 3.9 3.9 4.0 4.1 4.2
4.2 4.3 4.3 4.3 4.3 4.4 4.4 4.5 4.5 4.5
4.5 4.7 4.7 4.7 4.7 4.8 4.9 5.0 5.0 5.1
5.1 5.3 5.3 5.4 5.6 5.8 5.8 6.0 6.1 6.1
Procedimiento:
1.- El menor valor es 3.3 y el mayor 6.1, la diferencia es 2.8 y por tanto R=2.8.
2.- K= 1+3,322 log(40) = 6.3 ≈ 6 números de intervalos
3.- Ic = 2.8 / 6 = 0.467 ≈ 0.5 tamaño de los intervalos
Así pues la tabla sería:
CLASES fi Fi Ci hi Hi
[3.3, 3.8) 3 3 3.5 0.075 0.075
[3.8, 4.3) 8 11 4 0.2 0.275
[4.3, 4.8) 14 25 4.5 0.35 0.625
[4.8, 5.3) 6 31 5 0.15 0.775
[5.3, 5.8) 4 35 5.5 0.1 0.875
[5.8, 6.3) 5 40 6 0.125 1
¿Cuantos hoteles tienen un precio entre 3.3 y 3.8? 3
¿Cuantos hoteles tienen un precio superior a 4.8? 15
¿Que porcentaje de hoteles cuestan como mucho 4.3? 27.5 %
Prof. Simón Cabrera página 12 de 32
ESTADISTICA DESCRIPTIVA
MÉTODOS GRÁFICOS
La forma de la distribución de frecuencias se percibe más rápidamente si la
representamos gráficamente. Se resume la información de la muestra de forma
grafica con fines clarificadores o para enfatizar y descubrir determinadas
características que de otra manera seria muy difícil de apreciar. Un grafico
siempre es mas inmediato de comprender que un conjunto de datos
estadísticos. Las representaciones graficas varían según el tipo de variable:
a. Gráficos para variables Discretas y Categóricas
DIAGRAMA DE BARRAS: Es la representación gráfica usual para variables
cuantitativas discretas o para variables cualitativas. En el eje de ordenadas
representamos los diferentes valores de la variable (xi). Sobre cada valor
levantamos una barra de altura igual a la frecuencia (absoluta o relativa).
Ejemplo:
0
20
40
60
80
100
120
140
160
180
1er
trim.
2do
trim.
3er
trim.
4to
trim.
DIAGRAMA DE SECTORES O DE PASTEL: Es el más usual en variables
cualitativas. Se representan mediante círculos. A cada valor de la variable se le
asocia el sector circular proporcional a su frecuencia.
Ejemplo: Los siguientes datos corresponden a una encuesta referente a
elecciones locales de un partido político:
xi fi
a favor 50%
en contra 40%
abstención 10%
Para construir el diagrama de sectores partimos del hecho de que un circulo
encierra un total de 360 grados. Luego, mediante una regla de tres simple,
repartimos los 360 grados en distintos sectores, de acuerdo con cada
porcentaje; tenemos así que para determinar el sector correspondiente al 50%,
resolvemos la ecuación:
180
100
360*50
==X
Prof. Simón Cabrera página 13 de 32
ESTADISTICA DESCRIPTIVA
Esto es, el 50% corresponde a un sector circular de medida 180 grados. A
continuación, con ayuda de un transportador, señalaremos el sector circular de
medida 180 grados. Igualmente, para el 40% se tiene 144 grados y para el 10%
se tiene 36 grados. La siguiente figura muestra la representación grafica.
Elecciones Locales
a favor
en contra
abstencion
b. Gráficos para variables continuas
HISTOGRAMA: Es la representación gráfica de las frecuencias agrupadas de
una variable continua sobre intervalos. A diferencia de los diagramas de barras,
los histogramas dibujan rectángulos unidos entre si, lo que significa que existe
continuidad en la variable cuyos valores se representan en el eje horizontal que
se haya dividido en intervalos de igual amplitud. Las áreas de los rectángulos
son proporcionales a las frecuencias que representan.
Ejemplo:
Histograma correspondiente a las horas extras
laboradas por un grupo de obreros petroleros.
16
21
16
4
6
11
3
15
8
0
5
10
15
20
25
15 20 25 30 35 40 45 50 55 60 65
Clases
Frecuencias
Prof. Simón Cabrera página 14 de 32
ESTADISTICA DESCRIPTIVA
El histograma o diagrama de barras proporcionan mucha información respecto
a la estructura de los datos, nos permite evidenciar fundamentalmente tres
características:
1. Forma de la distribución.
2. Acumulación o tendencia posicional (valor central de la distribución).
3. Dispersión o variabilidad.
Cuando nos encontramos en distribuciones donde los intervalos no tienen la
misma amplitud, las barras del histograma tienen que tener un área
proporcional a la frecuencia que queramos representar
EJERCICIOS
1.- Los siguientes datos representan los ingresos diarios (en miles) de 20
obreros de cierta compañía.
16, 16, 17, 18, 18, 19, 19, 19, 20, 20, 20, 20, 20, 21, 21, 22, 22, 23, 23, 24.
a. Construya una tabla de frecuencias agrupadas utilizando la formula
de Sturges.
b. Construya un histograma de frecuencias. Comente.
c. ¿Cuántos obreros tienen un ingreso diario menor de 22?
d. ¿Qué porcentaje de obreros tienen un ingreso diario entre 16 y 19?
2.- Los siguientes datos corresponden al tiempo que han necesitado 30 clientes
de un banco para llevar a cabo una transacción bancaria:
0.1 0.4 1.1 1.2 1.3 1.4 1.5 1.6 2.0 2.5 2.8 2.8 3.1 3.3 3.6
4.1 4.1 4.3 4.6 5.0 5.5 6.4 6.5 7.7 7.3 7.4 8.0 9.5 9.5 10.0
a. Construya una tabla de frecuencias agrupadas utilizando la formula
de Sturges.
b. Construya un histograma de frecuencias. Comente.
3.- Con el fin de asignar viáticos, la compañía “El Refinanciamiento” obtuvo
unas estadísticas sobre le numero de kilómetros recorridos por sus
vendedores. A continuación se muestran los resultados. Construya una tabla
de distribución de frecuencias agrupadas a cinco intervalos.
10 11 12 12 13 13 13 14 14 15
15 16 16 16 16 16 16 16 17 19
Prof. Simón Cabrera página 15 de 32
ESTADISTICA DESCRIPTIVA
MEDIDAS DE POSICIÓN
INTRODUCCIÓN
Después que los datos han sido reunidos y tabulados, se inicia el análisis con el fin de
calcular un número único, que represente o resuma todos los datos. Las medidas de
posición forman parte del conjunto de medidas descriptivas numéricas, las cuales se
clasifican en parámetros –cuando se calculan a partir de la población total- y los
estadígrafos - cuando se calculan a partir de los datos de una muestra. Una medida
de posición es un número que se toma como orientación para referirnos a un conjunto
de datos.
Uno de los problemas fundamentales que presenta un análisis estadístico, es el de
buscar el valor más representativo de una serie de valores. El primer paso que hay
que realizar para que se entienda una larga serie de valores u observaciones, es el de
resumir los datos en una distribución de frecuencia; esto no es suficiente para fines
practico, puesto que a menudo es necesario una sola medida descriptiva, y en
especial cuando se requiere comparar dos o más serie estadísticas. Es necesario
continuar el proceso de reducción hasta sustituir todos los valores observados por uno
solo que sea representativo, de tal forma que permita una interpretación global del
fenómeno en estudio; para que ese valor sea representativo debe reflejar la tendencia
de los datos individuales de la serie de valores. Un valor o dato de la serie con estas
características recibe el nombre de promedio, media o medida de posición, esto es
debido a su ubicación en la zona central de la distribución. Las medidas de posición
son de gran importancia en el resumen estadístico, ya que representan un gran
número de valores individuales por uno solo.
El valor más representativo de un conjunto de datos por lo general no es el valor más
pequeño ni el más grande, es un número cuyo valor se encuentra en un punto
intermedio de la serie de datos. Por lo tanto un promedio es con frecuencia un valor
referido que representará la medida de posición de la serie de valores. Las medidas de
posición se emplean con frecuencia como mecanismo para resumir un gran número de
datos o cantidades con la finalidad de obtener un valor que sea representativo de la
serie.
Las Principales Medidas de Posición son:
La Media Aritmética, Mediana, Moda, los cuartiles, Deciles y Percentiles.
Todas ellas a su manera tratan de dar una idea del numero alrededor del cual se
centra a todo el conjunto de datos.
CARACTERÍSTICAS DE LAS MEDIDAS DE POSICIÓN
• Deben ser definidas rigurosamente y no ser susceptibles de diversas
interpretaciones.
• Deben depender de todas las observaciones de la serie, de lo contrario no
seria una característica de la distribución.
• No deben tener un carácter matemático demasiado abstracto.
• Deben ser susceptibles de cálculo algebraico, rápido y fácil.
Prof. Simón Cabrera página 16 de 32
ESTADISTICA DESCRIPTIVA
MEDIA ARITMÉTICA
La media aritmética ( X ) o simplemente la media es la medida de posición de más
importancia y utilización en las aplicaciones estadísticas por su fácil calculo e
interpretación. Se trata del valor medio de todos los valores que toma la variable
estadística de una serie de datos. La media es el valor más representativo de la serie
de valores, es el punto de equilibrio, el centro de gravedad de la serie de datos. Por lo
general se le designa con X .
La media aritmética de una serie de n valores de una variable X1, X2, X3; X4,.........Xn,
es el cociente de dividir la sumatoria de todos los valores que toma la variable Xi, entre
el número total de ellos. La formula se puede expresar así:
n
X
X
n
i
i∑=
= 1
.
Desviaciones o desvíos.- Son diferencias algebraicas entre cada valor de la serie
o cada punto medio y la media aritmética de dicha serie, o un valor cualquiera tomado
arbitrariamente. Los desvíos o desviación se designan con la letra di.
Dado una serie de valores X1, X2, X3, .......Xn , se llama desvío a la diferencia entre un
valor cualquiera Xi de la serie y un valor indicado k de esa misma serie. Si el valor
indicado k de la serie corresponde precisamente a la media aritmética de esos valores
dados, se dice entonces que los desvíos son con respecto a la media aritmética. En
símbolo: ).( XXd ii −=
PROPIEDADES DE LA MEDIA ARITMÉTICA
1. La suma de las desviaciones con respecto a la media aritmética es igual a cero.
.0=∑ id
2. La suma de las desviaciones al cuadrado de los diversos valores con respecto a la
media aritmética es menor que la suma de las desviaciones al cuadrado de los
diversos valores con respecto a cualquier punto K, que no sea la media aritmética.
( )2
∑ − XXi < ( )2
∑ − KXi .
3. La media aritmética total o conjunta de dos o más serie de datos, se puede
calcular en función de las medias aritméticas parciales y del número de datos de
cada una de ellas, mediante la siguiente formula:
,.......
........
3
3
2
2
1
1332211
k
kkk
t
n
X
n
X
n
X
n
X
N
XnXnXnXn
X
∑∑∑∑ +++=
++++
=
Donde:
,......321 knnnnN ++++= en esta n1, n2, n3 y nk es el número de datos de cada
serie.
Además, sonXyXXX k .,.....,.,.,....,. 3.,21 las medias de cada una de las series.
Prof. Simón Cabrera página 17 de 32
ESTADISTICA DESCRIPTIVA
4. La media del producto de una constante por una variable, es igual al producto de la
constante por la media de la variable.
.XK
n
XK
n
KX
X
ii
===
∑∑
5. La media de la suma de una constante más una variable, es igual a la media de la
variable más la constante. ( )
( )
.KX
n
K
n
X
n
KX
X
ii
KXi
+=+=
+
=
∑∑∑
+ ., de
la misma forma se cumple esta propiedad para la resta.
CARACTERÍSTICAS PRINCIPALES DE LA MEDIA ARITMÉTICA
• El valor de la media depende de cada una de las medidas que forman la serie
de datos, y se halla afectada excesivamente por los valores extremos de la
serie de datos.
• La media se calcula con facilidad y es única para cada caso y permite
representar mediante un solo valor la posición de la serie de valores.
• La media es una medida de posición que se calcula con todos los datos de la
serie de valores y es susceptible de operaciones algebraicas.
CÁLCULO DE LA MEDIA PARA DATOS NO AGRUPADOS
Para calcular la media de datos no agrupados en clases se aplica la siguiente formula:
n
X
X
i∑= . En donde n es el número total de datos y son los valores de la
variable.
iX
Ejemplo:
Calcule la media aritmética de los siguientes valores: { }14,11,9,8,7,5=iX
.9
6
54
6
14119875
==
+++++
==
∑
n
X
X
i
Por lo tanto la media es 9.
CÁLCULO DE LA MEDIA PARA DATOS AGRUPADOS
Cuando se trabaja con la distribución de frecuencia agrupada, se parte del supuesto
de que todos los datos comprendidos en un intervalo de clase se distribuyen
uniformemente a lo largo de este, entonces se puede tomar la marca de clase o punto
medio ( ) del intervalo como adecuada representación de los valores que conforman
el mencionado intervalo. Para calcular la media en estas condiciones se pueden
utilizar tres métodos: El método directo o largo y dos métodos abreviados. En este
curso utilizaremos el primer método.
X&
Prof. Simón Cabrera página 18 de 32
ESTADISTICA DESCRIPTIVA
MÉTODO DIRECTO
Este método se le conoce también como método largo; el mismo resulta demasiado
engorroso cuando las magnitudes de los puntos medios o de las frecuencias de clase
son muy grandes, debido a que los cálculos son demasiados extensos. Los pasos a
seguir para calcular la media con este método son los siguientes:
1. Se agrupan los datos en clases y se llevan a una columna, se calculan los
puntos medios de cada clase y se colocan en sus respectivas columnas, se
determinan las frecuencias de cada clase y se ubican en sus respectivas
columnas.
2. Se multiplican los puntos medios de cada clase por sus respectivas frecuencias,
luego se obtiene la sumatoria de las frecuencias (fi) multiplicadas por el punto
medio ( X& ) así: .ii Xf &∑
3. Luego se calcula la media aritmética aplicando la formula:
nDonde
n
Xf
nf
Xf
X
i
i
ii
.....
∑
∑
∑ =
=
=
&&
es igual al número total de datos.
Ejemplo:
Calcule la media de la siguiente distribución de frecuencia correspondiente al peso en
Kg. de un grupo de obreros. Realice los cálculos respectivos para completar el
siguiente cuadro.
CLASES if
75-------79 20
80-------84 40
85-------89 60
90-------94 100
95 ------99 140
=∑ if n =360
Solución:
PESOS X& Nº DE OBREROS Xfi
&
75-------79 77 20 1540
80-------84 82 40 3280
85-------89 87 60 5220
90-------94 92 100 9200
95 ------99 97 140 13580
n =360 =∑ ii Xf & 32820
Aplicando la formula se tiene: Interpretación:
.17.91
360
32820
===
∑
N
Xf
X
ii
& El peso promedio del grupo de
360 obreros es de 91.17 Kg.
Prof. Simón Cabrera página 19 de 32
ESTADISTICA DESCRIPTIVA
LA MEDIANA
La mediana es el valor que divide en dos partes iguales, al conjunto de observaciones
ordenadas respecto de sus magnitudes, de tal manera que el numero de datos por
encima de la mediana sea igual al numero de datos por debajo de la misma. Se
designa por las letras Me. Tal como sucede con la media, el método de determinación
depende de si los datos son agrupados o no.
CÁLCULO DE LA MEDIANA PARA DATOS NO AGRUPADOS (Discretos)
Para encontrar la mediana en una serie de datos no agrupados, lo primero que se
hace es ordenar los datos en una forma creciente o decreciente y luego se ubica la
posición que esta ocupa en esa serie de datos; para ello hay que determinar si la serie
de datos es par o impar.
Si el número n es impar, entonces la posición de la mediana se determina por la
formula:
)
2
1
(
+= nXMe , luego el número que se obtiene indica el lugar o posición que
ocupa la mediana en la serie de valores, luego la mediana será el número que ocupe
el lugar de lo posición encontrada.
Si n es par, se aplica la formula
2
)2/2()2/( ++
=
nn XX
Me El resultado obtenido, es la
posición que ocupara la mediana, pero en este caso se ubica la posición de la
mediana por ambos extremos de la serie de valores y los dos valores que se obtengan
se le saca la media y esta será la mediana buscada, por lo tanto la mediana, en este
caso, es un número que no se encuentra dentro de la serie de datos dados.
Ejemplos:
Sean los siguientes datos, 5, 12, 7, 8, 10, 6, y 9, los años de servicios de un grupo de
trabajadores. Determine la mediana.
Lo primero que se hace es ordenar los datos en forma creciente o decreciente; Los
datos ordenados quedaran así:
5, 6, 7, 8, 9, 10, 12.
Luego, como se trata de un numero impar de datos (n=7), se aplica la formula
)4(
)
2
17
()
2
1
(
XXXMe n === ++ , para ubicar la posición de la mediana. Esto indica que la
mediana ocupa la posición 4, que en la serie de valores esa posición corresponde al
número 8, entonces, Me = 8.
Tomemos ahora los datos: 5, 5, 7, 9, 11, 12, 15, 18.
Como se trata de un numero par de datos (n =8), la mediana esta dada por:
10
2
20
2
119
22
)5()4()2/2()2/(
==
+
=
+
=
+
=
+ XXXX
Me
nn
Prof. Simón Cabrera página 20 de 32
ESTADISTICA DESCRIPTIVA
Cuando los valores de un conjunto de datos se agrupan en una distribución de
frecuencia de clase, cada valor pierde su identidad, por tal motivo la mediana obtenida
de una distribución de frecuencia de datos puede no ser la misma que la mediana
obtenida de los datos sin arreglar en clases, pero el resultado será una aproximación.
Cuando se trata de datos agrupados, la mediana se obtiene mediante el método de
interpolación. La interpolación parte del supuesto de que los datos de cada intervalo
de la distribución están igualmente distribuidos.
PASOS PARA DETERMINAR LA MEDIANA EN DATOS AGRUPADOS
1. Se elabora la tabla de frecuencia de datos con sus diferentes intervalos de clases,
se ubican las frecuencias fi y se calculan las frecuencias acumuladas Fi de esa
distribución.
2. Se determina la ubicación o posición de la mediana en el intervalo de la
distribución de frecuencia, mediante la formula
2
n
. El resultado obtenido
determinará la clase donde se encuentra ubicada la mediana, lo cual se
conseguirá en la clase donde la frecuencia acumulada Fi sea igual o superior a
este resultado. Luego se aplica la formula: Ic
fi
F
n
LiMe
i
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎣
⎡
−
+=
− )1(
2
Donde,
2
n
= posición de la mediana
Li = es el limite inferior de la clase donde se encuentra ubicada la mediana.
F(i-1) = es el valor de la frecuencia acumulada anterior a la clase mediana.
fi = es el valor de la frecuencia de clase donde se encuentra la mediana.
Ic = es el tamaño del intervalo de clase.
n = es el número total de datos de la distribución en estudio.
Ejemplo:
Dada la siguiente distribución de frecuencia referida a las horas extras laboradas por
un grupo de obreros. Calcule la mediana. Realice los cálculos respectivos para
completar el siguiente cuadro.
N° de horas Extras Obreros
55------59 6
60------64 20
65------69 18
70------74 50
75------79 17
80------84 16
85------89 5
n = 132
Prof. Simón Cabrera página 21 de 32
ESTADISTICA DESCRIPTIVA
Solución:
Cuadro con las frecuencias acumuladas:
N° de horas Extras Obreros Fi
55------59 6 6
60------64 20 26
65------69 18 44
70------74 50 94
75------79 17 111
80------84 16 127
85------89 5 132
N = 132
Clase Mediana
,66
2
132
2
==
n
luego se busca en la frecuencia acumulada Fi, un valor que sea igual o
superior a 66, este se encuentra en la clase 70 -74, la cual llamaremos clase
mediana. Por lo tanto el limite inferior de esa clase es 70 = Li. La frecuencia absoluta
de esa clase es 50 = fi , F(i-1) = 44 y el Ic = 5. Aplicando la formula se tiene:
.2.722.2705.
50
22
705
50
4466
70 =+=⎟
⎠
⎞
⎜
⎝
⎛
+=⎥⎦
⎤
⎢⎣
⎡ −
+=Me
Luego la mediana de esa distribución es 72.2. Esto quiere decir que un 50 % de los
obreros trabajaron horas extras por debajo de 72.2 horas y el otro 50 % trabajaron
horas extras por encima de 72.2 horas.
CARACTERÍSTICAS DE LA MEDIANA
• La mediana no es afectada por los valores extremos de una serie de valores,
puesto que la misma no es calculada con todos los valores de la serie.
• La mediana no esta definida algebraicamente, ya que para su cálculo no
intervienen todos los valores de la serie.
• La mediana en algunos casos no se puede calcular exactamente y esto ocurre
cuando en una serie de valores para datos no agrupados el número de datos
es par, en este caso la mediana se calcula aproximadamente.
• La mediana se puede calcular en aquellas distribuciones de frecuencia de
clases abierta, siempre y cuando los elementos centrales puedan ser
determinados.
• La suma de los valores absolutos de las desviaciones de los datos individuales
con respecto a la mediana siempre es mínima. (propiedad)
Prof. Simón Cabrera página 22 de 32
ESTADISTICA DESCRIPTIVA
LA MODA
La moda es la medida de posición que indica la magnitud del valor que se presenta
con más frecuencia en una serie de datos; es pues, el valor de la variable que más se
repite en un conjunto de datos. De las medidas de posición la moda es la que se
determina con mayor facilidad, ya que se puede obtener por una simple observación
de los datos en estudio, puesto que es el dato que se observa con mayor frecuencia.
Se designa con las letras Mo.
En las representaciones gráficas la moda es el punto más alto de la gráfica. La
obtención de la moda para datos agrupados no es un valor exacto, ya que varía con
las diferentes formas de agrupar una distribución de frecuencia.
En algunas distribuciones de frecuencias o serie de datos no agrupados o agrupados
se pueden presentar dos o más modas, en estos casos se habla de serie de datos
bimodales o multimodales respectivamente. Estos tipos de distribuciones o series de
valores se deben a la falta de homogeneidad de los datos.
Cuando una serie de valores es simétrica, la media, la mediana y el modo coinciden, y
si el grado de asimetría de la serie es moderada, la mediana estará situada entre la
media y el modo con una separación de un tercio entre ambas. Tomando en cuenta
esta relación, cuando se tengan dos de esta medidas se puede determinar la tercera;
sin embargo es conveniente utilizar esta relación para calcular solamente la moda ya
que para calcular la media y la mediana existen formulas matemáticas que dan
resultados más exactos; la formula matemática para calcular la moda por medio de la
relación antes mencionada es: ( )MeXXMo −−= 3 .
Cuando los datos se encuentran no agrupados la determinación de la moda es sencilla
y exacta; pero para calcularla en datos agrupados existen varios métodos; cada uno
de los cuales puede dar un valor diferente de la moda: En este curso se dará el
método de la interpolación por considerarse uno de los más precisos en el cálculo de
esta. Este método puede expresarse mediante la siguiente formula:
IcLiMo .
21
1
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
Δ+Δ
Δ
+=
Donde,
Li = es el limite inferior de la clase modal.
1Δ = es la diferencia entre la frecuencia absoluta de la clase modal y la frecuencia de
la clase anterior a la modal.
2Δ = es la diferencia entre la frecuencia absoluta de la clase modal y la frecuencia de
la clase siguiente a la modal.
Ic = es el tamaño del intervalo de clase.
Prof. Simón Cabrera página 23 de 32
ESTADISTICA DESCRIPTIVA
Ejemplo:
Dada la siguiente distribución de frecuencia correspondiente al peso en Kg. de un
grupo de trabajadores de una empresa, calcule la moda.
Peso (Kg) Trabajadores
30-----39 2
40-----49 2
50-----59 7
60-----69 11
70-----79 12
80-----89 16
90-----99 2
TOTAL
Clase modal
La clase que presenta mayor frecuencia absoluta es 80----89, entonces esta sera la
clase modal, donde Li = 80 10;14216;41216 21 ==−=Δ=−=Δ Ic
Aplicando la formula se tiene:
.22.8222.280
18
40
8010.
144
4
80
21
1
=+=+=⎟
⎠
⎞
⎜
⎝
⎛
+
+=→⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
Δ+Δ
Δ
+= MoLMo i
Este resultado de la moda se interpreta así: La mayoría de los trabajadores tiene un
peso aproximadamente de 82.22 Kg .
CARACTERÍSTICAS DE LA MODA
• El valor de la moda puede ser afectado grandemente por el método de
elaboración de los intervalos de clases.
• El valor de la moda no se halla afectado por la magnitud de los valores
extremos de una serie de valores, como sucede en la media aritmética.
• La moda se puede obtener en una forma aproximada muy fácilmente, puesto
que la obtención exacta es algo complicado.
• La moda tiene poca utilidad en una distribución de frecuencia que no posea
suficientes datos y que no ofrezcan una marcada tendencia central.
• No es susceptible de operaciones algebraicas posteriores.
• La moda se utiliza cuando se trabaja con escalas nominales aunque se puede
utilizar con las otras escalas.
• La moda es útil cuando se esta interesado en tener una idea aproximada de la
mayor concentración de una serie de datos.
Prof. Simón Cabrera página 24 de 32
ESTADISTICA DESCRIPTIVA
OTRAS MEDIDAS POSICIÓNALES
Cuando se estudio la mediana se pudo detectar que esta divide la serie de valores en
dos partes iguales, una generalización de esta medida da origen a unas nuevas
medidas de posición denominadas:
Cuartiles; Deciles y Percentiles. Estas nuevas medidas de posición surgen por la
necesidad de requerir de otras medidas que expresen diferentes situaciones de
orden, aparte de las señaladas por la mediana. Por lo tanto es interesante ubicar otras
medidas que fraccionen una serie de datos en diferentes partes. Es bueno destacar
que los cuartiles, los Deciles y los Percentiles son unas variantes de la mediana: De la
misma forma los percentiles abarcan tanto a los cuartiles como a los Deciles.
LOS CUARTILES.- Son medidas posiciónales que dividen la distribución de frecuencia
en cuatro partes iguales. Se designa por el símbolo Qc en la que c corresponde a los
valores 1, 2 y 3. El Q1 es el valor debajo del cual queda el 25 % de los datos; Q3 deja
el 75 % de los datos y Q2 divide la distribución de frecuencia en dos partes iguales, un
50 % que esta por debajo de los valores de Q2 y otro 50 % que esta por encima del
valor de Q2. El Q2 es igual a la mediana.
CÁLCULO DE LOS CUARTILES.- Para datos no agrupados no tiene ninguna utilidad
practica calcular los cuartiles. Para el cálculo de los cuartiles en datos agrupados en
una distribución de frecuencia existe un método por análisis gráfico y otro por
determinación numérica, por fines prácticos en esta cátedra se utilizara él último
método. Para calcular los cuartiles por el método numérico se procede de la siguiente
manera:
1. Se localiza la posición del cuartil solicitado aplicando la formula de posición:
4
cn
Qc = , en donde c viene a ser el número del cuartil solicitado, n corresponde al
número total de datos de la distribución y 4 corresponde al número de cuartiles que
presenta una distribución de frecuencia.
2. Se determina la posición que ocupa el cuartil mediante la formula:
4
cn
Qc = , el
resultado obtenido determinara la clase donde se encuentra ubicado el cuartil, lo
cual se conseguirá en la clase donde la frecuencia acumulada Fi que sea igual o
superior a este resultado. Luego se aplica la formula:
.4
)1(
Ic
fi
F
cn
LiQ
i
c
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎣
⎡
−
+=
−
Donde,
4
cn
= Posición que ocupa el cuartil en la distribución de frecuencia.
c = corresponde al número del cuartil solicitado: 1,2 3.
Li = Limite real inferior de la clase donde se encuentra ubicado el cuartil.
F( i-1) = Frecuencia acumulada anterior a la clase donde se encuentra el cuartil.
fi = Frecuencia absoluta de clase donde se encuentra el cuartil.
Prof. Simón Cabrera página 25 de 32
ESTADISTICA DESCRIPTIVA
LOS PERCENTILES – Son medidas posesiónales que dividen la distribución de
frecuencia en 100 partes iguales. Con estos se puede calcular cualquier porcentaje de
datos de la distribución de frecuencia. Los percentiles son las medidas más utilizadas
para propósitos de ubicación de valor de una serie de datos ubicados en una
distribución de frecuencia. El número de percentiles de una distribución de frecuencia
es de 99. El percentil 50 es igual a la mediana y al cuartil 2, es decir:
por encima y 50 % por debajo de los datos de la distribución.%50502 === PQMe
El cálculo de los percentiles es similar al cálculo de los cuartiles con una variante en
la posición de ubicación de estos, que viene expresada por la siguiente formula:
100
pn
PP = . Con esta posición se aplica la formula: Ic
fi
F
pn
LiP
i
p
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎣
⎡
−
+=
− )1(
100 .
Ejemplo:
Dada la siguiente distribución correspondiente al salario semanal en dólares de un
grupo de obreros de una empresa petrolera trasnacional. Calcule: a) Q1, b) Q2, c)
Compare los resultados con la mediana, d) P25, f) P50, g) P70
SALARIO EN $ Obreros Fi
200-----299 85 85
300-----399 90 175
400-----499 120 295
500-----599 70 365
600-----699 62 427
700-----799 36 463
463
Clase cuartil
Clase mediana
Clase percentil
a) Para calcular Q1 se determina primero la posición así: .75.115
4
463
4
4631
1 ===
x
Q
Q1 = 115.75. Con ese valor de la posición encontrado se busca en las frecuencias
acumuladas para ver cual de esas es mayor o igual a ese valor. Observando las
frecuencias acumuladas se puede detectar que la posición 115.75 se encuentra
en la clase 300------399, por lo tanto el Li = 300, fi = 90, y la F(i-1) = 85 y Ic = 100,
aplicando la formula se tiene:
17.33417.34300
90
3075
300100.
90
8575.115
3001 =+=+=⎥⎦
⎤
⎢⎣
⎡ −
+=Q
Este valor de Q1 indica que el 25 % de los obreros en estudio, devengan un salario
semanal por debajo de 334.17 $ y el 75 % restante gana un salario por encima de
334.17 $.
Prof. Simón Cabrera página 26 de 32
ESTADISTICA DESCRIPTIVA
b) Para calcular Q2=Me se determina primero la posición de este así.
5.231
4
4632
2 ==
x
Q , ahora se ubica esta posición en las frecuencias acumuladas
para determinar la posición de Q2, se puede observar en la distribución que esta
posición esta ubicada en la clase 400----499, entonces, Li = 400, fi = 120, F(i-1) = 175
y Ic = 100, aplicando la formula se tiene:
.08.44708.47400
120
5650
400100.
120
1755.231
4002 =+→+=⎥⎦
⎤
⎢⎣
⎡ −
+=Q
Este resultado de Q2 establece que el 50 % de los obreros de este estudio,
devengan un salario semanal por debajo de 447.08 $ y el otro 50 % devenga un
sueldo por encima de 447.08 $. Calcule la mediana y compárela con este resultado.
c) Calcular, Q2 = P50, además P25 = Q1, la comprobación de estos resultados se le
deja como practica al estudiante.
g) Para calcular P70 lo primero que se hace es determinar la posición,
10.324
100
46370
70 ==
x
P . Ahora se ubica este resultado en la columna de frecuencias
acumuladas para encontrar la posición de P70 en la distribución de frecuencia. Como
se puede observar en la tabla de distribución de frecuencia, P70 se encuentra ubicado
en la clase 500-------599, entonces, Li = 500, fi = 70, F(i-1) = 295 y Ic = 100,
aplicando la formula se tiene:
.57.54157.41500
70
2910
500100.
70
29510.324
50070 =+=+=⎥⎦
⎤
⎢⎣
⎡ −
+=P
Esto indica que el 70 % de los obreros devengan un sueldo semanal que esta por
debajo de 541.57 $ y que el 30% de los restantes obreros, ganan un salario por
encima de 541.57 $.
Prof. Simón Cabrera página 27 de 32
ESTADISTICA DESCRIPTIVA
MEDIDAS DE DISPERSION
INTRODUCCIÓN
La utilización de una medida de posición escogida para representar a los datos no
indica otras características que el conjunto de observaciones que posee. No todas las
observaciones son iguales a la medida de posición tomada o seleccionada; en general
los datos difieren unos de otros, por lo tanto se hace necesario encontrar ciertos
índices o medidas que indiquen la variabilidad o dispersión del conjunto de
observaciones que se estudian.
Una medida de variabilidad es un numero que nos indica el grado de dispersión en un
conjunto de datos. Si el valor es pequeño (respecto de la unidad de medida) entonces
hay una gran uniformidad entre los datos (homogénea). Por el contrario, un gran valor
nos indica poca uniformidad (heterogénea). Cuando es cero quiere decir que todos los
datos son iguales.
Las medidas de dispersión se clasifican en dos grupos:
• Medidas de Dispersión Absoluta.
Son aquellas que vienen expresadas en las mismas unidades originales que
indican la serie de datos. Entre las medidas de dispersión absoluta se encuentran:
el rango, el rango intercuartilico, la desviación media, la varianza y la desviación
típica.
• Medidas de Dispersión Relativas.
Estas medidas vienen expresadas en valores abstractos o porcentajes; su principal
función es la de determinar entre varias distribuciones la de mayor o menor
dispersión. La medida de dispersión relativa de mayor importancia es el coeficiente
de variación.
RANGO O RECORRIDO.
Es la medida de dispersión mas sencilla y se define como la diferencia entre el valor
mas alto menos el valor mas pequeño y se designa por R. Es decir, R = Xmax-Xmin para
datos no agrupados. Si los datos están agrupados en K clases el rango será la
diferencia entre el limite superior de la K-esima clase menos el limite inferior de la
primera clase.
El rango nos dará una primera idea sobre las dispersión de los datos ya que si su valor
es pequeño nos indicará una gran concentración de los datos, y si por el contrario su
valor es grande nos puede indicar una gran variabilidad o dispersión de los datos.
Prof. Simón Cabrera página 28 de 32
ESTADISTICA DESCRIPTIVA
RANGOS ESPECIALES
El rango nos da una idea de la dispersión total de las observaciones, por lo tanto
puede estar afectada por valores extremos dando en consecuencia una idea de alta
dispersión. Por tal motivo, se han definido otros rangos que tratan de subsanar este
problema.
RANGO ÍNTERCUARTILICO. Se define como la diferencia entre el cuartil tres(Q3) y
el cuartil uno(Q1) de una distribución de frecuencia y se expresa así: RI = Q3 − Q1.
RANGO SEMI-ÍNTERCUARTILICA. Es la diferencia entre el Q3 y el Q1 dividido
entre dos:
2
13 QQ
RSI
−
= .
Si los valores de la RI o RSI son pequeños indica una alta concentración de los datos
de la distribución en los valores centrales de la serie de datos. Estas medidas se
utilizan para comparar los grados de variación de los valores centrales en diferentes
distribuciones de frecuencias. Los mismos no son afectados por los valores extremos,
no se adaptan a la manipulación algebraica, por tal motivo son de poco utilidad.
DESVIACIÓN MEDIA. La desviación media de un conjunto de n observaciones x1, x2,
x3,. . .xn, es el promedio de los valores absolutos de las desviaciones (di) con respecto
a la media aritmética o la mediana. Si se denomina como DM a la desviación media,
entonces su formula matemática será la siguiente:
N
d
N
XX
DM
N
i
i
N
i
i ∑∑ ==
=
−
= 11
Esta formula es para datos no agrupados. Se toma el valor absoluto en la ecuación,
debido a que la primera propiedad de la media aritmética establece que los desvíos
(di) de una serie con respecto a la media aritmética siempre son iguales a cero, es
decir: di = 0.
Cuando los datos están en una distribución de clases o agrupados se aplica la
siguiente formula:
n
df
n
fXX
DM
N
i
ii
n
i
ii ∑∑ ==
=
−
= 11
&
En esta formula X& es el punto medio de cada clase y fi es la frecuencia de cada
clase. La Desviación Media a pesar de que para su cálculo se toman todas las
observaciones de la serie, por el motivo de no tomar en cuenta los signos de las
desviaciones (di), es de difícil manejo algebraico. Su utilización en estadística es muy
reducida o casi nula, su importancia es meramente histórica, ya que de esta formula
es la que da origen a la desviación típica o estándar.
Prof. Simón Cabrera página 29 de 32
ESTADISTICA DESCRIPTIVA
VARIANZA
Una manera de resolver el problema de los signos de las desviaciones respecto de la
media aritmética es elevándolos al cuadrado y luego sumar todos los resultados
obtenidos. Esta suma se puede considerar como una medida de la dispersión total de
los valores. Aquellos que estén mas alejados de la media aritmética tendrán un aporte
mayor a esta suma de cuadrados.
Su mayor utilidad se presenta en la estadística inductiva y se puede interpretar como
una medida de variación promedio (o el promedio de la suma de los cuadrados). Se
obtiene dividiendo la variación total entre el numero de unidades o medidas. Se
designa por la letra S2
su formula de calculo es al siguiente:
agrupadosnodatospara
n
XX
S
i
..,.
)( 2
2 ∑ −
=
agrupadosdatosparaX
n
Xf
n
XXf
S
iiii 2
22
2
)(
−=
−
=
∑ ∑
DESVIACIÓN TIPICA
Como la varianza es el promedio de los desvíos respecto de la media elevados al
cuadrado, viene entonces expresada en unidades cuadradas. Para obtener una
medida de dispersión en las unidades originales se le extrae la raíz cuadrada (positiva)
a la varianza, obteniendo así otra medida de dispersión denominada desviación típica
o estándar, la cual se designara por S y será igual a :
n
XX
S
i∑ −
=
2
)( &
Para datos no agrupados
2
22
)(
X
n
fX
n
fXX
S
iiii
−=
−
=
∑∑ &
Para datos agrupados
INTERPRETACIÓN DE LA DESVIACIÓN TÍPICA
La desviación típica como medida absoluta de dispersión, es la que mejor nos
proporciona la variación de los datos con respecto a la media aritmética, su valor se
encuentra en relación directa con la dispersión de los datos, a mayor dispersión de
ellos, mayor desviación típica, y a menor dispersión, menor desviación típica.
Su mayor utilidad se presenta en una distribución normal, ya que en dicha distribución
en el intervalo determinado por σ±X se encuentra el 68. 27% de los datos de la
serie; en el intervalo determinado por la σ2±X se encuentra el 95,45% de los datos
y entre la σ3±X se encuentra la casi totalidad de los datos, es decir, el 99,73% de
los datos; además, existe una regla general de gran utilidad para la comprobación de
los cálculos que dice: “una oscilación igual a seis veces la σ , centrada en la media
comprende aproximadamente el 99% de los datos”.
Prof. Simón Cabrera página 30 de 32
ESTADISTICA DESCRIPTIVA
Ejemplo:
Los siguientes datos corresponden al número de panes consumidos por un grupo de
familias de una urbanización de la ciudad, durante una semana determinada.
Clases fi
30—32 10
33—35 18
36—38 60
39—41 100
42—44 80
45—47 14
48—50 6
∑ 288
Solución:
Clases fi iX&
ii Xf & 2
ii Xf &
30—32 10 31 310 9610
33—35 18 34 612 20808
36—38 60 37 2220 82140
39—41 100 40 4000 160000
42—44 80 43 3440 147920
45—47 14 46 644 29624
48—50 6 49 294 14404
∑ 288 11520 464508
.0.40
288
11520
===
∑
n
Xf
X
ii
&
88.12
288
11520
288
464508
2
2
2
2
=⎟
⎠
⎞
⎜
⎝
⎛
−=−=
∑ X
n
Xf
S
ii
Interpretación.- El resultado obtenido indica que en promedio, el consumo de pan de
trigo del grupo de familias de esa urbanización se dispersa con respecto a su media
aritmética en una cantidad igual a 3.59.
=⎟
⎠
⎞
⎜
⎝
⎛
−=
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−=
∑∑ 2
22
1
288
11520
288
464508
n
Xf
n
Xf
S
iii
&&
.59.388.12160088.1612 ==−=
Prof. Simón Cabrera página 31 de 32
ESTADISTICA DESCRIPTIVA
DISPERSIÓN RELATIVA
Las medidas de variabilidad, estudiadas hasta ahora, solo permitían medir las
dispersiones absolutas de los términos de la muestra. Las medidas, tomadas en esas
condiciones, serán de utilidad, solo cuando se trata de analizar una sola muestra;
pero, cuando hay que establecer comparaciones entre distintas muestras, será
necesario expresar tales medidas en valores relativos, que pueden ser proporciones o
porcentajes.
Las medidas de dispersión relativas permiten comparar grupos de series distintas en
cuanto a su variación, independientemente de las unidades en que se midan las
diferentes características en consideración. Generalmente las medidas de dispersión
relativas se expresan en porcentajes, facilitando así el estudio con medidas
procedentes de otras series de valores La dispersión relativa viene a ser igual a la
dispersión absoluta dividida entre el promedio.
Existen varias medidas de dispersión relativa, pero, la más usada es el coeficiente de
variación de Pearson, este es un índice de variabilidad sin dimensiones, lo que permite
la comparación entre diferentes distribuciones de frecuencias, medidas en diferentes
unidades. El coeficiente de variación de Pearson se designa con las letras CV. La
formula matemática es:
100x
X
S
CV =
Una serie de valores será más dispersa que otra mientras su CV sea mayor.
Ejemplo:
La venta en el mercado de tres productos, varia de acuerdo al siguiente cuadro.
Determine el CV de cada uno y diga cuál de ellos presenta mayor variación y cuál la
menor.
Producto X S Unidades CV
1 45 5 Bs. 11.11 %
2 450 40 Bs. 8.87 %
3 4500 350 Bs. 7.78 %
Para resolver el problema se calcula el CV de cada producto y luego sé determina cuál
presenta mayor o menor variación
CV = Sx100/ X
CV(1) = 5x100/45 = 11.11 %.
CV(2) = 40x100/450 = 8.87 %.
CV(3) = 350x100/4500 = 7.78 %.
Se puede observar que la menor dispersión la presenta el producto 3, por lo tanto, de
los tres productos el que menos varia es ese; por otro lado el de mayor dispersión o
variabilidad es el producto 1.
Prof. Simón Cabrera página 32 de 32

Más contenido relacionado

La actualidad más candente

Tema 1.2 organización de datos
Tema 1.2 organización de datosTema 1.2 organización de datos
Tema 1.2 organización de datosanthonymaule
 
Estadistica bloque 1
Estadistica bloque 1Estadistica bloque 1
Estadistica bloque 1Eslavenska
 
Teoria y Ejemplo de Distribucion de Estadística General
Teoria y Ejemplo de Distribucion de Estadística GeneralTeoria y Ejemplo de Distribucion de Estadística General
Teoria y Ejemplo de Distribucion de Estadística Generalfranciscoe71
 
Presentacion # 1 Estadistica
Presentacion # 1 Estadistica Presentacion # 1 Estadistica
Presentacion # 1 Estadistica DanyaRamos
 
TERMINOS BÁSICOS EN ESTADISTICAS
TERMINOS BÁSICOS EN ESTADISTICASTERMINOS BÁSICOS EN ESTADISTICAS
TERMINOS BÁSICOS EN ESTADISTICASnishelson
 
Terminos basicos en estadistica
Terminos basicos en estadisticaTerminos basicos en estadistica
Terminos basicos en estadisticahjmd19
 
Estaditica
EstaditicaEstaditica
Estaditicafior
 
Términos básicos de Estadística
Términos básicos de EstadísticaTérminos básicos de Estadística
Términos básicos de Estadísticaestefania hinarejos
 
Mc clasificacion variables_v1
Mc clasificacion variables_v1Mc clasificacion variables_v1
Mc clasificacion variables_v1patriciax
 
Conceptos Básicos De Estadistica
Conceptos Básicos De EstadisticaConceptos Básicos De Estadistica
Conceptos Básicos De EstadisticaNancyDlFiguera
 

La actualidad más candente (20)

2. niveles de medicion
2. niveles de medicion2. niveles de medicion
2. niveles de medicion
 
Tema 1.2 organización de datos
Tema 1.2 organización de datosTema 1.2 organización de datos
Tema 1.2 organización de datos
 
Estadistica bloque 1
Estadistica bloque 1Estadistica bloque 1
Estadistica bloque 1
 
Estadistica general clase 01
Estadistica general clase 01Estadistica general clase 01
Estadistica general clase 01
 
Medición, niveles de medición y tipos de escalas
Medición, niveles de medición y tipos de escalasMedición, niveles de medición y tipos de escalas
Medición, niveles de medición y tipos de escalas
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Teoria y Ejemplo de Distribucion de Estadística General
Teoria y Ejemplo de Distribucion de Estadística GeneralTeoria y Ejemplo de Distribucion de Estadística General
Teoria y Ejemplo de Distribucion de Estadística General
 
Presentacion # 1 Estadistica
Presentacion # 1 Estadistica Presentacion # 1 Estadistica
Presentacion # 1 Estadistica
 
TERMINOS BÁSICOS EN ESTADISTICAS
TERMINOS BÁSICOS EN ESTADISTICASTERMINOS BÁSICOS EN ESTADISTICAS
TERMINOS BÁSICOS EN ESTADISTICAS
 
Unidad 1 estadistica
Unidad 1 estadisticaUnidad 1 estadistica
Unidad 1 estadistica
 
Terminos basicos en estadistica
Terminos basicos en estadisticaTerminos basicos en estadistica
Terminos basicos en estadistica
 
Apuntes unidad 1
Apuntes unidad 1Apuntes unidad 1
Apuntes unidad 1
 
Estaditica
EstaditicaEstaditica
Estaditica
 
Variables Estadisticas
Variables EstadisticasVariables Estadisticas
Variables Estadisticas
 
Términos básicos de Estadística
Términos básicos de EstadísticaTérminos básicos de Estadística
Términos básicos de Estadística
 
Jose misel
Jose miselJose misel
Jose misel
 
Mc clasificacion variables_v1
Mc clasificacion variables_v1Mc clasificacion variables_v1
Mc clasificacion variables_v1
 
Presentacion 1
Presentacion 1Presentacion 1
Presentacion 1
 
Conceptos Básicos De Estadistica
Conceptos Básicos De EstadisticaConceptos Básicos De Estadistica
Conceptos Básicos De Estadistica
 
Estadistica
EstadisticaEstadistica
Estadistica
 

Similar a Estadistica generalteoria

Similar a Estadistica generalteoria (20)

Estadistica 1er trabajo 23 de junio
Estadistica 1er trabajo 23 de junioEstadistica 1er trabajo 23 de junio
Estadistica 1er trabajo 23 de junio
 
Terminos basicos de estadisticas
Terminos basicos de estadisticasTerminos basicos de estadisticas
Terminos basicos de estadisticas
 
Estadística-Presentacion
Estadística-PresentacionEstadística-Presentacion
Estadística-Presentacion
 
E
EE
E
 
Escalas de medición
Escalas de medición Escalas de medición
Escalas de medición
 
Clase 1 y 2 Tablas de Frecuencia.ppt
Clase 1 y 2 Tablas de Frecuencia.pptClase 1 y 2 Tablas de Frecuencia.ppt
Clase 1 y 2 Tablas de Frecuencia.ppt
 
Trabjo jose estadis
Trabjo jose estadisTrabjo jose estadis
Trabjo jose estadis
 
Trabajo jose estadistica
Trabajo jose estadisticaTrabajo jose estadistica
Trabajo jose estadistica
 
Términos básicos en estadística
Términos básicos en estadísticaTérminos básicos en estadística
Términos básicos en estadística
 
ESTADISTICA DESCRIPTIVA .pdf
ESTADISTICA DESCRIPTIVA .pdfESTADISTICA DESCRIPTIVA .pdf
ESTADISTICA DESCRIPTIVA .pdf
 
Estadisitica actividad-2
Estadisitica actividad-2Estadisitica actividad-2
Estadisitica actividad-2
 
Presentacion 1
Presentacion 1Presentacion 1
Presentacion 1
 
sexta presentación-variables-.ppt
sexta presentación-variables-.pptsexta presentación-variables-.ppt
sexta presentación-variables-.ppt
 
Terminos basicos en estadistica
Terminos basicos en estadisticaTerminos basicos en estadistica
Terminos basicos en estadistica
 
Psieg
PsiegPsieg
Psieg
 
Presentacion Estadistica I
Presentacion Estadistica IPresentacion Estadistica I
Presentacion Estadistica I
 
Términos básicos de la Estadística
Términos básicos de la EstadísticaTérminos básicos de la Estadística
Términos básicos de la Estadística
 
Término básicos de estadística
Término básicos de estadísticaTérmino básicos de estadística
Término básicos de estadística
 
Terminos basicos estadistica
Terminos basicos estadisticaTerminos basicos estadistica
Terminos basicos estadistica
 
Presentación1 de estadistica
Presentación1 de estadisticaPresentación1 de estadistica
Presentación1 de estadistica
 

Más de Yohana Mendoza

06 capituloambitometodologico
06 capituloambitometodologico06 capituloambitometodologico
06 capituloambitometodologicoYohana Mendoza
 
Toxicologia yohana-mendoza-saia g
Toxicologia yohana-mendoza-saia gToxicologia yohana-mendoza-saia g
Toxicologia yohana-mendoza-saia gYohana Mendoza
 
Cambio de marcos vargas b
Cambio de marcos vargas bCambio de marcos vargas b
Cambio de marcos vargas bYohana Mendoza
 
Código orgánico procesal penal(2)
Código orgánico procesal penal(2)Código orgánico procesal penal(2)
Código orgánico procesal penal(2)Yohana Mendoza
 
La palabra prólogo viene del griego prólogos
La palabra prólogo viene del griego prólogosLa palabra prólogo viene del griego prólogos
La palabra prólogo viene del griego prólogosYohana Mendoza
 
Universidad fermin toro
Universidad fermin toroUniversidad fermin toro
Universidad fermin toroYohana Mendoza
 
Qué son los sistemas de generación eléctrica
Qué son los sistemas de generación eléctricaQué son los sistemas de generación eléctrica
Qué son los sistemas de generación eléctricaYohana Mendoza
 

Más de Yohana Mendoza (8)

06 capituloambitometodologico
06 capituloambitometodologico06 capituloambitometodologico
06 capituloambitometodologico
 
Toxicologia yohana-mendoza-saia g
Toxicologia yohana-mendoza-saia gToxicologia yohana-mendoza-saia g
Toxicologia yohana-mendoza-saia g
 
Cambio de marcos vargas b
Cambio de marcos vargas bCambio de marcos vargas b
Cambio de marcos vargas b
 
Procesal civil ii
Procesal civil iiProcesal civil ii
Procesal civil ii
 
Código orgánico procesal penal(2)
Código orgánico procesal penal(2)Código orgánico procesal penal(2)
Código orgánico procesal penal(2)
 
La palabra prólogo viene del griego prólogos
La palabra prólogo viene del griego prólogosLa palabra prólogo viene del griego prólogos
La palabra prólogo viene del griego prólogos
 
Universidad fermin toro
Universidad fermin toroUniversidad fermin toro
Universidad fermin toro
 
Qué son los sistemas de generación eléctrica
Qué son los sistemas de generación eléctricaQué son los sistemas de generación eléctrica
Qué son los sistemas de generación eléctrica
 

Último

tecnicas practivas DIGITOPUNTURA SHIATZU.ppt
tecnicas practivas DIGITOPUNTURA SHIATZU.ppttecnicas practivas DIGITOPUNTURA SHIATZU.ppt
tecnicas practivas DIGITOPUNTURA SHIATZU.pptLEONCIOVASQUEZMARIN2
 
Se sustituye manual tarifario 2023 Manual Tarifario 2024.pdf
Se sustituye manual tarifario 2023 Manual Tarifario 2024.pdfSe sustituye manual tarifario 2023 Manual Tarifario 2024.pdf
Se sustituye manual tarifario 2023 Manual Tarifario 2024.pdfangela604239
 
ICTERICIA INFANTIL Y NEONATAL 2024 v2.0.pdf
ICTERICIA INFANTIL Y NEONATAL 2024 v2.0.pdfICTERICIA INFANTIL Y NEONATAL 2024 v2.0.pdf
ICTERICIA INFANTIL Y NEONATAL 2024 v2.0.pdfMAHINOJOSA45
 
Anatomía e irrigación del corazón- Cardiología. pptx
Anatomía e irrigación del corazón- Cardiología. pptxAnatomía e irrigación del corazón- Cardiología. pptx
Anatomía e irrigación del corazón- Cardiología. pptx Estefa RM9
 
CLASIFICACION DEL RECIEN NACIDO NIÑO.pptx
CLASIFICACION DEL RECIEN NACIDO NIÑO.pptxCLASIFICACION DEL RECIEN NACIDO NIÑO.pptx
CLASIFICACION DEL RECIEN NACIDO NIÑO.pptxMairimCampos1
 
caso clinico relacionado con cancer gastrico.pptx
caso clinico relacionado con cancer gastrico.pptxcaso clinico relacionado con cancer gastrico.pptx
caso clinico relacionado con cancer gastrico.pptxkimperezsaucedo
 
Infecciones de la piel y partes blandas(Impétigo, celulitis, erisipela, absce...
Infecciones de la piel y partes blandas(Impétigo, celulitis, erisipela, absce...Infecciones de la piel y partes blandas(Impétigo, celulitis, erisipela, absce...
Infecciones de la piel y partes blandas(Impétigo, celulitis, erisipela, absce... Estefa RM9
 
mapa-conceptual-del-sistema-endocrino-4-2.pptx
mapa-conceptual-del-sistema-endocrino-4-2.pptxmapa-conceptual-del-sistema-endocrino-4-2.pptx
mapa-conceptual-del-sistema-endocrino-4-2.pptxDanielPedrozaHernand
 
Cuadro comparativo hemisferios del cerebro.pptx
Cuadro comparativo hemisferios del cerebro.pptxCuadro comparativo hemisferios del cerebro.pptx
Cuadro comparativo hemisferios del cerebro.pptxHectorXavierSalomonR
 
Epidemiologia 4: Estructura metodologica de un trabajo cientifico, Fases de r...
Epidemiologia 4: Estructura metodologica de un trabajo cientifico, Fases de r...Epidemiologia 4: Estructura metodologica de un trabajo cientifico, Fases de r...
Epidemiologia 4: Estructura metodologica de un trabajo cientifico, Fases de r...Juan Rodrigo Tuesta-Nole
 
Asfixia por confinamiento en medicina legal.pptx
Asfixia por confinamiento en medicina legal.pptxAsfixia por confinamiento en medicina legal.pptx
Asfixia por confinamiento en medicina legal.pptxanalaurafrancomolina
 
Clase 12 Artrología de Columna y Torax 2024.pdf
Clase 12 Artrología de Columna y Torax 2024.pdfClase 12 Artrología de Columna y Torax 2024.pdf
Clase 12 Artrología de Columna y Torax 2024.pdfgarrotamara01
 
Dengue 2024 actualización en el tratamiento autorización de los síntomas trab...
Dengue 2024 actualización en el tratamiento autorización de los síntomas trab...Dengue 2024 actualización en el tratamiento autorización de los síntomas trab...
Dengue 2024 actualización en el tratamiento autorización de los síntomas trab...jchahua
 
tecnicas quirurgicas de urologia enfermeria
tecnicas quirurgicas de urologia enfermeriatecnicas quirurgicas de urologia enfermeria
tecnicas quirurgicas de urologia enfermeriaCuauhtemoc EO
 
Aparato digestivo (irrigación, internación, anatomía)
Aparato digestivo (irrigación, internación, anatomía)Aparato digestivo (irrigación, internación, anatomía)
Aparato digestivo (irrigación, internación, anatomía)Majo472137
 
Dia mundial de la seguridad y salud en el trabajo
Dia mundial de la seguridad y salud en el trabajoDia mundial de la seguridad y salud en el trabajo
Dia mundial de la seguridad y salud en el trabajoSegundoJuniorMatiasS
 
anatomia de la PELVIS EN GENERAL anatomia.pptx
anatomia de la PELVIS EN GENERAL anatomia.pptxanatomia de la PELVIS EN GENERAL anatomia.pptx
anatomia de la PELVIS EN GENERAL anatomia.pptxJuanGabrielSanchezSa1
 
posiciones anatómicas del curso de enfermería
posiciones anatómicas del curso de enfermeríaposiciones anatómicas del curso de enfermería
posiciones anatómicas del curso de enfermería75665053
 

Último (20)

tecnicas practivas DIGITOPUNTURA SHIATZU.ppt
tecnicas practivas DIGITOPUNTURA SHIATZU.ppttecnicas practivas DIGITOPUNTURA SHIATZU.ppt
tecnicas practivas DIGITOPUNTURA SHIATZU.ppt
 
Se sustituye manual tarifario 2023 Manual Tarifario 2024.pdf
Se sustituye manual tarifario 2023 Manual Tarifario 2024.pdfSe sustituye manual tarifario 2023 Manual Tarifario 2024.pdf
Se sustituye manual tarifario 2023 Manual Tarifario 2024.pdf
 
ICTERICIA INFANTIL Y NEONATAL 2024 v2.0.pdf
ICTERICIA INFANTIL Y NEONATAL 2024 v2.0.pdfICTERICIA INFANTIL Y NEONATAL 2024 v2.0.pdf
ICTERICIA INFANTIL Y NEONATAL 2024 v2.0.pdf
 
Situaciones difíciles. La familia reconstituida
Situaciones difíciles. La familia reconstituidaSituaciones difíciles. La familia reconstituida
Situaciones difíciles. La familia reconstituida
 
Anatomía e irrigación del corazón- Cardiología. pptx
Anatomía e irrigación del corazón- Cardiología. pptxAnatomía e irrigación del corazón- Cardiología. pptx
Anatomía e irrigación del corazón- Cardiología. pptx
 
CLASIFICACION DEL RECIEN NACIDO NIÑO.pptx
CLASIFICACION DEL RECIEN NACIDO NIÑO.pptxCLASIFICACION DEL RECIEN NACIDO NIÑO.pptx
CLASIFICACION DEL RECIEN NACIDO NIÑO.pptx
 
caso clinico relacionado con cancer gastrico.pptx
caso clinico relacionado con cancer gastrico.pptxcaso clinico relacionado con cancer gastrico.pptx
caso clinico relacionado con cancer gastrico.pptx
 
Infecciones de la piel y partes blandas(Impétigo, celulitis, erisipela, absce...
Infecciones de la piel y partes blandas(Impétigo, celulitis, erisipela, absce...Infecciones de la piel y partes blandas(Impétigo, celulitis, erisipela, absce...
Infecciones de la piel y partes blandas(Impétigo, celulitis, erisipela, absce...
 
mapa-conceptual-del-sistema-endocrino-4-2.pptx
mapa-conceptual-del-sistema-endocrino-4-2.pptxmapa-conceptual-del-sistema-endocrino-4-2.pptx
mapa-conceptual-del-sistema-endocrino-4-2.pptx
 
Cuadro comparativo hemisferios del cerebro.pptx
Cuadro comparativo hemisferios del cerebro.pptxCuadro comparativo hemisferios del cerebro.pptx
Cuadro comparativo hemisferios del cerebro.pptx
 
Epidemiologia 4: Estructura metodologica de un trabajo cientifico, Fases de r...
Epidemiologia 4: Estructura metodologica de un trabajo cientifico, Fases de r...Epidemiologia 4: Estructura metodologica de un trabajo cientifico, Fases de r...
Epidemiologia 4: Estructura metodologica de un trabajo cientifico, Fases de r...
 
Asfixia por confinamiento en medicina legal.pptx
Asfixia por confinamiento en medicina legal.pptxAsfixia por confinamiento en medicina legal.pptx
Asfixia por confinamiento en medicina legal.pptx
 
Clase 12 Artrología de Columna y Torax 2024.pdf
Clase 12 Artrología de Columna y Torax 2024.pdfClase 12 Artrología de Columna y Torax 2024.pdf
Clase 12 Artrología de Columna y Torax 2024.pdf
 
Dengue 2024 actualización en el tratamiento autorización de los síntomas trab...
Dengue 2024 actualización en el tratamiento autorización de los síntomas trab...Dengue 2024 actualización en el tratamiento autorización de los síntomas trab...
Dengue 2024 actualización en el tratamiento autorización de los síntomas trab...
 
tecnicas quirurgicas de urologia enfermeria
tecnicas quirurgicas de urologia enfermeriatecnicas quirurgicas de urologia enfermeria
tecnicas quirurgicas de urologia enfermeria
 
Aparato digestivo (irrigación, internación, anatomía)
Aparato digestivo (irrigación, internación, anatomía)Aparato digestivo (irrigación, internación, anatomía)
Aparato digestivo (irrigación, internación, anatomía)
 
Dia mundial de la seguridad y salud en el trabajo
Dia mundial de la seguridad y salud en el trabajoDia mundial de la seguridad y salud en el trabajo
Dia mundial de la seguridad y salud en el trabajo
 
anatomia de la PELVIS EN GENERAL anatomia.pptx
anatomia de la PELVIS EN GENERAL anatomia.pptxanatomia de la PELVIS EN GENERAL anatomia.pptx
anatomia de la PELVIS EN GENERAL anatomia.pptx
 
posiciones anatómicas del curso de enfermería
posiciones anatómicas del curso de enfermeríaposiciones anatómicas del curso de enfermería
posiciones anatómicas del curso de enfermería
 
Neumonia complicada en niños y pediatria vrs neumonia grave, gérmenes, nuevas...
Neumonia complicada en niños y pediatria vrs neumonia grave, gérmenes, nuevas...Neumonia complicada en niños y pediatria vrs neumonia grave, gérmenes, nuevas...
Neumonia complicada en niños y pediatria vrs neumonia grave, gérmenes, nuevas...
 

Estadistica generalteoria

  • 1. CONTENIDO INTRODUCCIÓN DEFINICIÓN DE ESTADÍSTICA ESTADÍSTICA DESCRIPTIVA CONCEPTOS BÁSICOS POBLACIÓN VARIABLE: Cualitativas o Categóricas y Cuantitativas (Discretas y Continuas) MUESTRA TAMAÑO MUESTRAL DATO DISTRIBUCIONES DE FRECUENCIAS FRECUENCIA ABSOLUTA FRECUENCIA RELATIVA FRECUENCIA ACUMULADA FRECUENCIA RELATIVA ACUMULADA DISTRIBUCIONES DE FRECUENCIAS AGRUPADAS MÉTODOS GRÁFICOS DIAGRAMA DE BARRAS DIAGRAMA DE SECTORES O DE PASTEL HISTOGRAMA MEDIDAS DESCRIPTIVAS DE POSICIÓN Y DISPERSIÓN MEDIDAS DE POSICIÓN MEDIDAS DE POSICIÓN CENTRAL MEDIA ARITMÉTICA MEDIANA MODA MEDIDAS DE POSICIÓN NO CENTRALES PERCENTILES CUARTILES MEDIDAS DE DISPERSIÓN MEDIDAS DE DISPERSIÓN ABSOLUTAS VARIANZA DESVIACIÓN TÍPICA RECORRIDO INTERCUARTÍLICO MEDIDAS DE DISPERSIÓN RELATIVAS COEFICIENTE DE VARIACIÓN DE PEARSON OTRAS MEDIDAS DESCRIPTIVAS TIPIFICACIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS
  • 2. ESTADISTICA DESCRIPTIVA INTRODUCCION 1.1 DEFINICIÓN DE ESTADÍSTICA: es un conjunto de teorías y métodos desarrollados para la recopilación, representación y el uso de datos sobre una o varias características de interés con el objeto de tomar decisiones, extraer conclusiones o emprender acciones. 1.2 ESTADÍSTICA DESCRIPTIVA: es la parte de la estadística que se encarga de organizar, resumir y describir las características principales de los datos. Generalmente se resumen en forma tabular, grafica o numérica. El análisis se limita en si mismo a los datos coleccionados y no se realiza inferencia alguna o generalizaciones acerca de la totalidad de donde provienen esas observaciones. 1.3 ESTADÍSTICA INFERENCIAL: Es la que trata de estimar las características de una población a través del estudio de una muestra. 1.4 CONCEPTOS BÁSICOS: POBLACIÓN: Es una colección finita o infinita de elementos con características comunes. Ejemplo: las personas, libros de una biblioteca, etc. Algunas poblaciones son finitas y pueden conocerse; otras pueden ser infinitas y abstractas: Ej. el conjunto de hoteles, establecimientos comerciales de una ciudad o el conjunto de todas las piezas fabricadas por una máquina. VARIABLE: Toda característica que puede tomar diferentes valores (Ej. número de hijos, precio de la habitación) Las variables se suelen denotar por letras mayúsculas: X, Y,... Tipos de variables: 1. Cualitativas o Categóricas: aquellas que no son medibles, es decir, aquellas cuyas observaciones no tienen carácter numérico. Expresan cualidades o categorías. Ej. estado civil, sexo o profesión.(A las variables cualitativas también se les llama atributos). 2. Cuantitativas: aquellas que son medibles, es decir sus observaciones tienen carácter numérico. Estas se dividen a su vez en: •Discretas: toman valores enteros en un conjunto numerable. Ej. Número de habitaciones de un hotel, número de hijos de una familia, número de obreros de una fábrica. •Continuas: toman valores en un conjunto no numerable (los números reales o un intervalo). Ej. peso, estatura. MUESTRA: Es un subconjunto de la población. Se denota por n. DATO: cada valor observado de la variable. Si representamos por X a la variable, representaremos por xi cada dato diferente observado en la muestra, el subíndice “i” indica el lugar que ocupa si los ordenamos de menor a mayor. Prof. Simón Cabrera página 2 de 32
  • 3. ESTADISTICA DESCRIPTIVA MEDICIÓN: La asignación o magnitud que se aplica a las categorías o clases de acuerdo a ciertas reglas o símbolos. Una medición se puede definir como la manera de obtener símbolos para representar propiedades de personas, objetos, eventos o estados cuyos símbolos tienen la misma relación relevante entre si igual a las entidades que representan. ESCALAS DE MEDICIÓN DE LAS VARIABLES Las escalas de medición son el conjunto de los posibles valores que determinada variable puede tomar. Por tal razón, los tipos de escala de medición están íntimamente ligadas con los tipos de variables a estudiar. Las magnitudes de las observaciones cuantitativas se conocen como los valores que una variable puede asumir. Dependiendo de la medición y de la esencia de las variables, se obtienen diversas clases de datos que originan diferentes escalas. Resulta imprescindible conocer el tipo de escala que representan los datos, debido a que, de su esencia dependen las técnicas estadísticas que se deberán aplicar para su análisis. Al elaborar estadísticas con datos y su característica es necesario contarlas, jerarquizarlas y medirlas, es por ello que, se utilizan las escalas de medición como el proceso de asignar números o establecer una correspondencia uno a uno entre objetivos y observaciones. Las escalas de medición sé clasifican de la siguiente forma: Escala Nominal, Escala Ordinal, Escala de Intervalos y Escalas de razón o Proporción. Escala de Medición Nominal: Consiste en clasificar a los elementos, personas, animales, etc, asignándoles símbolos o nombres. Los datos que se obtienen para una variable cualitativa se miden en una escala nominal y simplemente se clasifican en distintas categorías que no implican orden. La escala nominal es la forma más débil de medición porque no se puede aplicar operaciones aritméticas ni intentar el conteo de las diferencias dentro de una categoría determinada o especificar cualquier orden o dirección a lo largo de las diversas categorías. Propiedades de la Escala Nominal 1. No intervienen mediciones, ni escala, en vez de esto solo hay cuentas o conteos. 2. No existe un orden específico para esta categoría. 3. No presentan el cero. 4. No se basa en diferencia cuantitativa. Ejemplos: Una muestra de personas puede clasificarse con base en la religión profesada: (1) Cristianos; (2) Judíos; (3) Musulmanes; (4) Otros; y (5) Sin Creencia alguna. O bien podrían clasificarse según el sexo, el color de los ojos, algún partido político, etcétera. Otros ejemplos de escala nominal puede ser el numero de placa de los vehículos, los números de los teléfonos de una ciudad, la Cedula de Identidad de los habitantes de un país, etcétera. Prof. Simón Cabrera página 3 de 32
  • 4. ESTADISTICA DESCRIPTIVA El tipo de operación estadística más utilizada en la escala nominal es el conteo de las frecuencias (distribuciones de frecuencias), con que se presentan las características en las unidades de las respectivas subclases. Estas frecuencias pueden ser presentadas con números absolutos, porcentajes y proporciones. Además, puede calcularse la moda, razones, tasas de incremento, y el coeficiente de contingencia. Tipos de gráficos: Diagrama de Barras. Escala de Medición Ordinal: Establece una relación de orden entre los elementos (personas, animales, objetos, etc.), en atención a una característica, sin que reflejen distancia entre ellos. La diferencia entre dos números ordinales no tiene significado cuantitativo, sólo expresan, por ejemplo, que una situación es mejor que otra, pero no dice cuanto es uno que el otro. La escala ordinal sigue siendo una forma de medición débil porque no se pueden hacer planteamientos numéricos significativos con respecto a las diferencias entre las categorías. Es decir, la ordenación establece sólo cuál categoría es “mayor”, “mejor” o “preferida”; y no se habla cuánto es “mayor”, “mejor” o más “preferida”.’Esta escala se emplea, cuando un estudio esta basado en ciertas normas que se asignan a un conjunto de objetos, personas o características o a un conjunto de categorías ordenadas. Las categorías de la escala se ordenan dé acuerdo con la cantidad de rasgos o características que representan cada una de ellas ya que la escala ordinal distingue los diferentes valores de la variable, ubicando las características en orden, desde la más alta hasta la más baja. La diferencia fundamental entre una escala nominal y una ordinal es que en la ordinal rige no sólo la relación de igualdad, de identidad, sino también la relación de “mayor que”. Propiedades de la Escala Ordinal 1. Las observaciones o elementos se les ordena en rangos o categorías diferentes. 2. Las categorías son mayores o menores que otras categorías, es decir, que existe una clasificación de mayor a menor (jerarquía). 3. Las categorías son mutuamente excluyentes y exhaustivas. 4. No presentan el cero. Ejemplos: Calificaciones de Estudiantes de Estadística en el Semestre 2005-2006 Calificaciones Nº de calificaciones Excelente 3 Sobresaliente 6 Distinguido 10 Bueno 38 Satisfactorio 25 Deficiente 50 Muy Deficiente 0 Prof. Simón Cabrera página 4 de 32
  • 5. ESTADISTICA DESCRIPTIVA Se pueden clasificar los habitantes de una ciudad de acuerdo a su situación económica, a los estudiantes tomando en cuenta a su rendimiento académico, el orden jerárquico de los militares (Subteniente, Teniente, Capitán, Mayor, Teniente Coronel, Coronel, General) y la clasificación académica de los profesores universitarios (Instructor, Asistente, Agregado, Asociado, Titular), etcétera. Aunque la escala ordinal resulta en cierta forma más precisa que la nominal, no alcanza el grado de precisión deseado en una investigación. El tipo de operación estadística más utilizada en la escala ordinal es la mediana, percentiles, cuartiles, mínimo y máximo. Tipos de gráficos: Diagrama de barras (con un orden) y gráficos de caja. Escala de Medición de Intervalos: Tiene todas las características de una escala ordinal, además permite conocer la distancia entre dos números cualquiera. Esta escala se caracteriza por tener una unidad de medida y un origen (cero) arbitrario. La escala de intervalos a diferencia de la nominal y ordinal, es una escala efectivamente cuantitativamente. Una escala de intervalo es una escala ordenada en la cual la diferencia entre las mediciones es una cantidad significativa. La escala de intervalos posee además, de las características de la escala nominal y ordinal, la propiedad de que la distancia entre dos valores es de una magnitud conocida, lo que le permite a esta escala un mayor grado de perfección, ya que proporciona números que manifiestan diferencias palpables entre individuos, objetos o cosas. La razón entre dos intervalos es siempre independiente del punto cero y de la unidad que se emplee en la medición. En el caso de las escalas de intervalos las unidades de medición son iguales. Propiedades de la escala de Intervalo: 1. Esta escala implica la cuantificación de los datos 2. En estás medidas se utilizan unidades constantes de medición (capacidad, peso, Céntimos, grados Fahrenheit o centígrados) los cuales producen intervalos iguales entre puntos de la escala. 3. Proporcionan números que manifiestan diferencias palpables entre individuos, objetos o cosas. 4. En esta escala de intervalos el punto cero (0) y la unidad de medida es arbitrario. 5. Se pueden aplicar todas las medidas estadísticas más conocidas, con excepción del coeficiente de variación. 6. Son mutuamente exclusivas y exhaustivas. Prof. Simón Cabrera página 5 de 32
  • 6. ESTADISTICA DESCRIPTIVA Ejemplos: Calificación de una prueba de Estadística realizada en la UCV Puntuación Nº de Estudiantes 90-99 2 80-89 6 70-79 15 60-69 30 Menos de 60 60 Otro ejemplo de esta escala lo constituyen las escalas utilizadas para medir temperatura, bien sea en grados Centígrados o Fahrenheit. En estas escalas la diferencia entre 80º y 85º es igual a la que existe entre 90º y 95º o entre dos puntos cualesquiera de la escala. Las estadísticas apropiadas para esta escala son: media, desviación estándar, rango, varianza, coeficiente de variación, asimetría y kurtosis. Tipos de gráficos: histograma, polígono de frecuencias y gráfico de tallos y hojas. Escala de Medición de Razón o Proporción: Esta constituye el nivel más alto de medición, posee todas las características de las escalas nominales, ordinales y de intervalos; además tiene un cero absoluto o natural que tiene significado físico. Si en ella la medición es cero, significa ausencia o inexistencia total de la propiedad considerada. Son posibles todas las operaciones aritméticas. Los números indican los valores concretos de la propiedad que sé esta midiendo; peso, estatura, ingresos monetarios y gastos directos, son ejemplos de medidas con una escala de razón. Cuando se emplea este tipo de escala, los números indican razones o cocientes entre ciertas magnitudes de los objetos, y los datos obtenidos con tales escalas pueden ser sometidos a los tratamientos más elaborados. Propiedades de la escala a razón: 1. La distancia entre los números es un tamaño conocido y constante. 2. Los datos tienen un punto cero significativo. 3. Puede utilizarse cualquier prueba de tipo estadístico, incluyendo el coeficiente de variación. 4. Permite hacer comparaciones entre los números verdaderos con un cero aritmético siendo arbitrario únicamente la unidad de medida. Ejemplo de escala a razón: Computadores vendidos en el último trimestres del año 2006 Meses Nº de computadores Octubre 4.000 Noviembre 6.000 Diciembre 15.000 Prof. Simón Cabrera página 6 de 32
  • 7. ESTADISTICA DESCRIPTIVA Otros ejemplos de esta escala son: la medición del peso o altura de un grupo de personas, el ingreso familiar, la intensidad de corriente eléctrica de un cable, la edad de un grupo de personas, etc. Generalmente, se supone que los datos que se obtienen para una variable cuantitativa se miden en escalas de intervalo o de razón. Estas escalas constituyen los niveles más elevados de medición. Son formas más fuertes de medición que la escala nominal y ordinal, porque permiten comprender no sólo cuál de los valores de un estudio es mayor o menor, sino por cuántas unidades de medida. Las escalas de razón son medidas de Longitud, peso, capacidad, etc., los números reflejan razones entre particularidades y los datos obtenidos según tales escalas pueden ser sometidas a cualquier tratamiento estadístico Prof. Simón Cabrera página 7 de 32
  • 8. ESTADISTICA DESCRIPTIVA ORGANIZACIÓN DE LOS DATOS 2. DISTRIBUCIONES DE FRECUENCIAS La distribución de frecuencia es una disposición tabular de datos estadísticos, ordenados ascendente o descendentemente, de acuerdo a la frecuencia de cada dato. Las frecuencias pueden ser: 2.1 FRECUENCIA ABSOLUTA (fi): Es el número de veces que se repite un determinado valor de la variable (xi). Se designa por fi. PROPIEDAD: la suma de todas las frecuencias absolutas es igual al total de observaciones (n). 2.2 FRECUENCIA ACUMULADA (Fi): Las frecuencias acumuladas de una distribución de frecuencias son aquellas que se obtienen de las sumas sucesivas de las fi que integran cada una de las filas de una distribución de frecuencia, esto se logra cuando la acumulación de las frecuencias se realiza tomando en cuenta la primera fila hasta alcanzar la ultima. Las frecuencias acumuladas se designan con las letras Fi. Se calcula: ∑= − +== i j iiji fFfF 1 1 PROPIEDAD: La última frecuencia acumulada absoluta es igual al total de observaciones. 2.3 FRECUENCIA RELATIVA (hi): Es aquella que resulta de dividir cada una de las frecuencias absolutas entre el número total de datos. Las frecuencias relativas se designan con las letras hi. Se calcula, n f h i i = PROPIEDAD: la suma de todas las frecuencias relativas es igual a la unidad. . 2.4 FRECUENCIA RELATIVA ACUMULADA (Hi): Es aquella que resulta de dividir cada una de las frecuencias acumuladas entre número total de datos. Se designa con las letras Hi . Se calcula; n F H i i = PROPIEDAD: La última frecuencia relativa acumulada es la unidad. Prof. Simón Cabrera página 8 de 32
  • 9. ESTADISTICA DESCRIPTIVA DISTRIBUCION DE FRECUENCIAS ABSOLUTAS Es la representación estructurada en forma de tabla de toda la información que se ha recogido sobre la variable que se estudia, es decir, es una tabla que presenta de manera ordenada los distintos valores de una variable y sus correspondientes frecuencias. Su forma mas común es la siguiente: Variable (xi) fi Fi hi Hi x1 f1 F1 h1= f1/n h1 x2 f2 f1+f2 h2= f2/n h1+h2 ... ... ... ... ... xn fn f1+f2+ … + fn hn= fn/n h1+h2+ … + hn Σfi=n Σhi=1 Ejemplo 1: El gobierno desea averiguar si el número medio de hijos por familia ha descendido respecto de la década anterior. Para ello ha encuestado a 50 familias respecto al número de hijos, y ha obtenido los siguientes datos: 0 0 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 5 6 Se pide: a. Construir la tabla de frecuencias absolutas b. ¿Cuál es el número de familias que tiene como máximo dos hijos? c. ¿Cuántas familias tienen más de 1 hijo pero como máximo 3? d. ¿Qué porcentaje de familias tiene más de 3 hijos? Solución: a. Para construir la tabla de frecuencias hay que tener en cuenta que la variable en estudio es el número de hijos (discreta), que toma los valores existentes entre 0 y 6 hijos y las frecuencias son el conjunto de familias, de esta forma tenemos: xi fi Fi hi Hi 0 2 2 0.04 0.04 1 4 6 0.08 0.12 2 21 27 0.42 0.54 3 15 42 0.3 0.84 4 6 48 0.12 0.96 5 1 49 0.02 0.98 6 1 50 0.02 1 n=50 b. En la columna de las fi: 2+4+21=27 ó en la columna de las Fi: F2= 27 c. En la columna de las fi: 21+15=36 ó en la columna de las Fi: 42-6=36 d. En la columna de las hj: 0.12+0.02+0.02=0.16, que supone un 16% ó en la columna de las Hi: 1-0.84=0.16, 16% Prof. Simón Cabrera página 9 de 32
  • 10. ESTADISTICA DESCRIPTIVA DISTRIBUCIONES DE FRECUENCIAS AGRUPADAS Es aquella distribución en la que la disposición tabular de los datos estadísticos se encuentran ordenados en clases y con la frecuencia en cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase. No existen normas establecidas para determinar cuándo es apropiado utilizar datos agrupados o datos no agrupados; sin embargo, se sugiere que cuando el número total de datos (N) es igual o superior 50 y además el rango o recorrido de la serie de datos es mayor de 20, entonces, se utilizará la distribución de frecuencia para datos agrupados, también se utilizará este tipo de distribución cuando se requiera elaborar gráficos lineales como el histograma, el polígono de frecuencia o la ojiva. La razón fundamental para utilizar la distribución de frecuencia de clases es proporcionar mejor comunicación acerca del patrón establecido en los datos y facilitar la manipulación de los mismos. Los datos se agrupan en clases con el fin de sintetizar, resumir, condensar o hacer que la información obtenida de una investigación sea manejable con mayor facilidad. Al agrupar los datos en una distribución de frecuencia de clase se pierde parte de la información. La reducción o agrupamiento a que son sometidos los datos de una serie de valores cuando existen muchos valores diferentes, originan los denominados errores de agrupamiento; sin embargo, estos errores son en general muy pequeños, razón por la cual la distribución de frecuencia de clase tiene una validez estadística práctica. Para agrupar los datos en intervalos de clase se deben seguir las siguientes reglas generales: • El numero de intervalos de clase se toma entre 5 y 15 dependiendo de los datos. • Cada observación debe estar incluida en una y solo una clase o intervalo. • El valor mas pequeño y mas grande deben entrar en la clasificación. • No deben existir brechas o vacíos entre clases sucesivas. • Los intervalos no se deben sobreponer. • En la medida de lo posible, se debe utilizar la misma amplitud para todos los intervalos. COMPONENTES DE UNA DISTRIBUCIÓN DE FRECUENCIAS DE CLASES 1.- Clase o Intervalo de clase.- Son divisiones o categorías en las cuales se agrupan un conjunto de datos ordenados con características comunes. Para organizar los valores de la serie de datos hay que determinar un número de clases que sea conveniente. En otras palabras, que ese número de intervalos no origine un número pequeño de clases ni muy grande. Un número de clases pequeño puede ocultar la naturaleza natural de los datos y un número muy alto puede provocar demasiados detalles como para observar alguna información de gran utilidad en la investigación. A las fronteras del intervalo, la llamaremos, límites inferior y superior de la clase y los denotaremos por Li-1, Li. Prof. Simón Cabrera página 10 de 32
  • 11. ESTADISTICA DESCRIPTIVA 2.- Punto medio o Marca de clase ( X& ).- Es la semisuma del límite inferior y superior de una clase, tal como lo indica la siguiente formula: 2 1− • + = ii i LL X . 3.- Amplitud , Longitud o Tamaño del Intervalo.- Los intervalos de clases pueden ser de tres tipos: Clases de igual tamaño, clases de tamaños desiguales y clases abiertas. En términos generales, las clases de igual tamaño son los mas utilizados y recomendados para los cálculos estadísticos. Se designa por las letras Ic. Nota: Al número de observaciones de una clase se le llama frecuencia de clase, si dividimos esta frecuencia por el número total de observaciones, se llama frecuencia relativa de clase, y del mismo modo que lo hacíamos para datos sin agrupar definiríamos Hi, y Fi. PROCEDIMIENTO PARA CONSTRUIR UNA DISTRIBUCIÓN DE FRECUENCIAS AGRUPADA EN INTERVALOS 1. Determinar el máximo y mínimo entre los valores que tenemos en la muestra y calcular el recorrido de la variable o rango, es decir, R=Xmax-Xmin 2. Calcular el número de clases a utilizar. Existen diversos criterios para determinar el numero de clases, ante tanta diversidad de criterios, se ha considerado que lo mas importante es dar un ancho o longitud de clases a todos los intervalos de tal manera que respondan a la naturaleza de los datos y al objetivo que se persigue y esto se logra con la practica. Existe una forma para determinar el numero de clases y la misma puede ilustrarse en el siguiente cuadro: Numero de Datos Numero de Intervalos 10 - 100 De 4 a 8 100 - 1.000 De 8 a 11 1.000 - 10.000 De 11 a 14 Cuando se tenga dudas en determinar el numero de intervalos de clases, es de gran utilidad utilizar el método sugerido por Hebert A. Sturges, el cual establece que: K= 1+3,322 log(n) = numero de intervalos. En este curso se utilizará este método siempre y cuando el mismo sea aplicable. 3. Determinamos la amplitud o tamaño de los intervalos través de la siguiente formula: ervalosdeN R Ic intº = = ancho o tamaño del intervalo. Prof. Simón Cabrera página 11 de 32
  • 12. ESTADISTICA DESCRIPTIVA Ejemplo 2 Un nuevo hotel va abrir sus puertas en una cierta ciudad. Antes de decidir el precio de sus habitaciones, el gerente investiga los precios por habitación de 40 hoteles de la misma categoría de esta ciudad. Los datos obtenidos (en miles de pesetas) fueron: 3.3 3.3 3.7 3.8 3.9 3.9 3.9 4.0 4.1 4.2 4.2 4.3 4.3 4.3 4.3 4.4 4.4 4.5 4.5 4.5 4.5 4.7 4.7 4.7 4.7 4.8 4.9 5.0 5.0 5.1 5.1 5.3 5.3 5.4 5.6 5.8 5.8 6.0 6.1 6.1 Procedimiento: 1.- El menor valor es 3.3 y el mayor 6.1, la diferencia es 2.8 y por tanto R=2.8. 2.- K= 1+3,322 log(40) = 6.3 ≈ 6 números de intervalos 3.- Ic = 2.8 / 6 = 0.467 ≈ 0.5 tamaño de los intervalos Así pues la tabla sería: CLASES fi Fi Ci hi Hi [3.3, 3.8) 3 3 3.5 0.075 0.075 [3.8, 4.3) 8 11 4 0.2 0.275 [4.3, 4.8) 14 25 4.5 0.35 0.625 [4.8, 5.3) 6 31 5 0.15 0.775 [5.3, 5.8) 4 35 5.5 0.1 0.875 [5.8, 6.3) 5 40 6 0.125 1 ¿Cuantos hoteles tienen un precio entre 3.3 y 3.8? 3 ¿Cuantos hoteles tienen un precio superior a 4.8? 15 ¿Que porcentaje de hoteles cuestan como mucho 4.3? 27.5 % Prof. Simón Cabrera página 12 de 32
  • 13. ESTADISTICA DESCRIPTIVA MÉTODOS GRÁFICOS La forma de la distribución de frecuencias se percibe más rápidamente si la representamos gráficamente. Se resume la información de la muestra de forma grafica con fines clarificadores o para enfatizar y descubrir determinadas características que de otra manera seria muy difícil de apreciar. Un grafico siempre es mas inmediato de comprender que un conjunto de datos estadísticos. Las representaciones graficas varían según el tipo de variable: a. Gráficos para variables Discretas y Categóricas DIAGRAMA DE BARRAS: Es la representación gráfica usual para variables cuantitativas discretas o para variables cualitativas. En el eje de ordenadas representamos los diferentes valores de la variable (xi). Sobre cada valor levantamos una barra de altura igual a la frecuencia (absoluta o relativa). Ejemplo: 0 20 40 60 80 100 120 140 160 180 1er trim. 2do trim. 3er trim. 4to trim. DIAGRAMA DE SECTORES O DE PASTEL: Es el más usual en variables cualitativas. Se representan mediante círculos. A cada valor de la variable se le asocia el sector circular proporcional a su frecuencia. Ejemplo: Los siguientes datos corresponden a una encuesta referente a elecciones locales de un partido político: xi fi a favor 50% en contra 40% abstención 10% Para construir el diagrama de sectores partimos del hecho de que un circulo encierra un total de 360 grados. Luego, mediante una regla de tres simple, repartimos los 360 grados en distintos sectores, de acuerdo con cada porcentaje; tenemos así que para determinar el sector correspondiente al 50%, resolvemos la ecuación: 180 100 360*50 ==X Prof. Simón Cabrera página 13 de 32
  • 14. ESTADISTICA DESCRIPTIVA Esto es, el 50% corresponde a un sector circular de medida 180 grados. A continuación, con ayuda de un transportador, señalaremos el sector circular de medida 180 grados. Igualmente, para el 40% se tiene 144 grados y para el 10% se tiene 36 grados. La siguiente figura muestra la representación grafica. Elecciones Locales a favor en contra abstencion b. Gráficos para variables continuas HISTOGRAMA: Es la representación gráfica de las frecuencias agrupadas de una variable continua sobre intervalos. A diferencia de los diagramas de barras, los histogramas dibujan rectángulos unidos entre si, lo que significa que existe continuidad en la variable cuyos valores se representan en el eje horizontal que se haya dividido en intervalos de igual amplitud. Las áreas de los rectángulos son proporcionales a las frecuencias que representan. Ejemplo: Histograma correspondiente a las horas extras laboradas por un grupo de obreros petroleros. 16 21 16 4 6 11 3 15 8 0 5 10 15 20 25 15 20 25 30 35 40 45 50 55 60 65 Clases Frecuencias Prof. Simón Cabrera página 14 de 32
  • 15. ESTADISTICA DESCRIPTIVA El histograma o diagrama de barras proporcionan mucha información respecto a la estructura de los datos, nos permite evidenciar fundamentalmente tres características: 1. Forma de la distribución. 2. Acumulación o tendencia posicional (valor central de la distribución). 3. Dispersión o variabilidad. Cuando nos encontramos en distribuciones donde los intervalos no tienen la misma amplitud, las barras del histograma tienen que tener un área proporcional a la frecuencia que queramos representar EJERCICIOS 1.- Los siguientes datos representan los ingresos diarios (en miles) de 20 obreros de cierta compañía. 16, 16, 17, 18, 18, 19, 19, 19, 20, 20, 20, 20, 20, 21, 21, 22, 22, 23, 23, 24. a. Construya una tabla de frecuencias agrupadas utilizando la formula de Sturges. b. Construya un histograma de frecuencias. Comente. c. ¿Cuántos obreros tienen un ingreso diario menor de 22? d. ¿Qué porcentaje de obreros tienen un ingreso diario entre 16 y 19? 2.- Los siguientes datos corresponden al tiempo que han necesitado 30 clientes de un banco para llevar a cabo una transacción bancaria: 0.1 0.4 1.1 1.2 1.3 1.4 1.5 1.6 2.0 2.5 2.8 2.8 3.1 3.3 3.6 4.1 4.1 4.3 4.6 5.0 5.5 6.4 6.5 7.7 7.3 7.4 8.0 9.5 9.5 10.0 a. Construya una tabla de frecuencias agrupadas utilizando la formula de Sturges. b. Construya un histograma de frecuencias. Comente. 3.- Con el fin de asignar viáticos, la compañía “El Refinanciamiento” obtuvo unas estadísticas sobre le numero de kilómetros recorridos por sus vendedores. A continuación se muestran los resultados. Construya una tabla de distribución de frecuencias agrupadas a cinco intervalos. 10 11 12 12 13 13 13 14 14 15 15 16 16 16 16 16 16 16 17 19 Prof. Simón Cabrera página 15 de 32
  • 16. ESTADISTICA DESCRIPTIVA MEDIDAS DE POSICIÓN INTRODUCCIÓN Después que los datos han sido reunidos y tabulados, se inicia el análisis con el fin de calcular un número único, que represente o resuma todos los datos. Las medidas de posición forman parte del conjunto de medidas descriptivas numéricas, las cuales se clasifican en parámetros –cuando se calculan a partir de la población total- y los estadígrafos - cuando se calculan a partir de los datos de una muestra. Una medida de posición es un número que se toma como orientación para referirnos a un conjunto de datos. Uno de los problemas fundamentales que presenta un análisis estadístico, es el de buscar el valor más representativo de una serie de valores. El primer paso que hay que realizar para que se entienda una larga serie de valores u observaciones, es el de resumir los datos en una distribución de frecuencia; esto no es suficiente para fines practico, puesto que a menudo es necesario una sola medida descriptiva, y en especial cuando se requiere comparar dos o más serie estadísticas. Es necesario continuar el proceso de reducción hasta sustituir todos los valores observados por uno solo que sea representativo, de tal forma que permita una interpretación global del fenómeno en estudio; para que ese valor sea representativo debe reflejar la tendencia de los datos individuales de la serie de valores. Un valor o dato de la serie con estas características recibe el nombre de promedio, media o medida de posición, esto es debido a su ubicación en la zona central de la distribución. Las medidas de posición son de gran importancia en el resumen estadístico, ya que representan un gran número de valores individuales por uno solo. El valor más representativo de un conjunto de datos por lo general no es el valor más pequeño ni el más grande, es un número cuyo valor se encuentra en un punto intermedio de la serie de datos. Por lo tanto un promedio es con frecuencia un valor referido que representará la medida de posición de la serie de valores. Las medidas de posición se emplean con frecuencia como mecanismo para resumir un gran número de datos o cantidades con la finalidad de obtener un valor que sea representativo de la serie. Las Principales Medidas de Posición son: La Media Aritmética, Mediana, Moda, los cuartiles, Deciles y Percentiles. Todas ellas a su manera tratan de dar una idea del numero alrededor del cual se centra a todo el conjunto de datos. CARACTERÍSTICAS DE LAS MEDIDAS DE POSICIÓN • Deben ser definidas rigurosamente y no ser susceptibles de diversas interpretaciones. • Deben depender de todas las observaciones de la serie, de lo contrario no seria una característica de la distribución. • No deben tener un carácter matemático demasiado abstracto. • Deben ser susceptibles de cálculo algebraico, rápido y fácil. Prof. Simón Cabrera página 16 de 32
  • 17. ESTADISTICA DESCRIPTIVA MEDIA ARITMÉTICA La media aritmética ( X ) o simplemente la media es la medida de posición de más importancia y utilización en las aplicaciones estadísticas por su fácil calculo e interpretación. Se trata del valor medio de todos los valores que toma la variable estadística de una serie de datos. La media es el valor más representativo de la serie de valores, es el punto de equilibrio, el centro de gravedad de la serie de datos. Por lo general se le designa con X . La media aritmética de una serie de n valores de una variable X1, X2, X3; X4,.........Xn, es el cociente de dividir la sumatoria de todos los valores que toma la variable Xi, entre el número total de ellos. La formula se puede expresar así: n X X n i i∑= = 1 . Desviaciones o desvíos.- Son diferencias algebraicas entre cada valor de la serie o cada punto medio y la media aritmética de dicha serie, o un valor cualquiera tomado arbitrariamente. Los desvíos o desviación se designan con la letra di. Dado una serie de valores X1, X2, X3, .......Xn , se llama desvío a la diferencia entre un valor cualquiera Xi de la serie y un valor indicado k de esa misma serie. Si el valor indicado k de la serie corresponde precisamente a la media aritmética de esos valores dados, se dice entonces que los desvíos son con respecto a la media aritmética. En símbolo: ).( XXd ii −= PROPIEDADES DE LA MEDIA ARITMÉTICA 1. La suma de las desviaciones con respecto a la media aritmética es igual a cero. .0=∑ id 2. La suma de las desviaciones al cuadrado de los diversos valores con respecto a la media aritmética es menor que la suma de las desviaciones al cuadrado de los diversos valores con respecto a cualquier punto K, que no sea la media aritmética. ( )2 ∑ − XXi < ( )2 ∑ − KXi . 3. La media aritmética total o conjunta de dos o más serie de datos, se puede calcular en función de las medias aritméticas parciales y del número de datos de cada una de ellas, mediante la siguiente formula: ,....... ........ 3 3 2 2 1 1332211 k kkk t n X n X n X n X N XnXnXnXn X ∑∑∑∑ +++= ++++ = Donde: ,......321 knnnnN ++++= en esta n1, n2, n3 y nk es el número de datos de cada serie. Además, sonXyXXX k .,.....,.,.,....,. 3.,21 las medias de cada una de las series. Prof. Simón Cabrera página 17 de 32
  • 18. ESTADISTICA DESCRIPTIVA 4. La media del producto de una constante por una variable, es igual al producto de la constante por la media de la variable. .XK n XK n KX X ii === ∑∑ 5. La media de la suma de una constante más una variable, es igual a la media de la variable más la constante. ( ) ( ) .KX n K n X n KX X ii KXi +=+= + = ∑∑∑ + ., de la misma forma se cumple esta propiedad para la resta. CARACTERÍSTICAS PRINCIPALES DE LA MEDIA ARITMÉTICA • El valor de la media depende de cada una de las medidas que forman la serie de datos, y se halla afectada excesivamente por los valores extremos de la serie de datos. • La media se calcula con facilidad y es única para cada caso y permite representar mediante un solo valor la posición de la serie de valores. • La media es una medida de posición que se calcula con todos los datos de la serie de valores y es susceptible de operaciones algebraicas. CÁLCULO DE LA MEDIA PARA DATOS NO AGRUPADOS Para calcular la media de datos no agrupados en clases se aplica la siguiente formula: n X X i∑= . En donde n es el número total de datos y son los valores de la variable. iX Ejemplo: Calcule la media aritmética de los siguientes valores: { }14,11,9,8,7,5=iX .9 6 54 6 14119875 == +++++ == ∑ n X X i Por lo tanto la media es 9. CÁLCULO DE LA MEDIA PARA DATOS AGRUPADOS Cuando se trabaja con la distribución de frecuencia agrupada, se parte del supuesto de que todos los datos comprendidos en un intervalo de clase se distribuyen uniformemente a lo largo de este, entonces se puede tomar la marca de clase o punto medio ( ) del intervalo como adecuada representación de los valores que conforman el mencionado intervalo. Para calcular la media en estas condiciones se pueden utilizar tres métodos: El método directo o largo y dos métodos abreviados. En este curso utilizaremos el primer método. X& Prof. Simón Cabrera página 18 de 32
  • 19. ESTADISTICA DESCRIPTIVA MÉTODO DIRECTO Este método se le conoce también como método largo; el mismo resulta demasiado engorroso cuando las magnitudes de los puntos medios o de las frecuencias de clase son muy grandes, debido a que los cálculos son demasiados extensos. Los pasos a seguir para calcular la media con este método son los siguientes: 1. Se agrupan los datos en clases y se llevan a una columna, se calculan los puntos medios de cada clase y se colocan en sus respectivas columnas, se determinan las frecuencias de cada clase y se ubican en sus respectivas columnas. 2. Se multiplican los puntos medios de cada clase por sus respectivas frecuencias, luego se obtiene la sumatoria de las frecuencias (fi) multiplicadas por el punto medio ( X& ) así: .ii Xf &∑ 3. Luego se calcula la media aritmética aplicando la formula: nDonde n Xf nf Xf X i i ii ..... ∑ ∑ ∑ = = = && es igual al número total de datos. Ejemplo: Calcule la media de la siguiente distribución de frecuencia correspondiente al peso en Kg. de un grupo de obreros. Realice los cálculos respectivos para completar el siguiente cuadro. CLASES if 75-------79 20 80-------84 40 85-------89 60 90-------94 100 95 ------99 140 =∑ if n =360 Solución: PESOS X& Nº DE OBREROS Xfi & 75-------79 77 20 1540 80-------84 82 40 3280 85-------89 87 60 5220 90-------94 92 100 9200 95 ------99 97 140 13580 n =360 =∑ ii Xf & 32820 Aplicando la formula se tiene: Interpretación: .17.91 360 32820 === ∑ N Xf X ii & El peso promedio del grupo de 360 obreros es de 91.17 Kg. Prof. Simón Cabrera página 19 de 32
  • 20. ESTADISTICA DESCRIPTIVA LA MEDIANA La mediana es el valor que divide en dos partes iguales, al conjunto de observaciones ordenadas respecto de sus magnitudes, de tal manera que el numero de datos por encima de la mediana sea igual al numero de datos por debajo de la misma. Se designa por las letras Me. Tal como sucede con la media, el método de determinación depende de si los datos son agrupados o no. CÁLCULO DE LA MEDIANA PARA DATOS NO AGRUPADOS (Discretos) Para encontrar la mediana en una serie de datos no agrupados, lo primero que se hace es ordenar los datos en una forma creciente o decreciente y luego se ubica la posición que esta ocupa en esa serie de datos; para ello hay que determinar si la serie de datos es par o impar. Si el número n es impar, entonces la posición de la mediana se determina por la formula: ) 2 1 ( += nXMe , luego el número que se obtiene indica el lugar o posición que ocupa la mediana en la serie de valores, luego la mediana será el número que ocupe el lugar de lo posición encontrada. Si n es par, se aplica la formula 2 )2/2()2/( ++ = nn XX Me El resultado obtenido, es la posición que ocupara la mediana, pero en este caso se ubica la posición de la mediana por ambos extremos de la serie de valores y los dos valores que se obtengan se le saca la media y esta será la mediana buscada, por lo tanto la mediana, en este caso, es un número que no se encuentra dentro de la serie de datos dados. Ejemplos: Sean los siguientes datos, 5, 12, 7, 8, 10, 6, y 9, los años de servicios de un grupo de trabajadores. Determine la mediana. Lo primero que se hace es ordenar los datos en forma creciente o decreciente; Los datos ordenados quedaran así: 5, 6, 7, 8, 9, 10, 12. Luego, como se trata de un numero impar de datos (n=7), se aplica la formula )4( ) 2 17 () 2 1 ( XXXMe n === ++ , para ubicar la posición de la mediana. Esto indica que la mediana ocupa la posición 4, que en la serie de valores esa posición corresponde al número 8, entonces, Me = 8. Tomemos ahora los datos: 5, 5, 7, 9, 11, 12, 15, 18. Como se trata de un numero par de datos (n =8), la mediana esta dada por: 10 2 20 2 119 22 )5()4()2/2()2/( == + = + = + = + XXXX Me nn Prof. Simón Cabrera página 20 de 32
  • 21. ESTADISTICA DESCRIPTIVA Cuando los valores de un conjunto de datos se agrupan en una distribución de frecuencia de clase, cada valor pierde su identidad, por tal motivo la mediana obtenida de una distribución de frecuencia de datos puede no ser la misma que la mediana obtenida de los datos sin arreglar en clases, pero el resultado será una aproximación. Cuando se trata de datos agrupados, la mediana se obtiene mediante el método de interpolación. La interpolación parte del supuesto de que los datos de cada intervalo de la distribución están igualmente distribuidos. PASOS PARA DETERMINAR LA MEDIANA EN DATOS AGRUPADOS 1. Se elabora la tabla de frecuencia de datos con sus diferentes intervalos de clases, se ubican las frecuencias fi y se calculan las frecuencias acumuladas Fi de esa distribución. 2. Se determina la ubicación o posición de la mediana en el intervalo de la distribución de frecuencia, mediante la formula 2 n . El resultado obtenido determinará la clase donde se encuentra ubicada la mediana, lo cual se conseguirá en la clase donde la frecuencia acumulada Fi sea igual o superior a este resultado. Luego se aplica la formula: Ic fi F n LiMe i ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ − += − )1( 2 Donde, 2 n = posición de la mediana Li = es el limite inferior de la clase donde se encuentra ubicada la mediana. F(i-1) = es el valor de la frecuencia acumulada anterior a la clase mediana. fi = es el valor de la frecuencia de clase donde se encuentra la mediana. Ic = es el tamaño del intervalo de clase. n = es el número total de datos de la distribución en estudio. Ejemplo: Dada la siguiente distribución de frecuencia referida a las horas extras laboradas por un grupo de obreros. Calcule la mediana. Realice los cálculos respectivos para completar el siguiente cuadro. N° de horas Extras Obreros 55------59 6 60------64 20 65------69 18 70------74 50 75------79 17 80------84 16 85------89 5 n = 132 Prof. Simón Cabrera página 21 de 32
  • 22. ESTADISTICA DESCRIPTIVA Solución: Cuadro con las frecuencias acumuladas: N° de horas Extras Obreros Fi 55------59 6 6 60------64 20 26 65------69 18 44 70------74 50 94 75------79 17 111 80------84 16 127 85------89 5 132 N = 132 Clase Mediana ,66 2 132 2 == n luego se busca en la frecuencia acumulada Fi, un valor que sea igual o superior a 66, este se encuentra en la clase 70 -74, la cual llamaremos clase mediana. Por lo tanto el limite inferior de esa clase es 70 = Li. La frecuencia absoluta de esa clase es 50 = fi , F(i-1) = 44 y el Ic = 5. Aplicando la formula se tiene: .2.722.2705. 50 22 705 50 4466 70 =+=⎟ ⎠ ⎞ ⎜ ⎝ ⎛ +=⎥⎦ ⎤ ⎢⎣ ⎡ − +=Me Luego la mediana de esa distribución es 72.2. Esto quiere decir que un 50 % de los obreros trabajaron horas extras por debajo de 72.2 horas y el otro 50 % trabajaron horas extras por encima de 72.2 horas. CARACTERÍSTICAS DE LA MEDIANA • La mediana no es afectada por los valores extremos de una serie de valores, puesto que la misma no es calculada con todos los valores de la serie. • La mediana no esta definida algebraicamente, ya que para su cálculo no intervienen todos los valores de la serie. • La mediana en algunos casos no se puede calcular exactamente y esto ocurre cuando en una serie de valores para datos no agrupados el número de datos es par, en este caso la mediana se calcula aproximadamente. • La mediana se puede calcular en aquellas distribuciones de frecuencia de clases abierta, siempre y cuando los elementos centrales puedan ser determinados. • La suma de los valores absolutos de las desviaciones de los datos individuales con respecto a la mediana siempre es mínima. (propiedad) Prof. Simón Cabrera página 22 de 32
  • 23. ESTADISTICA DESCRIPTIVA LA MODA La moda es la medida de posición que indica la magnitud del valor que se presenta con más frecuencia en una serie de datos; es pues, el valor de la variable que más se repite en un conjunto de datos. De las medidas de posición la moda es la que se determina con mayor facilidad, ya que se puede obtener por una simple observación de los datos en estudio, puesto que es el dato que se observa con mayor frecuencia. Se designa con las letras Mo. En las representaciones gráficas la moda es el punto más alto de la gráfica. La obtención de la moda para datos agrupados no es un valor exacto, ya que varía con las diferentes formas de agrupar una distribución de frecuencia. En algunas distribuciones de frecuencias o serie de datos no agrupados o agrupados se pueden presentar dos o más modas, en estos casos se habla de serie de datos bimodales o multimodales respectivamente. Estos tipos de distribuciones o series de valores se deben a la falta de homogeneidad de los datos. Cuando una serie de valores es simétrica, la media, la mediana y el modo coinciden, y si el grado de asimetría de la serie es moderada, la mediana estará situada entre la media y el modo con una separación de un tercio entre ambas. Tomando en cuenta esta relación, cuando se tengan dos de esta medidas se puede determinar la tercera; sin embargo es conveniente utilizar esta relación para calcular solamente la moda ya que para calcular la media y la mediana existen formulas matemáticas que dan resultados más exactos; la formula matemática para calcular la moda por medio de la relación antes mencionada es: ( )MeXXMo −−= 3 . Cuando los datos se encuentran no agrupados la determinación de la moda es sencilla y exacta; pero para calcularla en datos agrupados existen varios métodos; cada uno de los cuales puede dar un valor diferente de la moda: En este curso se dará el método de la interpolación por considerarse uno de los más precisos en el cálculo de esta. Este método puede expresarse mediante la siguiente formula: IcLiMo . 21 1 ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ Δ+Δ Δ += Donde, Li = es el limite inferior de la clase modal. 1Δ = es la diferencia entre la frecuencia absoluta de la clase modal y la frecuencia de la clase anterior a la modal. 2Δ = es la diferencia entre la frecuencia absoluta de la clase modal y la frecuencia de la clase siguiente a la modal. Ic = es el tamaño del intervalo de clase. Prof. Simón Cabrera página 23 de 32
  • 24. ESTADISTICA DESCRIPTIVA Ejemplo: Dada la siguiente distribución de frecuencia correspondiente al peso en Kg. de un grupo de trabajadores de una empresa, calcule la moda. Peso (Kg) Trabajadores 30-----39 2 40-----49 2 50-----59 7 60-----69 11 70-----79 12 80-----89 16 90-----99 2 TOTAL Clase modal La clase que presenta mayor frecuencia absoluta es 80----89, entonces esta sera la clase modal, donde Li = 80 10;14216;41216 21 ==−=Δ=−=Δ Ic Aplicando la formula se tiene: .22.8222.280 18 40 8010. 144 4 80 21 1 =+=+=⎟ ⎠ ⎞ ⎜ ⎝ ⎛ + +=→⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ Δ+Δ Δ += MoLMo i Este resultado de la moda se interpreta así: La mayoría de los trabajadores tiene un peso aproximadamente de 82.22 Kg . CARACTERÍSTICAS DE LA MODA • El valor de la moda puede ser afectado grandemente por el método de elaboración de los intervalos de clases. • El valor de la moda no se halla afectado por la magnitud de los valores extremos de una serie de valores, como sucede en la media aritmética. • La moda se puede obtener en una forma aproximada muy fácilmente, puesto que la obtención exacta es algo complicado. • La moda tiene poca utilidad en una distribución de frecuencia que no posea suficientes datos y que no ofrezcan una marcada tendencia central. • No es susceptible de operaciones algebraicas posteriores. • La moda se utiliza cuando se trabaja con escalas nominales aunque se puede utilizar con las otras escalas. • La moda es útil cuando se esta interesado en tener una idea aproximada de la mayor concentración de una serie de datos. Prof. Simón Cabrera página 24 de 32
  • 25. ESTADISTICA DESCRIPTIVA OTRAS MEDIDAS POSICIÓNALES Cuando se estudio la mediana se pudo detectar que esta divide la serie de valores en dos partes iguales, una generalización de esta medida da origen a unas nuevas medidas de posición denominadas: Cuartiles; Deciles y Percentiles. Estas nuevas medidas de posición surgen por la necesidad de requerir de otras medidas que expresen diferentes situaciones de orden, aparte de las señaladas por la mediana. Por lo tanto es interesante ubicar otras medidas que fraccionen una serie de datos en diferentes partes. Es bueno destacar que los cuartiles, los Deciles y los Percentiles son unas variantes de la mediana: De la misma forma los percentiles abarcan tanto a los cuartiles como a los Deciles. LOS CUARTILES.- Son medidas posiciónales que dividen la distribución de frecuencia en cuatro partes iguales. Se designa por el símbolo Qc en la que c corresponde a los valores 1, 2 y 3. El Q1 es el valor debajo del cual queda el 25 % de los datos; Q3 deja el 75 % de los datos y Q2 divide la distribución de frecuencia en dos partes iguales, un 50 % que esta por debajo de los valores de Q2 y otro 50 % que esta por encima del valor de Q2. El Q2 es igual a la mediana. CÁLCULO DE LOS CUARTILES.- Para datos no agrupados no tiene ninguna utilidad practica calcular los cuartiles. Para el cálculo de los cuartiles en datos agrupados en una distribución de frecuencia existe un método por análisis gráfico y otro por determinación numérica, por fines prácticos en esta cátedra se utilizara él último método. Para calcular los cuartiles por el método numérico se procede de la siguiente manera: 1. Se localiza la posición del cuartil solicitado aplicando la formula de posición: 4 cn Qc = , en donde c viene a ser el número del cuartil solicitado, n corresponde al número total de datos de la distribución y 4 corresponde al número de cuartiles que presenta una distribución de frecuencia. 2. Se determina la posición que ocupa el cuartil mediante la formula: 4 cn Qc = , el resultado obtenido determinara la clase donde se encuentra ubicado el cuartil, lo cual se conseguirá en la clase donde la frecuencia acumulada Fi que sea igual o superior a este resultado. Luego se aplica la formula: .4 )1( Ic fi F cn LiQ i c ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ − += − Donde, 4 cn = Posición que ocupa el cuartil en la distribución de frecuencia. c = corresponde al número del cuartil solicitado: 1,2 3. Li = Limite real inferior de la clase donde se encuentra ubicado el cuartil. F( i-1) = Frecuencia acumulada anterior a la clase donde se encuentra el cuartil. fi = Frecuencia absoluta de clase donde se encuentra el cuartil. Prof. Simón Cabrera página 25 de 32
  • 26. ESTADISTICA DESCRIPTIVA LOS PERCENTILES – Son medidas posesiónales que dividen la distribución de frecuencia en 100 partes iguales. Con estos se puede calcular cualquier porcentaje de datos de la distribución de frecuencia. Los percentiles son las medidas más utilizadas para propósitos de ubicación de valor de una serie de datos ubicados en una distribución de frecuencia. El número de percentiles de una distribución de frecuencia es de 99. El percentil 50 es igual a la mediana y al cuartil 2, es decir: por encima y 50 % por debajo de los datos de la distribución.%50502 === PQMe El cálculo de los percentiles es similar al cálculo de los cuartiles con una variante en la posición de ubicación de estos, que viene expresada por la siguiente formula: 100 pn PP = . Con esta posición se aplica la formula: Ic fi F pn LiP i p ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ − += − )1( 100 . Ejemplo: Dada la siguiente distribución correspondiente al salario semanal en dólares de un grupo de obreros de una empresa petrolera trasnacional. Calcule: a) Q1, b) Q2, c) Compare los resultados con la mediana, d) P25, f) P50, g) P70 SALARIO EN $ Obreros Fi 200-----299 85 85 300-----399 90 175 400-----499 120 295 500-----599 70 365 600-----699 62 427 700-----799 36 463 463 Clase cuartil Clase mediana Clase percentil a) Para calcular Q1 se determina primero la posición así: .75.115 4 463 4 4631 1 === x Q Q1 = 115.75. Con ese valor de la posición encontrado se busca en las frecuencias acumuladas para ver cual de esas es mayor o igual a ese valor. Observando las frecuencias acumuladas se puede detectar que la posición 115.75 se encuentra en la clase 300------399, por lo tanto el Li = 300, fi = 90, y la F(i-1) = 85 y Ic = 100, aplicando la formula se tiene: 17.33417.34300 90 3075 300100. 90 8575.115 3001 =+=+=⎥⎦ ⎤ ⎢⎣ ⎡ − +=Q Este valor de Q1 indica que el 25 % de los obreros en estudio, devengan un salario semanal por debajo de 334.17 $ y el 75 % restante gana un salario por encima de 334.17 $. Prof. Simón Cabrera página 26 de 32
  • 27. ESTADISTICA DESCRIPTIVA b) Para calcular Q2=Me se determina primero la posición de este así. 5.231 4 4632 2 == x Q , ahora se ubica esta posición en las frecuencias acumuladas para determinar la posición de Q2, se puede observar en la distribución que esta posición esta ubicada en la clase 400----499, entonces, Li = 400, fi = 120, F(i-1) = 175 y Ic = 100, aplicando la formula se tiene: .08.44708.47400 120 5650 400100. 120 1755.231 4002 =+→+=⎥⎦ ⎤ ⎢⎣ ⎡ − +=Q Este resultado de Q2 establece que el 50 % de los obreros de este estudio, devengan un salario semanal por debajo de 447.08 $ y el otro 50 % devenga un sueldo por encima de 447.08 $. Calcule la mediana y compárela con este resultado. c) Calcular, Q2 = P50, además P25 = Q1, la comprobación de estos resultados se le deja como practica al estudiante. g) Para calcular P70 lo primero que se hace es determinar la posición, 10.324 100 46370 70 == x P . Ahora se ubica este resultado en la columna de frecuencias acumuladas para encontrar la posición de P70 en la distribución de frecuencia. Como se puede observar en la tabla de distribución de frecuencia, P70 se encuentra ubicado en la clase 500-------599, entonces, Li = 500, fi = 70, F(i-1) = 295 y Ic = 100, aplicando la formula se tiene: .57.54157.41500 70 2910 500100. 70 29510.324 50070 =+=+=⎥⎦ ⎤ ⎢⎣ ⎡ − +=P Esto indica que el 70 % de los obreros devengan un sueldo semanal que esta por debajo de 541.57 $ y que el 30% de los restantes obreros, ganan un salario por encima de 541.57 $. Prof. Simón Cabrera página 27 de 32
  • 28. ESTADISTICA DESCRIPTIVA MEDIDAS DE DISPERSION INTRODUCCIÓN La utilización de una medida de posición escogida para representar a los datos no indica otras características que el conjunto de observaciones que posee. No todas las observaciones son iguales a la medida de posición tomada o seleccionada; en general los datos difieren unos de otros, por lo tanto se hace necesario encontrar ciertos índices o medidas que indiquen la variabilidad o dispersión del conjunto de observaciones que se estudian. Una medida de variabilidad es un numero que nos indica el grado de dispersión en un conjunto de datos. Si el valor es pequeño (respecto de la unidad de medida) entonces hay una gran uniformidad entre los datos (homogénea). Por el contrario, un gran valor nos indica poca uniformidad (heterogénea). Cuando es cero quiere decir que todos los datos son iguales. Las medidas de dispersión se clasifican en dos grupos: • Medidas de Dispersión Absoluta. Son aquellas que vienen expresadas en las mismas unidades originales que indican la serie de datos. Entre las medidas de dispersión absoluta se encuentran: el rango, el rango intercuartilico, la desviación media, la varianza y la desviación típica. • Medidas de Dispersión Relativas. Estas medidas vienen expresadas en valores abstractos o porcentajes; su principal función es la de determinar entre varias distribuciones la de mayor o menor dispersión. La medida de dispersión relativa de mayor importancia es el coeficiente de variación. RANGO O RECORRIDO. Es la medida de dispersión mas sencilla y se define como la diferencia entre el valor mas alto menos el valor mas pequeño y se designa por R. Es decir, R = Xmax-Xmin para datos no agrupados. Si los datos están agrupados en K clases el rango será la diferencia entre el limite superior de la K-esima clase menos el limite inferior de la primera clase. El rango nos dará una primera idea sobre las dispersión de los datos ya que si su valor es pequeño nos indicará una gran concentración de los datos, y si por el contrario su valor es grande nos puede indicar una gran variabilidad o dispersión de los datos. Prof. Simón Cabrera página 28 de 32
  • 29. ESTADISTICA DESCRIPTIVA RANGOS ESPECIALES El rango nos da una idea de la dispersión total de las observaciones, por lo tanto puede estar afectada por valores extremos dando en consecuencia una idea de alta dispersión. Por tal motivo, se han definido otros rangos que tratan de subsanar este problema. RANGO ÍNTERCUARTILICO. Se define como la diferencia entre el cuartil tres(Q3) y el cuartil uno(Q1) de una distribución de frecuencia y se expresa así: RI = Q3 − Q1. RANGO SEMI-ÍNTERCUARTILICA. Es la diferencia entre el Q3 y el Q1 dividido entre dos: 2 13 QQ RSI − = . Si los valores de la RI o RSI son pequeños indica una alta concentración de los datos de la distribución en los valores centrales de la serie de datos. Estas medidas se utilizan para comparar los grados de variación de los valores centrales en diferentes distribuciones de frecuencias. Los mismos no son afectados por los valores extremos, no se adaptan a la manipulación algebraica, por tal motivo son de poco utilidad. DESVIACIÓN MEDIA. La desviación media de un conjunto de n observaciones x1, x2, x3,. . .xn, es el promedio de los valores absolutos de las desviaciones (di) con respecto a la media aritmética o la mediana. Si se denomina como DM a la desviación media, entonces su formula matemática será la siguiente: N d N XX DM N i i N i i ∑∑ == = − = 11 Esta formula es para datos no agrupados. Se toma el valor absoluto en la ecuación, debido a que la primera propiedad de la media aritmética establece que los desvíos (di) de una serie con respecto a la media aritmética siempre son iguales a cero, es decir: di = 0. Cuando los datos están en una distribución de clases o agrupados se aplica la siguiente formula: n df n fXX DM N i ii n i ii ∑∑ == = − = 11 & En esta formula X& es el punto medio de cada clase y fi es la frecuencia de cada clase. La Desviación Media a pesar de que para su cálculo se toman todas las observaciones de la serie, por el motivo de no tomar en cuenta los signos de las desviaciones (di), es de difícil manejo algebraico. Su utilización en estadística es muy reducida o casi nula, su importancia es meramente histórica, ya que de esta formula es la que da origen a la desviación típica o estándar. Prof. Simón Cabrera página 29 de 32
  • 30. ESTADISTICA DESCRIPTIVA VARIANZA Una manera de resolver el problema de los signos de las desviaciones respecto de la media aritmética es elevándolos al cuadrado y luego sumar todos los resultados obtenidos. Esta suma se puede considerar como una medida de la dispersión total de los valores. Aquellos que estén mas alejados de la media aritmética tendrán un aporte mayor a esta suma de cuadrados. Su mayor utilidad se presenta en la estadística inductiva y se puede interpretar como una medida de variación promedio (o el promedio de la suma de los cuadrados). Se obtiene dividiendo la variación total entre el numero de unidades o medidas. Se designa por la letra S2 su formula de calculo es al siguiente: agrupadosnodatospara n XX S i ..,. )( 2 2 ∑ − = agrupadosdatosparaX n Xf n XXf S iiii 2 22 2 )( −= − = ∑ ∑ DESVIACIÓN TIPICA Como la varianza es el promedio de los desvíos respecto de la media elevados al cuadrado, viene entonces expresada en unidades cuadradas. Para obtener una medida de dispersión en las unidades originales se le extrae la raíz cuadrada (positiva) a la varianza, obteniendo así otra medida de dispersión denominada desviación típica o estándar, la cual se designara por S y será igual a : n XX S i∑ − = 2 )( & Para datos no agrupados 2 22 )( X n fX n fXX S iiii −= − = ∑∑ & Para datos agrupados INTERPRETACIÓN DE LA DESVIACIÓN TÍPICA La desviación típica como medida absoluta de dispersión, es la que mejor nos proporciona la variación de los datos con respecto a la media aritmética, su valor se encuentra en relación directa con la dispersión de los datos, a mayor dispersión de ellos, mayor desviación típica, y a menor dispersión, menor desviación típica. Su mayor utilidad se presenta en una distribución normal, ya que en dicha distribución en el intervalo determinado por σ±X se encuentra el 68. 27% de los datos de la serie; en el intervalo determinado por la σ2±X se encuentra el 95,45% de los datos y entre la σ3±X se encuentra la casi totalidad de los datos, es decir, el 99,73% de los datos; además, existe una regla general de gran utilidad para la comprobación de los cálculos que dice: “una oscilación igual a seis veces la σ , centrada en la media comprende aproximadamente el 99% de los datos”. Prof. Simón Cabrera página 30 de 32
  • 31. ESTADISTICA DESCRIPTIVA Ejemplo: Los siguientes datos corresponden al número de panes consumidos por un grupo de familias de una urbanización de la ciudad, durante una semana determinada. Clases fi 30—32 10 33—35 18 36—38 60 39—41 100 42—44 80 45—47 14 48—50 6 ∑ 288 Solución: Clases fi iX& ii Xf & 2 ii Xf & 30—32 10 31 310 9610 33—35 18 34 612 20808 36—38 60 37 2220 82140 39—41 100 40 4000 160000 42—44 80 43 3440 147920 45—47 14 46 644 29624 48—50 6 49 294 14404 ∑ 288 11520 464508 .0.40 288 11520 === ∑ n Xf X ii & 88.12 288 11520 288 464508 2 2 2 2 =⎟ ⎠ ⎞ ⎜ ⎝ ⎛ −=−= ∑ X n Xf S ii Interpretación.- El resultado obtenido indica que en promedio, el consumo de pan de trigo del grupo de familias de esa urbanización se dispersa con respecto a su media aritmética en una cantidad igual a 3.59. =⎟ ⎠ ⎞ ⎜ ⎝ ⎛ −= ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ −= ∑∑ 2 22 1 288 11520 288 464508 n Xf n Xf S iii && .59.388.12160088.1612 ==−= Prof. Simón Cabrera página 31 de 32
  • 32. ESTADISTICA DESCRIPTIVA DISPERSIÓN RELATIVA Las medidas de variabilidad, estudiadas hasta ahora, solo permitían medir las dispersiones absolutas de los términos de la muestra. Las medidas, tomadas en esas condiciones, serán de utilidad, solo cuando se trata de analizar una sola muestra; pero, cuando hay que establecer comparaciones entre distintas muestras, será necesario expresar tales medidas en valores relativos, que pueden ser proporciones o porcentajes. Las medidas de dispersión relativas permiten comparar grupos de series distintas en cuanto a su variación, independientemente de las unidades en que se midan las diferentes características en consideración. Generalmente las medidas de dispersión relativas se expresan en porcentajes, facilitando así el estudio con medidas procedentes de otras series de valores La dispersión relativa viene a ser igual a la dispersión absoluta dividida entre el promedio. Existen varias medidas de dispersión relativa, pero, la más usada es el coeficiente de variación de Pearson, este es un índice de variabilidad sin dimensiones, lo que permite la comparación entre diferentes distribuciones de frecuencias, medidas en diferentes unidades. El coeficiente de variación de Pearson se designa con las letras CV. La formula matemática es: 100x X S CV = Una serie de valores será más dispersa que otra mientras su CV sea mayor. Ejemplo: La venta en el mercado de tres productos, varia de acuerdo al siguiente cuadro. Determine el CV de cada uno y diga cuál de ellos presenta mayor variación y cuál la menor. Producto X S Unidades CV 1 45 5 Bs. 11.11 % 2 450 40 Bs. 8.87 % 3 4500 350 Bs. 7.78 % Para resolver el problema se calcula el CV de cada producto y luego sé determina cuál presenta mayor o menor variación CV = Sx100/ X CV(1) = 5x100/45 = 11.11 %. CV(2) = 40x100/450 = 8.87 %. CV(3) = 350x100/4500 = 7.78 %. Se puede observar que la menor dispersión la presenta el producto 3, por lo tanto, de los tres productos el que menos varia es ese; por otro lado el de mayor dispersión o variabilidad es el producto 1. Prof. Simón Cabrera página 32 de 32