Este documento presenta conceptos básicos de estadística unidimensional. Explica que la estadística estudia conjuntos numerosos de elementos y se divide en descriptiva e inferencial. También define conceptos como población, muestra, variables, frecuencias absolutas y relativas, e introduce diferentes formas de representar gráficamente datos estadísticos como diagramas y histogramas.
Las Medidas de Dispersión nos resumen la información de la “muestra” o serie de datos, dándonos así información acerca de la magnitud del alejamiento de la distribución de datos en relación a un valor central o de concentración de los datos.
Formas de presentar la información estadística: tablas de frecuenciaclases_UTA
Se señala las diferentes formas de presentar la información estadística, en esta primera parte las tablas de frecuencia, se indica además algunos datos de frecuencia en epidemiología
Las Medidas de Dispersión nos resumen la información de la “muestra” o serie de datos, dándonos así información acerca de la magnitud del alejamiento de la distribución de datos en relación a un valor central o de concentración de los datos.
Formas de presentar la información estadística: tablas de frecuenciaclases_UTA
Se señala las diferentes formas de presentar la información estadística, en esta primera parte las tablas de frecuencia, se indica además algunos datos de frecuencia en epidemiología
Se hace una breve descripción de la estadística y los diferentes parámetros que esta contempla. Se manejan otros conceptos de variables, tipos, población, muestra y diversos ejemplos para su mejor entendimiento.
Definición, Tipos y Ejemplo de Variable.
Definición y Ejemplo de Población y Muestra.
Definición y Ejemplo de Parámetros Estadísticos.
Definición, Tipos y Ejemplo de Escalas de Medición.
Definición y Ejemplo de Sumatoria Razón, Proporción, Tasa y Frecuencia.
Indique a través de un ejemplo general, cada uno de estos conceptos
Definición de integral definida, propiedades,regla de Barrow,teorema fundamental del cálculo integral, cálculo de áreas, ejercicios de aplicación. Nivel: 2º Bachillerato
Presentación sobre el cálculo de probabilidades.
Operaciones con sucesos,regla de Laplace,probabilidad condicionada,probabilidad total,teorema de Bayes.
Con algunos ejercicios.
Las capacidades sociomotrices son las que hacen posible que el individuo se pueda desenvolver socialmente de acuerdo a la actuación motriz propias de cada edad evolutiva del individuo; Martha Castañer las clasifica en: Interacción y comunicación, introyección, emoción y expresión, creatividad e imaginación.
ACERTIJO DE CARRERA OLÍMPICA DE SUMA DE LABERINTOS. Por JAVIER SOLIS NOYOLAJAVIER SOLIS NOYOLA
El Mtro. JAVIER SOLIS NOYOLA, crea y desarrolla ACERTIJO: «CARRERA OLÍMPICA DE SUMA DE LABERINTOS». Esta actividad de aprendizaje lúdico que implica de cálculo aritmético y motricidad fina, promueve los pensamientos lógico y creativo; ya que contempla procesos mentales de: PERCEPCIÓN, ATENCIÓN, MEMORIA, IMAGINACIÓN, PERSPICACIA, LÓGICA LINGUISTICA, VISO-ESPACIAL, INFERENCIA, ETCÉTERA. Didácticamente, es una actividad de aprendizaje transversal que integra áreas de: Matemáticas, Neurociencias, Arte, Lenguaje y comunicación, etcétera.
Un libro sin recetas, para la maestra y el maestro Fase 3.pdfsandradianelly
Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestra y el maestro Fase 3Un libro sin recetas, para la maestr
2. INTRODUCCIÓN A LA ESTADÍSTICA
•El término Estadística procede del latín "status" debido a que sus
primeros pasos tuvieron que ver con la recogida y cuantificación de
información referente al Estado:
censos de población, cosechas recogidas, cabezas de ganado,...
•La Estadística tiene por objeto el desarrollo de técnicas para el
conocimiento numérico de un conjunto numeroso de elementos:
población de una ciudad, alumnos de 2º bachillerato de un centro,
precios de un supermercado,...
3. Fenómenos
Deterministas
(o causales)
Aleatorios
(de azar o
estadísticos)
TIPOS DE FENÓMENOS
Al repetirlos en idénticas condiciones,
se obtiene el mismo resultado y,por
tanto,son predecibles.
Al repetirlos en idénticas condiciones,
un gran número de veces,se obtienen
resultados diferentes y, por tanto, es
imposible predecir el resultado de cada
prueba hasta que no se realiza.
Ej.: Tiempo que tarda un móvil,
a velocidad constante,en recorrer
una distancia dada
Ej.: Número obtenido en el
lanzamiento de un dado
Son los objetos de
estudio de la
Estadística
4. MÉTODO DE TRABAJO DE LA
ESTADÍSTICA
RAMAS DE LA ESTADÍSTICA
●Descripción de los datos observados Estadística Descriptiva
●Modelización del comportamiento Cálculo de Probabilidades
●Estimación de lo desconocido y
generalización
Teoría de Muestras e Inferencia
Estadística
5. ESTADÍSTICA DESCRIPTIVA
● Recuento,ordenación y clasificación de gran cantidad de datos
obtenidos por observación de todos los individuos de una población.
● Presentación de datos en forma resumida y manejable,mediante:
tablas,gráficas y cálculo de parámetros estadísticos (media, mediana,
cuartiles,percentiles,desviación típica,etc.) que caracterizan la
distribución de los datos.
6. ESTADÍSTICA INFERENCIAL
● Se apoya en el Cálculo de Probabilidades.
● Maneja resultados de la Estadística Descriptiva.
● Se utiliza para establecer previsiones y conclusiones generales sobre
una población,a partir únicamente del conocimiento de una muestra
extraída de la misma.
7. 7
Utilidad de las muestras:
Estudiando muestras finitas representativas,se pueden obtener conclusiones
extrapolables a toda la población,(admitiendo un cierto riesgo de error).
Se recurre al uso de las muestras cuando:
La población es excesivamente numerosa (talla media de los españoles)
La población es difícil o imposible de controlar (visitantes de una ciudad)
El proceso de medición es destructivo (duración media de bombillas)
Se desea conocer rápidamente la población (encuesta sobre alimentación)
CONCEPTOS BÁSICOS DE ESTADÍSTICA
Población o universo: conjunto de todos los elementos que poseen
una característica común y que son objeto de un estudio estadístico.
Individuo (o unidad estadística): cada elemento de la población.
Tamaño: nº de elementos de la población.Puede ser finito o infinito,
y se representa por N.
Muestra: subconjunto extraído de la población.
8. 8
La elección de la muestra (y las técnicas utilizadas),se llama muestreo.
Las muestras elegidas deben ser representativas de la población, y así evitar
que haya errores imprevistos (sesgos).
Para ello el muestreo debe ser aleatorio: Todos los individuos de la muestra
se eligen al azar, es decir, que cada individuo de la población tiene la misma
probabilidad de ser elegido.
Ejemplos:
● En un sondeo de opinión para conocer la intención de voto de una ciudad:
la población son todos los individuos con derecho a voto ,y
la muestra el conjunto de personas a las que se encuesta.
● En el estudio de la proporción de tornillos defectuosos producidos por una
fábrica en un mes:
la población son todos los tornillos que produce la fábrica en el mes,y
la muestra los tornillos que se seleccionan para comprobar si son o no
defectuosos.
9. 9
CARACTERES ESTADÍSTICOS
Caracteres
estadísticos
Cuantitativos
(o var. estadísticas)
Cualitativos
(o atributos)
Toman valores numéricos
No toman valores numéricos
Ej.: Peso,talla,nº hijos,
horas de estudio diarias
Ej.: color de ojos,color de pelo,
partido al que se vota,profesión
Un carácter estadístico es cualquier propiedad que permite clasificar los
individuos de una población,y que puede tomar distintos valores o estados,
llamados modalidades ,de manera que cada individuo pertenece a una y
sólo una de dichas modalidades.
10. 10
TIPOS DE VARIABLES ESTADÍSTICAS
Variables
estadísticas
Discretas
Continuas
Toman valores aislados
Pueden tomar todos los valores
de un intervalo de la recta real
Ej.: nº hijos de las familias,
nº asignaturas en 2º Bto
Ej.: estatura, peso,
temperaturas diarias
Una variable estadística es un carácter cuantitativo,es decir,un aspecto
medible de una población.Según los valores numéricos que puede tomar,
se clasifican en:
11. 11
EJEMPLO
CARACTER
ESTADÍSTICO
MODALIDADES TIPO
Sexo {Hombre,Mujer} Cualitativo
Edad {12,13,14,15,16,17,18,19} Cuantitativo
(discreto)
Curso {1º,2º,3º,4º,1ºBto,2ºBto} Cualitativo
Talla { [140,150],]150,160],]160,170],
]170,180],]180,190],]190,200] }
Cuantitativo
(continuo)
Población: Todos los alumnos de un Instituto
12. 12
frecuencia absoluta de la modalidad xi, es el nº de individuos de la
población que presentan dicha modalidad; o sea, el nº de veces que se
repite xi en la población. Se representa fi.
Como las modalidades son incompatibles y exhaustivas,se tiene que:
N = f 1+ f 2+ f 3+...+ f k = ∑
i=1
k
f i
frecuencia relativa de la modalidad xi , es la proporción de individuos de
la población que presentan dicha modalidad; o sea,es el cociente entre
la frecuencia absoluta y el número total de individuos. Se representa hi.
h
i
=
f
i
N
(0 ⩽ h
i
⩽ 1 )
FRECUENCIAS
Sea una población de N individuos,en la que se estudia un carácter
estadístico con modalidades x1,x2,....,xk.
13. 13
Una propiedad obvia de las frecuencias relativas, es que su suma es 1:
∑
i=1
k
h
i
= ∑
i=1
k f
i
N
=
∑
i=1
k
f
i
N
=
N
N
= 1
Frecuencia absoluta acumulada de la modalidad xi ,es la suma de las
frecuencias absolutas desde la 1ª hasta la i-ésima; se representa por Fi .
F
i
= f
1
+ f
2
+ f
3
+....+ f
i
= ∑
j=1
i
f
j
14. 14
Frecuencia relativa acumulada de la modalidad xi , es la suma de las
frecuencias relativas desde la 1ª hasta la i-ésima; se representa Hi .
También es el cociente entre la frecuencia absoluta acumulada Fi y el
número total de individuos N de la población.
H
i
= ∑
j=1
i
h
j
= ∑
j=1
i f
j
N
=
∑
j=1
i
f
j
N
=
F
i
N
H
i
= h
1
+h
2
+h
3
+....+h
i
= ∑
j=1
i
h
j
15. 15
MODAL.
xi
FR.ABS
fi
FR.ABS
ACUM Fi
FR.REL
hi
FR.REL
ACUM Hi
PORC.
100·hi%
GRADOS
360·hiº
x1 f1 F1 h1 H1 100h1 % 360·h1 º
x2 f2 F2 h2 H2 100h2 % 360·h2 º
…....... …....... …....... …....... …....... …....... ….......
xk fk Fk = N hk Hk = 1 100hk % 360·hk º
TOTAL N 1 100 % 360º
Se llama distribución de frecuencias al conjunto de pares ordenados
de las modalidades o valores de una variable estadística y sus frecuencias.
{ (x1,f1) , (x2,f2) , ...... , (xk,fk) }
Colocando los valores con sus correspondientes frecuencias en una tabla
formamos una tabla estadística.
DISTRIBUCIÓN DE FRECUENCIAS Y TABLAS
17. 17
En el caso de variables continuas o discretas con un gran nº de datos,
éstos se agrupan en intervalos o clases.Entonces,la distribución de
frecuencias es de la forma { (I1,f1) , (I2,f2) , ...... , (Ik,fk) }
donde Ii = ] ei , ei+1] es el intervalo i-ésimo
extremos de clase son los dos extremos ei (extremo inferior) y
ei+1 (extremo superior) de cada intervalo.
amplitud de clase es la diferencia entre el extremo superior y el extremo
inferior del intervalo: ai = ei+1 - ei
marcas de clase son los puntos medios de los intervalos:
xi = (ei + ei+1) / 2
OBSERVACIONES:
➔ Los intervalos no tienen por qué ser de igual amplitud.Si ocurre esto,hay
que tenerlo muy en cuenta en la representación gráfica, para recalcular
la altura de los rectángulos en los histogramas( altura = frecuencia/base).
➔ Por lo anterior,si se puede elegir,es más cómodo tomar los intervalos con
igual amplitud, para facilitar los cálculos.
➔ Las clases primera y última pueden ser intervalos no acotados, de
amplitud infinita (semirrectas). Con eso se pretende recoger los casos
muy extremos o “raros” que se pudieran dar.
18. 18
➔ Si tenemos una variable discreta con numerosos datos, se aconseja
“convertirla” en continua, agrupando los datos en intervalos.
➔ El número de intervalos aconsejable es igual a la raíz cuadrada del
número total de datos. Si no es exacta, decidiremos el nº de intervalos
redondeando.
➔ Hallamos el rango o recorrido ( R = valor máximo – valor mínimo )
de los datos.
➔ Repartimos ese rango entre el número total de intervalos y tendremos
la amplitud que hay que dar a cada intervalo.
CONSTRUCCIÓN DE LOS INTERVALOS
19. 19
Las edades de los pacientes que han visitado a un médico en un mes son:
3 2 11 13 4 3 2 4 5 6
7 3 4 5 3 2 5 6 27 15
4 21 14 4 3 6 29 13 6 17
6 13 6 5 12 26
Construye la tabla de frecuencias agrupando los datos en clases de amplitud 5
Intervalos Marcas xi recuento fi Fi hi Hi %
]0,5] 2,5 ||||| ||||| ||||| || 17 17 0,4722 0,4722 47,22
]5,10] 7,5 ||||| || 7 24 0,1944 0,6666 19,44
]10,15] 12,5 ||||| || 7 31 0,1944 0,861 19,44
]15,20] 17,5 | 1 32 0,0278 0,8888 2,78
]20,25] 22,5 | 1 33 0,0278 0,9166 2,78
]25,30] 27,5 ||| 3 36 0,0833 0,9999 8,33
TOTALES 36 0,9999 99,99
Abrir documento Variable estadística (tratada como) continua
20. 20
REPRESENTACIONES GRÁFICAS
CARACTER CUALITATIVO
(ATRIBUTO)
CARACTER CUANTITATIVO
(VARIABLE ESTADÍSTICA)
Diagrama rectangular
VARIABLE
DISCRETA
VARIABLE
CONTINUA
Diagrama de sectores
Pictograma
Diagrama de
barras
Histograma
Cartograma
Pirámides de población
Polígono de
frecuencias
Polígono de
frecuencias
22. 22
DIAGRAMA DE SECTORES
Consiste en repartir el área del círculo en sectores de tamaño proporcional
a la frecuencia de cada modalidad.
360º
N
=
n
i
º
f
i
→ n
i
º = 360º ·
f
i
N
→ n
i
º = 360º · h
i
23. 23
PICTOGRAMAS
Consiste en la representación de figuras alusivas al carácter estudiado,
de forma que el tamaño o el nº de ellas sea proporcional a la frecuencia
de cada modalidad.
24. 24
PIRÁMIDES DE POBLACIÓN
Se utilizan para estudiar conjuntamente el carácter cuantitativo (variable
estadística) edad y el carácter cualitativo (atributo) sexo. Se representa
en la abscisa el sexo y en la ordenada el grupo de edad.
Población joven Población adulta
25. 25
DIAGRAMA DE BARRAS Y POLÍGONO DE FRECUENCIAS
Los diagramas de barras se utilizan para representar una var. estadística
discreta, colocando en el eje de abscisas los valores xi , y levantando barras
cuya altura sea la de la frecuencia correspondiente.
Si se unen los extremos de las barras mediante una línea poligonal, se
obtiene otro tipo de gráfico llamado polígono de frecuencias .
26. 26
También se pueden representar diagramas de barras acumulativos ,
utilizando como altura de las barras las frecuencias absolutas acumuladas.
Y, análogamente, el polígono de frecuencias acumulativo .
27. 27
Si se quieren comparar varias poblaciones de distinto tamaño,se usan las
frecuencias relativas o los porcentajes en los diagramas.
28. 28
HISTOGRAMA Y POLÍGONO DE FRECUENCIAS
Los histogramas se utilizan para representar una var. estadística continua,
(con datos agrupados por intervalos), colocando en el eje de abscisas los
extremos de los intervalos ] ei , ei+1 ] y levantando rectángulos de base los
intervalos y cuya altura sea la de la frecuencia correspondiente.(Esto sólo
en el caso de que todos tengan la misma amplitud; en otro caso, la altura
será igual a la frecuencia absoluta fi dividida por la amplitud ai del intervalo).
Si se unen los puntos medios de las bases superiores de los rectángulos,
mediante una línea poligonal, se obtiene otro tipo de gráfico llamado
polígono de frecuencias (el área que encierra coincide con el área de los
rectángulos del histograma).
HISTOGRAMA Y POLÍGONO DE FRECUENCIAS
29. 29
PARÁMETROS ESTADÍSTICOS
Resumiremos los datos de una tabla estadística en unos pocos valores
que nos informen de las características más relevantes de la población.
Estos valores representativos son los parámetros estadísticos
Parámetros
estadísticos
De centralización
De posición
De dispersión
●Media
●Mediana
●Moda
●Otras medias
Cuantiles:
●Cuartiles
●Deciles
●Percentiles
●Recorrido
●Rangos
●Desviación media
●Varianza
●Desviación típica
●Coeficiente de variación
30. 30
1.MEDIDAS DE CENTRALIZACIÓN
Las medidas o estadísticos de centralización nos indican los valores en
torno a los cuales se distribuyen los datos de la variable estadística.
Las más usadas son las medias (aritmética, geométrica, armónica,...),
la moda y la mediana.
MEDIA ARITMÉTICA
La media aritmética de una variable estadística X se representa por x ,
y se define como la suma de todos los valores xi de la variable dividida por
el número total de valores existentes (teniendo en cuenta el nº de veces fi
que se repite cada valor):
̄x =
f
1
· x
1
+ f
2
· x
2
+...+ f
k
· x
k
N
=
∑
i=1
k
f
i
· x
i
N
=
∑
i=1
k
f
i
· x
i
∑
i=1
k
f
i
31. 31
OBSERVACIONES:
● Si los datos de la variable se agrupan en intervalos (variable continua),
se toma como xi la marca de clase( para “convertirla” en discreta ).
● Es la medida de centralización más utilizada.
● Tiene en cuenta todos los valores en su cálculo.
● Si hay valores extremos poco significativos, éstos producen una distorsión
en la media.
MEDIANA
Teniendo ordenados,de menor a mayor, los N valores xi de la variable
estadística, la mediana es el valor Me que tiene tantos valores por debajo
como por encima, dividiendo así a la población en dos partes de igual
tamaño, N/2.
La mediana Me, es el valor que ocupa la posición central si el número de
datos N es impar; o bien, la semisuma de los datos centrales si el número
de datos N es par.
32. 32
Ejemplo2: N = 10 (par) → N/2 = 10/2 = 5
3 4 4 5 6 7 7 7 10 12
Me = (6+7)/2 = 6,5
Ejemplo1: N = 9 (impar) → N/2 = 9/2 = 4,5
3 4 4 5 6 7 7 7 10
Me = 6
6,5
La mediana Me, se puede calcular directamente sobre los datos ordenados:
33. 33
Cuando N es relativamente grande la mediana Me, también se puede
calcular utilizando la tabla de frecuencias absolutas acumuladas Fi .
Se busca el primer valor Fi ≥ N/2 , y se localiza el valor xi que le
corresponde; dicho valor es Me.
xi recuento fi Fi hi Hi % grados
0 | | 2 2 0,067 0,067 6,7 24,12
1 | | | 3 5 0,1 0,167 10 36
2 | 1 6 0,033 0,2 3,3 11,88
3 | 1 7 0,033 0,233 3,3 11,88
4 | 1 8 0,033 0,266 3,3 11,88
5 | | | 3 11 0,1 0,366 10 36
6 | | 2 13 0,067 0,433 6,7 24,12
7 | | | | | 5 18 0,167 0,6 16,7 60,12
8 | | | | | | | 7 25 0,233 0,833 23,3 83,88
9 | | | | | | 5 30 0,167 1 16,7 60,12
10 0 30 0 1 0 0
TOTALES 30 1 100 360
Me = 7
Abrir documento
N/2 = 15 ≤ 18 = Fi
34. 34
Si la variable es continua, se halla el intervalo que contiene a la
mediana como el primer intervalo donde Fi ≥ N/2 ( en el histograma
acumulativo ); después se halla la mediana por interpolación:
ei-1 ei
Fi
Fi-1
N/2
Me
F
i
− F
i−1
e
i
− e
i−1
=
N
2
− F
i−1
M
e
−e
i−1
M
e
= e
i−1
+
N
2
− F
i−1
f
i
·a
i
35. 35
F
i
− F
i−1
e
i
− e
i−1
=
N
2
− F
i−1
M
e
−e
i−1
M
e
= e
i−1
+
N
2
− F
i−1
f
i
·a
i
En las dos fórmulas anteriores, tenemos:
Fi → frecuencia absoluta acumulada de la clase mediana
Fi-1 → frecuencia absoluta acumulada de la clase precedente a la clase
mediana
ei → límite superior de la clase mediana
ei-1 → límite inferior de la clase mediana
ai → amplitud de la clase mediana (ei – ei-1)
fi → frecuencia absoluta, (Fi – Fi-1)
N/2 → mitad del número total de datos
37. 37
MODA
La moda es el valor Mo de la variable que más se repite; o sea, el de mayor
frecuencia absoluta. Puede haber varias modas y, según esto, la distribución
de la variable se llama unimodal, bimodal, etc.
Mo = 8
Distribución unimodal
Mo = 3 y 4
Distribución bimodal
38. 38
CΔ1 = fi - fi-1
ei-1 ei
Mo
A
F B
E
Δ2 = fi - fi+1
fi
fi-1
fi+1
M
o
− e
i−1
Δ
1
=
e
i
− M
o
Δ
2
M
o
= e
i−1
+
Δ
1
Δ
1
+ Δ
2
· a
i
Si la variable es continua, se halla la clase modal o intervalo de mayor
frecuencia (el de mayor altura del histograma); después se halla la moda
interpolando con la fórmula siguiente (triángulos ACF y BCE semejantes):
39. 39
M
o
− e
i−1
Δ
1
=
e
i
− M
o
Δ
2
M
o
= e
i−1
+
Δ
1
Δ
1
+ Δ
2
· a
i
En las dos fórmulas anteriores, tenemos:
ei-1 → límite inferior de la clase modal
ei → límite superior de la clase modal
ai → amplitud de la clase modal (ei – ei-1)
Δ1 → diferencia entre la frecuencia absoluta modal fi y la premodal fi-1
Δ2 → diferencia entre la frecuencia absoluta modal fi y la postmodal fi+1
40. 40
CΔ1 = fi - fi-1
ei-1 ei
Mo
A
F B
E
Δ2 = fi - fi+1
fi
fi-1
fi+1
M
o
− 15
38−25
=
20 − M
o
38−16
M
o
= 15 +
13
13 + 22
· 5 = 16,86
41. 41
2.MEDIDAS DE POSICIÓN
Son una generalización de la mediana. Los cuantiles sirven para determinar
en qué posición de la distribución se encuentra un individuo,supuestos éstos
ordenados en orden creciente.
Los cuantiles son aquellos valores que dividen a la muestra en intervalos
con igual número de observaciones.Los más importantes son los siguientes:
cuartiles, deciles y percentiles, según el número de partes en que dividen
a la población.
CUARTILES
Dividen a la población en cuatro partes,cada una de las cuales contiene al
25 % de la población, es decir, N/4 valores. Hay tres cuartiles:
Primer cuartil: Q1 = C1/4
Segundo cuartil: Q2 = C1/2 = Me
Tercer cuartil: Q3 = C3/4
En general,un cuartil Qi deja a su izquierda i·N/4 valores menores que él
( i = 1, 2, 3).
La forma de calcularlos es similar a la de la mediana.
42. 42
DECILES
Dividen a la población en diez partes, cada una de las cuales contiene al
10 % de la población, es decir, N/10 valores. Hay nueve deciles:
Primer decil: D1 = C1/10
·········································
Noveno decil: D9 = C9/10
En general,un decil Di deja a su izquierda i·N/10 valores menores que él
( i = 1, 2, 3 , …. , 9 ).
CENTILES O PERCENTILES
Dividen a la población en cien partes, cada una de las cuales contiene al
1 % de la población,o sea,N/100 valores. Hay noventa y nueve percentiles:
Primer percentil: P1 = C1/100
···············································
Último percentil: P99 = C99/100
En general,un centil o percentil Pi deja a su izquierda i·N/100 valores
menores que él ( i = 1, 2, 3 , …. , 99 ).
44. 44
Obviamente se cumplen las relaciones siguientes:
P25 = Q1 = C1/4
P50 = D5 = Q2 = C1/2 = Me
P75 = Q3 = C3/4
Cuando N es relativamente grande, los cuartiles se calculan utilizando
la tabla de frecuencias absolutas acumuladas del total N de datos,
de forma similar a como se calculaba la mediana( calculando los
valores que corresponden a N/4, N/2 , 3N/4, etc).
En general, para hallar el percentil Pk, se utiliza la tabla de las
frecuencias absolutas acumuladas expresadas en % , y se toma
la primera de ellas que supera el k %. El valor xi que le corresponde
será el percentil Pk.
Si alguna de esas frecuencias en porcentaje coincide con el k% ,
entonces se toma como Pk la media entre ese xi y el siguiente xi+1.
CÁLCULO DE CUANTILES
45. 45
xi fi Fi hi Hi % grados % acumulado
0 2 2 0,067 0,067 6,7 24,12 6,7
1 3 5 0,1 0,167 10 36 16,7
2 1 6 0,033 0,2 3,3 11,88 20
3 1 7 0,033 0,233 3,3 11,88 23,3
4 1 8 0,033 0,266 3,3 11,88 26,6
5 3 11 0,1 0,366 10 36 36,6
6 2 13 0,067 0,433 6,7 24,12 43,3
7 5 18 0,167 0,6 16,7 60,12 60
8 7 25 0,233 0,833 23,3 83,88 83,3
9 5 30 0,167 1 16,7 60,12 100
10 0 30 0 1 0 0 100
TOTALES 30 1 100 360
para hallar cuartiles (con Fi) para hallar percentiles (con % acumulado)
N/2 = 15 15ª y 16ª pos. → (60>50)
N/4 = 7,5 8ª posición → 4 (26,6>25)
3N/4 = 22,5 23ª posición → 8 (83,3>75)
(2+3)/2 = 2,5 (20 = 20)
Q2 = P50 = C50/100 = Me = 7
Q1 = P25 = C25/100 =
Q3 = P75 = C75/100 =
P20 = C20/100 =
EJEMPLO 1: Las calificaciones de 30 alumnos de un colegio vienen
dadas por la siguiente tabla. Halla los tres cuartiles y el percentil P20.
Variable estadística discreta
46. 46
EJERCICIO: Los pesos de 100 alumnos de un colegio vienen dados
por la siguiente tabla. Calcula media, moda, mediana, los tres cuartiles
y el percentil P30.
Intervalos Marcas xi fi
]40,48] 44 10
]48,56] 52 20
]56,64] 60 30
]64,72] 68 20
]72,80] 76 20
TOTALES 100
EJEMPLO 2: Los pesos de 100 alumnos de un colegio vienen dados
por la siguiente tabla. Calcula media, moda, mediana, los tres cuartiles
y el percentil P30.
Comprueba gráficamente estos resultados en los histogramas que
correspondan en cada caso.
50. 50
DIAGRAMA BOX-WHISKER ( CAJA CON BIGOTES )
La caja abarca el intervalo Q1, Q3 y en ella se señala la mediana Me.
Los bigotes se trazan hasta abarcar todos los datos, sin sobrepasar la
longitud de una vez y media la longitud de la caja, o sea, 1,5·(Q3 – Q1).
Si así fuera, se traza la longitud máxima permitida, y los individuos que
caigan fuera se señalan mediante puntos o asteriscos ( casos “raros” ).
El 50 % de los datos centrales están dentro de la caja,entre el primer
y el tercer cuartil, mientras que el resto están representados sobre los
segmentos o bigotes.
51. 51
CONSTRUCCIÓN DEL DIAGRAMA BOX-WHISKER
Para construir el diagrama Box-Whisker se determinan:
● Rango intercuartílico → RIQ = Q3 - Q1
● Factor de escala → FE = 1,5 · RIQ
● Frontera interior inferior → f1 = Q1 – FE
● Frontera interior superior → f2 = Q3 + FE
● Valor adyacente inferior → VAI = menor dato ≥ f1
● Valor adyacente superior → VAS = mayor dato ≤ f2
● Valores anómalos → los datos que están fuera del intervalo
] f1 , f2 [
• • • • ••
VAI VASQ3Q1 Q2 = ME
f1 f2
X min X max
52. 52
Las medidas de dispersión miden la mayor o menor separación que hay
entre los datos de la distribución; es decir, si están concentrados o, por el
contrario, se encuentran dispersos.
3.MEDIDAS DE DISPERSIÓN
Parámetros
de dispersión
Dispersión
absoluta
Dispersión
relativa
Coeficiente de variación
Recorrido y otros rangos,
desviación media, varianza y
desviación típica
permiten comparar la mayor o
menor heterogeneidad de dos
distribuciones
confrontan la dispersión absoluta
con el valor de algún promedio.
A menor dispersión relativa,menor
variabilidad de los datos y mayor
representatividad del promedio
considerado.
53. 53
RECORRIDO
El recorrido o rango es la diferencia entre el valor máximo y el valor
mínimo de los datos.
OTROS RANGOS
Existen otros rangos interesantes como, por ejemplo:
el rango intercuartílico es la diferencia entre el tercer y el primer
cuartil, y abarca el 50 % de la población.
R = X
máx
− X
mín
RIQ = Q
3
− Q
1
DESVIACIÓN MEDIA
La desviación media es la media de los valores absolutos de las
desviaciones respecto a la media.
54. 54
D.media
X
=
∑
i=1
k
f
i
·∣x
i
− ̄x∣
N
=
∑
i=1
k
f
i
·∣x
i
− ̄x∣
∑
i=1
k
f
i
VARIANZA Y DESVIACIÓN TÍPICA
La varianza es la media de los cuadrados de las desviaciones respecto
a la media. Por tanto, la varianza se mide en unidades cuadradas de la
variable y, por ello, se usa la desviación típica que es la raíz cuadrada
de la varianza, y que se mide en la misma unidad que la variable.
Var
X
= σ
2
=
∑
i=1
k
f
i
·
(x
i
− ̄x
)2
N
=
∑
i=1
k
f
i
·
(x
i
− ̄x
)2
∑
i=1
k
f
i
55. 55
Otra expresión (más cómoda) de la varianza: es la media de los
cuadrados menos el cuadrado de la media.
Var
X
= σ
2
=
∑
i=1
k
f
i
· x
i
2
N
− ̄x
2
=
∑
i=1
k
f
i
· x
i
2
∑
i=1
k
f
i
− ̄x
2
Y la desviación típica es la raíz cuadrada de cualquiera de las dos
expresiones anteriores
σ =
√∑
i=1
k
f
i
·(x
i
− ̄x)2
N
=
√∑
i=1
k
f
i
· x
i
2
N
− ̄x
2
56. 56
En distribuciones normales,
el intervalo ( x - σ, x + σ ) contiene el 68,27 % de los datos de la población,
el intervalo ( x - 2σ, x + 2σ) contiene el 95,45% , y
el intervalo ( x - 3σ, x + 3σ ) contiene el 99,73%.
COEFICIENTE DE VARIACIÓN
dispersión relativa = medida de dispersión
promedioutilizadoenel numerador
CV = σ
̄x
El coeficiente de variación es el cociente entre la desviación típica y la
media aritmética. Se suele expresar en %. Cuanto menor es el CV, más
concentrada está la distribución alrededor de su media y, por tanto, ésta
es más representativa.
Y, al contrario, a medida que se aleja de 0, el parámetro media es menos
representativo de la población.
100 · CV (º /º ) = 100 · σ
̄x
(º /º )