2. 1. Conceptos generales.
2. Medidas de centralización.
3. Medidas de dispersión.
4. Medidas de posición.
5. Medidas de forma.
6. Tipificación.
0
10
20
30
40
50
60
70
80
90
1er trim. 2do trim. 3er trim. 4to trim.
Este
Oeste
Norte
3. 1. Conceptos generales.
Estadística (“Estado”): parte de las Matemáticas que
se encarga de RECOGER y ANALIZAR datos.
Teoría de muestras,
Diseño de experimentos
Estadística Descriptiva
Estadística Inferencial
4. Muestra
POBLACION
Razones para tomar muestras: tiempo, dinero, accesibilidad, …
PARADOJICAMENTE, para conocer a la población no
hace falta estudiar a TODA la población…
5. EN DOS SEMANAS RECORTA 4 PUNTOS
El PP se sitúa a dos puntos del PSOE en intención de voto,
según una encuesta publicada en El País
El PP se encuentra a dos puntos del PSOE en intención directa de voto, según un sondeo del Instituto Opina
que publica este domingo el diario El País. Agrega el periódico que el PP ha logrado recortar en dos
semanas cuatro puntos en intención de voto respecto a los socialistas, quienes tenían un 44 por ciento de
intención de voto, frente al 38 por ciento del PP, según la anterior encuesta de Opina, publicada el 25 de
septiembre en ése mismo diario.
L D (Agencias) El sondeo publicado este domingo, hecho sobre una muestra de 1.300 entrevistas hechas desde el 4 al 6 de octubre en todo
el territorio español, desvela que el PP gana dos puntos y el PSOE los pierde, "con lo que la diferencia se reduce drásticamente y supone la
ventaja socialista más reducida desde las elecciones generales"..
Aunque los diarios La Vanguardia y El Periódico de Cataluña recogen otra encuesta que revela que el PSC y CiU mantienen un
empate técnico, aunque en los porcentajes de intención de voto el PSC continuaría por delante. En ambas encuestas, tanto el
presidente de la Generalidad, Pasqual Maragall, como el líder de la oposición, Artur Mas, mejoran sustancialmente su valoración
respecto a encuestas anteriores, aunque Maragall saca 19,3 puntos en la pugna por la presidencia de la Generalidad.
Así, la encuesta de La Vanguardia elaborada por el Instituto Noxa entre los días 3 y 6 de octubre a 1.000 entrevistados, otorga al
PSC 44 escaños y una intención de voto del 32,5 por ciento, mientras que CiU pasaría de los actuales 46 escaños a 43 y mantendría
una intención de voto del 29,2 por ciento. ERC mantendría su estatus de tercera fuerza política con 23 escaños, al igual que el PP,
aunque según la encuesta crece la intención de voto respecto a las elecciones de 2003 y alcanza el 12,7 por ciento. ICV-EA también
subiría y podría alcanzar los 10 escaños. Por su parte, la encuesta de El Periódico realizada durante los mismos días por la
empresa Gesop a 800 entrevistados sitúa a PSC y CiU con un voto estimado del 32 por ciento en ambos casos, aunque la intención
de voto directa otorga al PSC un 31,5 por ciento y a CiU un 22,3 por ciento.
7. • Intención de voto
• Número de hijos
• Longitud del ala de un pájaro
• Número de ejemplares de una especie en un continente.
• Tiempo de recuperación de un ecosistema.
• Número del despacho de distintos profesores.
• …….
8. Una vez diseñada la muestra, recogemos los datos;
después, la información proporcionada por ellos debe
ORDENARSE
Tablas y gráficas estadísticas
(datos agrupados y no agrupados)
9. Procedimiento usual para agrupar datos en clases
(libro de Susan Milton,
pág. 22):
1.- El nº de clases se puede aproximar como k=1+3.322 log10n
(n tamaño de la muestra; k se redondea hacia abajo,
p. ej. 6.82 a 6).
2.- Localizamos el mayor y menor dato, respectivamente. Diferencia entre
ambos: RANGO de los datos.
3.- Amplitud mínima de clase: cociente entre el rango y el nº de clases.
- Redondeamos por arriba el nº obtenido hasta la precisión de los datos; si
el cociente tiene ya esa precisión, la incrementamos en una unidad.
- El extremo inferior de la primera clase es el menor de los datos, disminui-
do en 0.5 si los datos son enteros, en 0.05 si tienen 1 decimal, en 0.005
si tienen 2 decimales…
(Así ningún dato coincide con un extremo de un intervalo)
4.- Alternativa: intervalos [a,b)
5.- Si hay datos atípicos (outliers), la técnica se modifica (S. Milton, p. 25)
10. Ejemplo 1:
xi
ni ó %i
17 18 19 21 22
DIAGRAMA DE BARRAS
xi ni fi %i
17 2 0,1 10
18 10 0,5 50
19 4 0,2 20
21 3 0,15 15
22 1 0,05 5
20 1 100
GRAFICOS ESTADISTICOS
11. xi ni fi %i
3.75-5.95 4,85 2 0,05 5
5.95-8.15 7,05 4 0,1 10
8.15-10.35 9,25 10 0,25 25
10.35-12.55 11,45 16 0,4 40
12.55-14.75 13,65 6 0,15 15
14.75-16.95 15,85 2 0,05 5
Total: 62,1 40 1 100
Ejemplo 2:
xi
ni ó %i
3.75 5.95 8.15 10.35….
HISTOGRAMA
14. 2. Medidas de centralización.
3. Medidas de dispersión o variabilidad.
4. Medidas de posición.
15. 3. Medidas de dispersión o variabilidad.
La DISPERSION (o variabilidad)de un conjunto de datos es una medida
de la distancia entre los datos, y su media.
Poca dispersión = Datos homogéneos = Media
muy representativa
Mucha dispersión = Datos heterogéneos =
Media poco representativa
16. Ejemplo 5: En una investigación sobre deficiencias medioambientales encon-
tradas en plantas industriales, se seleccionaron aleatoriamente 25 plantas
de dos comunidades diferentes. Se obtuvieron los siguientes datos sobre el
número de deficiencias encontradas:
Nº deficiencias com. A Frecuencia
1 1
2 3
3 5
4 7
5 5
6 3
7 1
Nº deficiencias com. B Frecuencia
1 6
2 4
3 2
4 1
5 2
6 4
7 6
La media es 4, en cada
comunidad; pero ¿en cuál
de ellas la variable es más
dispersa?
17. 1 2 3 4 5 6 7
1 2 3 4 5 6 7
Nº deficiencias com. A Frecuencia
1 1
2 3
3 5
4 7
5 5
6 3
7 1
Nº deficiencias com. B Frecuencia
1 6
2 4
3 2
4 1
5 2
6 4
7 6
Ejemplo 5: En una investigación sobre deficiencias medioambientales encon-
tradas en plantas industriales, se seleccionaron aleatoriamente 25 plantas
de dos comunidades diferentes. Se obtuvieron los siguientes datos sobre el
número de deficiencias encontradas:
+ disp.
18. ¿Cómo podemos medir la dispersión?
1.- Rango: dif. entre el mayor y el menor de los datos.
2.- Varianza:
3.- Desviación típica:
V
S
k
i
i
k
i
i
n
n
x
x
S
1
1
2
2
19. Propiedades de la varianza y la desviación típica:
1.- La varianza no puede ser negativa.
2.- A igualdad de medias, cuanto mayor sea la dispersión, mayor es la
varianza (y la desv. típica).
3.- Si dos conjuntos de datos poseen medias similares, es más disperso
aquel que tenga mayor varianza (desv. típica).
4.- El recíproco no es necesariamente cierto, porque la varianza (desv. típica)
depende también del tamaño de los datos.
Coeficiente de variación (CV)
5.- Interpretación de la desviación típica en fenómenos
de medida.
20. ¿Cómo podemos medir la dispersión?
1.- Rango.
2.- Varianza.
3.- Desviación típica.
4.- Coeficiente de variación:
A mayor CV, mayor dispersión
x
S
CV
21. Ejemplo: Se realiza un experimento para investigar el efecto de una
nueva dieta, sobre la ganancia de peso de cachorros durante las primeras
semanas de vida.
Gran Danés: ganancia media de 30 libras, desv. típica de 10 libras.
Chihuahua: ganancia media de 3 libras, desv. típica de 1’5 libras.
¿Qué grupo posee mayor variabilidad?
22. ¿Cómo podemos medir la dispersión?
1.- Rango.
2.- Varianza.
3.- Desviación típica.
4.- Coeficiente de variación.
5.- Cuasivarianza; cuasidesviación típica.
(Util para estimar la varianza poblacional)
2
s
s
1
1
1
2
2
k
i
i
k
i
i
n
n
x
x
s
24. 5. Medidas de forma.
N
n
x
x
m
k
i
i
r
i
r
1
Parámetros que permiten evaluar ciertas características del
diagrama de barras/histograma (simetría, apuntamiento).
Momento de orden r con respecto a la media:
25. Coeficiente de asimetría:
Un conjunto de datos es simétrico, si lo es su histograma/diagrama de barras
1 2 3 4 5 6 7
1 2 3 4 5 6 7
Simetría
Asimetría negativa (a la izqda.) Asimetría positiva (a la dcha.)
x
Mo
Mo
x
26. Coeficiente de asimetría:
Asimetría negativa (a la izqda.) Asimetría positiva (a la dcha.)
x
Mo
Mo
x
Mayor concentración de
datos a la izquierda
Mayor concentración de
datos a la derecha
27. Coeficiente de asimetría:
Coeficiente de asimetría de Fisher:
3
1
3
3
3
NS
n
x
x
S
m
A
k
i
i
i
F
CAP ó AF>0: Asimetría positiva (a la dcha.)
CAP ó AF=0: Simetría
CAP ó AF<0: Asimetría negativa (a la izqda.)
Coeficiente de asimetría de Pearson:
S
Mo
x
CAP
(sólo variables con distribución
acampanada) Mo: moda
(todo tipo de variables)
28. Coeficiente de apuntamiento o curtosis:
Previamente: curva normal N(µ,σ) o campana de Gauss
2
2
1
2
1
)
(
x
e
x
f
Una variable estadística es normal si el polígono de frecuencias
(utilizando %) se ajusta a esta curva.
29. Normal
Leptocúrtica: más apuntada g2>0
Mesocúrtica: normal g2=0
Platicúrtica: más aplanada g2<0
3
3 4
1
4
4
4
2
NS
n
x
x
S
m
g
k
i
i
i
Coeficiente de apuntamiento o curtosis:
30. Aceptamos que un conjunto de datos es
“aproximadamente normal”cuando los
coeficientes de asimetría y de curtosis
tipificadas están entre -2 y 2.
Ligeras correcciones de los coeficientes de asimetría y
curtosis dan lugar a los coeficientes de asimetría y
curtosis tipificadas (Statgraphics)
31. 6. Tipificación.
D
Dada una variable estadística X, la tipificación de esta variable es
otra nueva variable, Z, que se define como
S
x
X
Z
Características:
• La media de Z es 0; su desviación típica es 1.
• El valor de Z se puede entender como una medida de la variación relativa
que experimenta el valor X frente a su media.
• Es útil para comparar valores correspondientes a variables cuyas medias
y desviaciones típicas son diferentes.
32. EJEMPLO: Al terminar la carrera, un licenciado en psicología y otro
en económicas reciben sendas ofertas de trabajo, con sueldos
anuales de 18.000 y 24.000 €. La media de los sueldos de los recién
licenciados en psicología es de 16.000€, con una desviación típica de
850€. La media de los sueldos de los recién licenciados en
económicas es de 22.000€, con una desviación típica de 1.200€.
¿Cuál de los dos ha tenido una mejor oferta laboral, en relación a los
sueldos de su profesión?
33. EJEMPLO: Al terminar la carrera, un licenciado en psicología y otro
en económicas reciben sendas ofertas de trabajo, con sueldos
anuales de 18.000 y 24.000 €. La media de los sueldos de los recién
licenciados en psicología es de 16.000€, con una desviación típica de
850€. La media de los sueldos de los recién licenciados en
económicas es de 22.000€, con una desviación típica de 1.200€.
¿Cuál de los dos ha tenido una mejor oferta laboral, en relación a los
sueldos de su profesión?
Solución: Calculamos la variación relativa, en cada caso, con respecto a
la media (es decir, tipificamos):
Psicología: (18000-16000)/850=2’35
Económicas: (24000-22000)/1200=1’66
Por tanto, el sueldo ofrecido al psicólogo posee mayor variación
relativa; puesto que la variación es positiva, ello implica que el sueldo
es comparativamente mejor