SlideShare una empresa de Scribd logo
1 de 30
Tema 1: Introducción
1.1 Estadística Descriptiva
1. Conceptos generales.
2. Medidas de centralización.
3. Medidas de dispersión.
4. Medidas de posición.
5. Medidas de forma.
1. Conceptos generales.
Estadística (“Estado”): parte de las Matemáticas que
se encarga de RECOGER y ANALIZAR datos.
Muestreo
Diseño de experimentos
Estadística Descriptiva
Estadística Inferencial
Análisis Multivariante
Regresión
…
Muestra
POBLACION
Razones para tomar muestras: tiempo, dinero, accesibilidad, …
PARADOJICAMENTE, para conocer a la población no
hace falta estudiar a TODA la población…
EN DOS SEMANAS RECORTA 4 PUNTOS
El PP se sitúa a dos puntos del PSOE en intención de voto,
según una encuesta publicada en El País
El PP se encuentra a dos puntos del PSOE en intención directa de voto, según un sondeo del Instituto Opina
que publica este domingo el diario El País. Agrega el periódico que el PP ha logrado recortar en dos
semanas cuatro puntos en intención de voto respecto a los socialistas, quienes tenían un 44 por ciento de
intención de voto, frente al 38 por ciento del PP, según la anterior encuesta de Opina, publicada el 25 de
septiembre en ése mismo diario.
L D (Agencias) El sondeo publicado este domingo, hecho sobre una muestra de 1.300 entrevistas hechas desde el 4 al 6 de octubre en todo
el territorio español, desvela que el PP gana dos puntos y el PSOE los pierde, "con lo que la diferencia se reduce drásticamente y supone la
ventaja socialista más reducida desde las elecciones generales"..
Aunque los diarios La Vanguardia y El Periódico de Cataluña recogen otra encuesta que revela que el PSC y CiU mantienen un
empate técnico, aunque en los porcentajes de intención de voto el PSC continuaría por delante. En ambas encuestas, tanto el
presidente de la Generalidad, Pasqual Maragall, como el líder de la oposición, Artur Mas, mejoran sustancialmente su valoración
respecto a encuestas anteriores, aunque Maragall saca 19,3 puntos en la pugna por la presidencia de la Generalidad.
Así, la encuesta de La Vanguardia elaborada por el Instituto Noxa entre los días 3 y 6 de octubre a 1.000 entrevistados, otorga al
PSC 44 escaños y una intención de voto del 32,5 por ciento, mientras que CiU pasaría de los actuales 46 escaños a 43 y
mantendría una intención de voto del 29,2 por ciento. ERC mantendría su estatus de tercera fuerza política con 23 escaños, al igual
que el PP, aunque según la encuesta crece la intención de voto respecto a las elecciones de 2003 y alcanza el 12,7 por ciento. ICV-
EA también subiría y podría alcanzar los 10 escaños. Por su parte, la encuesta de El Periódico realizada durante los mismos días
por la empresa Gesop a 800 entrevistados sitúa a PSC y CiU con un voto estimado del 32 por ciento en ambos casos, aunque la
intención de voto directa otorga al PSC un 31,5 por ciento y a CiU un 22,3 por ciento.
VARIABLE
ESTADISTICA
Cuantitativas
Cualitativas
Discretas
Continuas
la cualidad que
deseamos estudiar
en la población
• Intención de voto.
• Número de hijos
• Longitud del ala de un pájaro
• Número de ejemplares de una especie en un continente.
• Tiempo de recuperación de un ecosistema.
• Número del despacho de distintos profesores.
• …….
La recogida de los datos se denomina muestreo. Tipos
de muestreo:
1.- Muestreo aleatorio simple
-Todos los individuos tienen a priori la misma probabi-
lidad de ser escogidos.
- La selección de la muestra se realiza AL AZAR
(para evitar sesgo)
2.- Muestreo estratificado
Se aplica cuando en la población se distinguen
estratos que son relevantes para el estudio. Se escogen
aleatoriamente individuos en cada estrato, proporcional-
mente al tamaño del estrato.
3.- Muestreo sistemático.
Se aplica cuando los individuos de la población apare-
cen ordenados en una lista, de modo que individuos
de características similares están próximos en ella.
Si se desea escoger a n individuos de una población
de tamaño N, se determina el nº k más próximo a N/n,
se escoge un individuo al azar de entre los k primeros,
y los demás se escogen de la lista a partir del anterior,
a intervalos regulares.
4.- Muestreo polietápico o por conglomerados.
Se divide previamente la población en unidades, siguien-
do un cierto criterio, y se seleccionan aleatoriamente al-
gunas de estas unidades. Sobre cada unidad, se realiza
algún muestreo de los tipos anteriores (por ejemplo,
para realizar un muestreo en una gran ciudad, se
subdivide primero por barrios…)
Una vez diseñada la muestra, recogemos los datos;
después, la información proporcionada por ellos debe
ORDENARSE
Tablas y gráficas estadísticas
(datos agrupados y no agrupados)
Ejemplo 1:
xi
ni ó %i
17 18 19 21 22
DIAGRAMA DE BARRAS
xi ni fi %i
17 2 0,1 10
18 10 0,5 50
19 4 0,2 20
21 3 0,15 15
22 1 0,05 5
20 1 100
TABLAS Y GRAFICAS ESTADISTICAS
xi ni fi %i
3.75-5.95 4,85 2 0,05 5
5.95-8.15 7,05 4 0,1 10
8.15-10.35 9,25 10 0,25 25
10.35-12.55 11,45 16 0,4 40
12.55-14.75 13,65 6 0,15 15
14.75-16.95 15,85 2 0,05 5
Total: 62,1 40 1 100
Ejemplo 2:
xi
ni ó %i
3.75 5.95 8.15 10.35….
HISTOGRAMA
10%
50%
20%
15%
5%
17
18
19
21
22
Ejemplo 1:
xi ni fi %i
17 2 0,1 10
18 10 0,5 50
19 4 0,2 20
21 3 0,15 15
22 1 0,05 5
20 1 100
DIAGRAMA DE SECTORES
2. Medidas de centralización.
1.- Media.
2.- Moda: el valor (unimodal) o valores (bimodal, etc.) con mayor
frecuencia.
3.- Mediana: el valor que deja la mitad de los datos por debajo,
una vez ordenados de menor a mayor. Estadístico ROBUSTO.
∑
∑
=
=
⋅
= k
i
i
k
i
ii
n
nx
x
1
1
3. Medidas de dispersión o variabilidad.
La DISPERSION (o variabilidad) de un conjunto de datos es una medida
de la distancia entre los datos, y su media.
Poca dispersión = Datos homogéneos = Media
muy representativa
Mucha dispersión = Datos heterogéneos =
Media poco representativa
Ejemplo: En una investigación sobre deficiencias medioambientales encon-
tradas en plantas industriales, se seleccionaron aleatoriamente 25 plantas
de dos comunidades diferentes. Se obtuvieron los siguientes datos sobre el
número de deficiencias encontradas:
Nº deficiencias com. A Frecuencia
1 1
2 3
3 5
4 7
5 5
6 3
7 1
Nº deficiencias com. B Frecuencia
1 6
2 4
3 2
4 1
5 2
6 4
7 6
La media es 4, en cada
comunidad; pero ¿en cuál
de ellas la variable es más
dispersa?
1 2 3 4 5 6 7
1 2 3 4 5 6 7
Nº deficiencias com. A Frecuencia
1 1
2 3
3 5
4 7
5 5
6 3
7 1
Nº deficiencias com. B Frecuencia
1 6
2 4
3 2
4 1
5 2
6 4
7 6
Ejemplo: En una investigación sobre deficiencias medioambientales encon-
tradas en plantas industriales, se seleccionaron aleatoriamente 25 plantas
de dos comunidades diferentes. Se obtuvieron los siguientes datos sobre el
número de deficiencias encontradas:
+ disp.
¿Cómo podemos medir la dispersión?
1.- Rango: dif. entre el mayor y el menor de los datos.
2.- Varianza:
3.- Desviación típica:
VS =
( )
∑
∑
=
=
⋅−
= k
i
i
k
i
i
n
nxx
S
1
1
2
2
Propiedades de la varianza y la desviación típica:
1.- La varianza no puede ser negativa.
2.- A igualdad de medias, cuanto mayor sea la dispersión, mayor es la
varianza (y la desv. típica).
3.- Si dos conjuntos de datos poseen medias similares, es más disperso
aquel que tenga mayor varianza (desv. típica).
4.- El recíproco no es necesariamente cierto, porque la varianza (desv. típica)
depende también del tamaño de los datos.
Coeficiente de variación (CV)
5.- Al menos el 100(1-1/k2
) de los datos está entre la media, y ±k veces la
desviación típica (por ejemplo, al menos el 75% de los datos está entre la
media y 2 veces la desv. típica).
¿Cómo podemos medir la dispersión?
1.- Rango.
2.- Varianza.
3.- Desviación típica.
4.- Coeficiente de variación:
A mayor CV, mayor dispersión, y viceversa.
x
S
CV =
5.- Cuasivarianza, cuasidesviación típica
( )
1
1
1
2
2
−
⋅−
=
∑
∑
=
=
k
i
i
k
i
i
n
nxx
s
2
ss =
(Util para estimar la varianza poblacional)
4. Medidas de posición.
50%
25%
q1
q3
M
75%
q1 : primer cuartil
M : mediana
q3: tercer cuartil
Diagrama de caja y bigotes + Datos atípicos: Statgraphics
10%
65%
89%
p10=d1 p65 p89
Deciles, percentiles
5. Medidas de forma.
( )
N
nxx
m
k
i
i
r
i
r
∑=
⋅−
= 1
Parámetros que permiten evaluar ciertas características del
diagrama de barras/histograma (simetría, apuntamiento).
Momento de orden r con respecto a la media:
Coeficiente de asimetría:
Un conjunto de datos es simétrico, si lo es su histograma/diagrama de barras
1 2 3 4 5 6 7
1 2 3 4 5 6 7
Simetría
Asimetría negativa (a la izqda.) Asimetría positiva (a la dcha.)
x x
Coeficiente de asimetría:
Coeficiente de asimetría de Fisher:
( )
3
1
3
3
3
NS
nxx
S
m
A
k
i
ii
F
∑=
⋅−
==
AF>0: Asimetría positiva (a la dcha.)
AF=0: Simetría
AF<0: Asimetría negativa (a la izqda.)
Coeficiente de apuntamiento o curtosis:
Previamente: curva normal N(µ,σ) o campana de Gauss
2
2
1
2
1
)(





 −
−
⋅= σ
µ
πσ
x
exf
Un conjunto de datos es normal si su polígono de frecuencias se ajusta
a esta curva.
Normal
Leptocúrtica: más apuntada g2>0
Mesocúrtica: normal g2=0
Platicúrtica: más aplanada g2<0
( )
33 4
1
4
4
4
2 −
⋅−
=−=
∑=
NS
nxx
S
m
g
k
i
ii
Coeficiente de apuntamiento o curtosis:
Aceptamos que un conjunto de datos es
“aproximadamente normal”cuando los
coeficientes de asimetría y de curtosis
tipificados están entre -2 y 2.

Más contenido relacionado

La actualidad más candente

Conclusiones de unidad 2 organización de los datos
Conclusiones de unidad 2 organización de los datosConclusiones de unidad 2 organización de los datos
Conclusiones de unidad 2 organización de los datosJohanna Garcia
 
Instrumentos y Técnicas de Recolección de Datos
Instrumentos y Técnicas de Recolección de DatosInstrumentos y Técnicas de Recolección de Datos
Instrumentos y Técnicas de Recolección de DatosRedsop Sociales-Políticos
 
Aspectos básicos de estadística
Aspectos básicos de estadísticaAspectos básicos de estadística
Aspectos básicos de estadísticaStoka Nekus
 
Estadística inferencial. sociodemografia (1)
Estadística inferencial. sociodemografia (1)Estadística inferencial. sociodemografia (1)
Estadística inferencial. sociodemografia (1)Kalitokaiba7
 
Estadística inferencial, conceptos basicos
Estadística inferencial, conceptos basicosEstadística inferencial, conceptos basicos
Estadística inferencial, conceptos basicosCristina Rios
 
Estadística inferencial. sociodemografia
Estadística inferencial. sociodemografiaEstadística inferencial. sociodemografia
Estadística inferencial. sociodemografiaRichard Gonzalez
 
Tema 1.1 introudcción a la estadística
Tema 1.1 introudcción a la estadísticaTema 1.1 introudcción a la estadística
Tema 1.1 introudcción a la estadísticaanthonymaule
 
Estadistica inferencial
Estadistica inferencialEstadistica inferencial
Estadistica inferencialRobert Amaro
 
EstadíStica Inferencial Pao
EstadíStica Inferencial PaoEstadíStica Inferencial Pao
EstadíStica Inferencial PaoPaola Torres
 
Estadistica inferencial, matematica
Estadistica inferencial, matematicaEstadistica inferencial, matematica
Estadistica inferencial, matematicaemelyreina
 
Conceptos basicos de estadistica
Conceptos basicos de estadisticaConceptos basicos de estadistica
Conceptos basicos de estadisticaJuci Méndez
 
Guia del curso estadistica
Guia del curso  estadisticaGuia del curso  estadistica
Guia del curso estadisticaEdith Llanos
 
Presentacion estadistica descriptiva
Presentacion estadistica descriptivaPresentacion estadistica descriptiva
Presentacion estadistica descriptivabetis081281
 

La actualidad más candente (20)

Muestreo
MuestreoMuestreo
Muestreo
 
Trabajo dany
 Trabajo dany Trabajo dany
Trabajo dany
 
Conclusiones de unidad 2 organización de los datos
Conclusiones de unidad 2 organización de los datosConclusiones de unidad 2 organización de los datos
Conclusiones de unidad 2 organización de los datos
 
Mapas Estadistica A
Mapas Estadistica AMapas Estadistica A
Mapas Estadistica A
 
Instrumentos y Técnicas de Recolección de Datos
Instrumentos y Técnicas de Recolección de DatosInstrumentos y Técnicas de Recolección de Datos
Instrumentos y Técnicas de Recolección de Datos
 
Py e t1
Py e t1Py e t1
Py e t1
 
Aspectos básicos de estadística
Aspectos básicos de estadísticaAspectos básicos de estadística
Aspectos básicos de estadística
 
Datos Organizados
Datos OrganizadosDatos Organizados
Datos Organizados
 
Estadística inferencial. sociodemografia (1)
Estadística inferencial. sociodemografia (1)Estadística inferencial. sociodemografia (1)
Estadística inferencial. sociodemografia (1)
 
Estadística inferencial, conceptos basicos
Estadística inferencial, conceptos basicosEstadística inferencial, conceptos basicos
Estadística inferencial, conceptos basicos
 
Estadística inferencial. sociodemografia
Estadística inferencial. sociodemografiaEstadística inferencial. sociodemografia
Estadística inferencial. sociodemografia
 
estadistica inferencial
estadistica inferencialestadistica inferencial
estadistica inferencial
 
Tema 1.1 introudcción a la estadística
Tema 1.1 introudcción a la estadísticaTema 1.1 introudcción a la estadística
Tema 1.1 introudcción a la estadística
 
Estadística 1
Estadística                                                         1Estadística                                                         1
Estadística 1
 
Estadistica inferencial
Estadistica inferencialEstadistica inferencial
Estadistica inferencial
 
EstadíStica Inferencial Pao
EstadíStica Inferencial PaoEstadíStica Inferencial Pao
EstadíStica Inferencial Pao
 
Estadistica inferencial, matematica
Estadistica inferencial, matematicaEstadistica inferencial, matematica
Estadistica inferencial, matematica
 
Conceptos basicos de estadistica
Conceptos basicos de estadisticaConceptos basicos de estadistica
Conceptos basicos de estadistica
 
Guia del curso estadistica
Guia del curso  estadisticaGuia del curso  estadistica
Guia del curso estadistica
 
Presentacion estadistica descriptiva
Presentacion estadistica descriptivaPresentacion estadistica descriptiva
Presentacion estadistica descriptiva
 

Destacado

Ejercicios de estadística resueltos paso a paso | Seminario 5
Ejercicios de estadística resueltos paso a paso | Seminario 5Ejercicios de estadística resueltos paso a paso | Seminario 5
Ejercicios de estadística resueltos paso a paso | Seminario 5Carmen Barrera
 
La psicologia y la estadistica descriptiva
La psicologia y la estadistica descriptivaLa psicologia y la estadistica descriptiva
La psicologia y la estadistica descriptivajavalencia
 
Estadistica Aplicada A La Salud
Estadistica Aplicada A La SaludEstadistica Aplicada A La Salud
Estadistica Aplicada A La SaludGrupo Educandos
 
Ejercicios de distribución normal estándar y área bajo la curva (5)
Ejercicios de distribución normal estándar y área bajo la curva (5)Ejercicios de distribución normal estándar y área bajo la curva (5)
Ejercicios de distribución normal estándar y área bajo la curva (5)Luz Hernández
 
50 ejercicio de estadistica.docx1
50 ejercicio de estadistica.docx150 ejercicio de estadistica.docx1
50 ejercicio de estadistica.docx1Juan Zaruma
 
50 ejercicios estadistica
50 ejercicios estadistica50 ejercicios estadistica
50 ejercicios estadisticaPAHOLA24
 
100 ejercicios de estadistica resueltos
100 ejercicios de estadistica resueltos100 ejercicios de estadistica resueltos
100 ejercicios de estadistica resueltosLuis Elias
 
Problemas solucionados de estadística descriptiva
Problemas solucionados de estadística descriptivaProblemas solucionados de estadística descriptiva
Problemas solucionados de estadística descriptivaYohana Bonilla Gutiérrez
 

Destacado (12)

Test de descriptiva
Test de descriptivaTest de descriptiva
Test de descriptiva
 
Ejercicios de descriptiva
Ejercicios de descriptivaEjercicios de descriptiva
Ejercicios de descriptiva
 
Ejercicios de estadística resueltos paso a paso | Seminario 5
Ejercicios de estadística resueltos paso a paso | Seminario 5Ejercicios de estadística resueltos paso a paso | Seminario 5
Ejercicios de estadística resueltos paso a paso | Seminario 5
 
La psicologia y la estadistica descriptiva
La psicologia y la estadistica descriptivaLa psicologia y la estadistica descriptiva
La psicologia y la estadistica descriptiva
 
Estadistica Aplicada A La Salud
Estadistica Aplicada A La SaludEstadistica Aplicada A La Salud
Estadistica Aplicada A La Salud
 
Ejercicios de distribución normal estándar y área bajo la curva (5)
Ejercicios de distribución normal estándar y área bajo la curva (5)Ejercicios de distribución normal estándar y área bajo la curva (5)
Ejercicios de distribución normal estándar y área bajo la curva (5)
 
Bioestadística para enfermeros, generalidades
Bioestadística para enfermeros, generalidadesBioestadística para enfermeros, generalidades
Bioestadística para enfermeros, generalidades
 
50 ejercicio de estadistica.docx1
50 ejercicio de estadistica.docx150 ejercicio de estadistica.docx1
50 ejercicio de estadistica.docx1
 
50 ejercicios estadistica
50 ejercicios estadistica50 ejercicios estadistica
50 ejercicios estadistica
 
100 ejercicios de estadistica resueltos
100 ejercicios de estadistica resueltos100 ejercicios de estadistica resueltos
100 ejercicios de estadistica resueltos
 
Problemas solucionados de estadística descriptiva
Problemas solucionados de estadística descriptivaProblemas solucionados de estadística descriptiva
Problemas solucionados de estadística descriptiva
 
Ejercicios resueltos-de-estadistica
Ejercicios resueltos-de-estadisticaEjercicios resueltos-de-estadistica
Ejercicios resueltos-de-estadistica
 

Similar a Tema1

La estadística descriptiva resume la información conteni- da en los datos re...
La estadística descriptiva  resume la información conteni- da en los datos re...La estadística descriptiva  resume la información conteni- da en los datos re...
La estadística descriptiva resume la información conteni- da en los datos re...LuisLobatoingaruca
 
UNI1 - INTRODUCCIÓN A LA ESTADÍSTICA.pdf
UNI1 - INTRODUCCIÓN A LA ESTADÍSTICA.pdfUNI1 - INTRODUCCIÓN A LA ESTADÍSTICA.pdf
UNI1 - INTRODUCCIÓN A LA ESTADÍSTICA.pdfAli Al-Saachez
 
1.2 Recurso Muestreo Unidad 1, Tron y Mendoza
1.2 Recurso Muestreo Unidad 1, Tron y Mendoza1.2 Recurso Muestreo Unidad 1, Tron y Mendoza
1.2 Recurso Muestreo Unidad 1, Tron y MendozaEstadisticosProcesos
 
Distribución normal
Distribución normalDistribución normal
Distribución normalchillemi
 
Blog estadistica
Blog estadisticaBlog estadistica
Blog estadisticaCamii Ortiz
 
EXPO 2- Describir vs. Inferir
EXPO 2- Describir vs. InferirEXPO 2- Describir vs. Inferir
EXPO 2- Describir vs. InferirZoraida Pérez S.
 
Distribución normal estadistica aplicada
Distribución normal estadistica aplicadaDistribución normal estadistica aplicada
Distribución normal estadistica aplicadayodia45
 
Distribución normal estadistica aplicada
Distribución normal estadistica aplicadaDistribución normal estadistica aplicada
Distribución normal estadistica aplicadayodia45
 
Muestreo o analisis muestral
Muestreo o analisis muestralMuestreo o analisis muestral
Muestreo o analisis muestralJhosselynVera
 
Analisis de datos exploratorios julio 15
Analisis de datos exploratorios julio 15Analisis de datos exploratorios julio 15
Analisis de datos exploratorios julio 15Elfego Lopez
 
Recoleccion de datos
Recoleccion de datosRecoleccion de datos
Recoleccion de datosTensor
 
Nociones de estadísticapoblacon muestreo etc etc
Nociones de estadísticapoblacon muestreo etc etcNociones de estadísticapoblacon muestreo etc etc
Nociones de estadísticapoblacon muestreo etc etcKatsuya Hathaway
 
distribuciones fundamentales de muestreo.pptx
distribuciones fundamentales de muestreo.pptxdistribuciones fundamentales de muestreo.pptx
distribuciones fundamentales de muestreo.pptxAlexAndrade396300
 
Muestreo Probabilístico y sus Métodos
Muestreo Probabilístico y sus MétodosMuestreo Probabilístico y sus Métodos
Muestreo Probabilístico y sus MétodosJesús Gómez Ávila
 
estadsticainferencial-090519154537-phpapp01.ppt
estadsticainferencial-090519154537-phpapp01.pptestadsticainferencial-090519154537-phpapp01.ppt
estadsticainferencial-090519154537-phpapp01.pptnaruteroz
 

Similar a Tema1 (20)

La estadística descriptiva resume la información conteni- da en los datos re...
La estadística descriptiva  resume la información conteni- da en los datos re...La estadística descriptiva  resume la información conteni- da en los datos re...
La estadística descriptiva resume la información conteni- da en los datos re...
 
Tema 1 (1).ppt
Tema 1 (1).pptTema 1 (1).ppt
Tema 1 (1).ppt
 
Tema 1.ppt
Tema 1.pptTema 1.ppt
Tema 1.ppt
 
Diapositivas
DiapositivasDiapositivas
Diapositivas
 
VED. TEMA 3 (1).docx
VED. TEMA 3 (1).docxVED. TEMA 3 (1).docx
VED. TEMA 3 (1).docx
 
UNI1 - INTRODUCCIÓN A LA ESTADÍSTICA.pdf
UNI1 - INTRODUCCIÓN A LA ESTADÍSTICA.pdfUNI1 - INTRODUCCIÓN A LA ESTADÍSTICA.pdf
UNI1 - INTRODUCCIÓN A LA ESTADÍSTICA.pdf
 
1.2 Recurso Muestreo Unidad 1, Tron y Mendoza
1.2 Recurso Muestreo Unidad 1, Tron y Mendoza1.2 Recurso Muestreo Unidad 1, Tron y Mendoza
1.2 Recurso Muestreo Unidad 1, Tron y Mendoza
 
Distribución normal
Distribución normalDistribución normal
Distribución normal
 
Blog estadistica
Blog estadisticaBlog estadistica
Blog estadistica
 
Estadistica
EstadisticaEstadistica
Estadistica
 
EXPO 2- Describir vs. Inferir
EXPO 2- Describir vs. InferirEXPO 2- Describir vs. Inferir
EXPO 2- Describir vs. Inferir
 
Distribución normal estadistica aplicada
Distribución normal estadistica aplicadaDistribución normal estadistica aplicada
Distribución normal estadistica aplicada
 
Distribución normal estadistica aplicada
Distribución normal estadistica aplicadaDistribución normal estadistica aplicada
Distribución normal estadistica aplicada
 
Muestreo o analisis muestral
Muestreo o analisis muestralMuestreo o analisis muestral
Muestreo o analisis muestral
 
Analisis de datos exploratorios julio 15
Analisis de datos exploratorios julio 15Analisis de datos exploratorios julio 15
Analisis de datos exploratorios julio 15
 
Recoleccion de datos
Recoleccion de datosRecoleccion de datos
Recoleccion de datos
 
Nociones de estadísticapoblacon muestreo etc etc
Nociones de estadísticapoblacon muestreo etc etcNociones de estadísticapoblacon muestreo etc etc
Nociones de estadísticapoblacon muestreo etc etc
 
distribuciones fundamentales de muestreo.pptx
distribuciones fundamentales de muestreo.pptxdistribuciones fundamentales de muestreo.pptx
distribuciones fundamentales de muestreo.pptx
 
Muestreo Probabilístico y sus Métodos
Muestreo Probabilístico y sus MétodosMuestreo Probabilístico y sus Métodos
Muestreo Probabilístico y sus Métodos
 
estadsticainferencial-090519154537-phpapp01.ppt
estadsticainferencial-090519154537-phpapp01.pptestadsticainferencial-090519154537-phpapp01.ppt
estadsticainferencial-090519154537-phpapp01.ppt
 

Tema1

  • 3. 1. Conceptos generales. 2. Medidas de centralización. 3. Medidas de dispersión. 4. Medidas de posición. 5. Medidas de forma.
  • 4. 1. Conceptos generales. Estadística (“Estado”): parte de las Matemáticas que se encarga de RECOGER y ANALIZAR datos. Muestreo Diseño de experimentos Estadística Descriptiva Estadística Inferencial Análisis Multivariante Regresión …
  • 5. Muestra POBLACION Razones para tomar muestras: tiempo, dinero, accesibilidad, … PARADOJICAMENTE, para conocer a la población no hace falta estudiar a TODA la población…
  • 6. EN DOS SEMANAS RECORTA 4 PUNTOS El PP se sitúa a dos puntos del PSOE en intención de voto, según una encuesta publicada en El País El PP se encuentra a dos puntos del PSOE en intención directa de voto, según un sondeo del Instituto Opina que publica este domingo el diario El País. Agrega el periódico que el PP ha logrado recortar en dos semanas cuatro puntos en intención de voto respecto a los socialistas, quienes tenían un 44 por ciento de intención de voto, frente al 38 por ciento del PP, según la anterior encuesta de Opina, publicada el 25 de septiembre en ése mismo diario. L D (Agencias) El sondeo publicado este domingo, hecho sobre una muestra de 1.300 entrevistas hechas desde el 4 al 6 de octubre en todo el territorio español, desvela que el PP gana dos puntos y el PSOE los pierde, "con lo que la diferencia se reduce drásticamente y supone la ventaja socialista más reducida desde las elecciones generales".. Aunque los diarios La Vanguardia y El Periódico de Cataluña recogen otra encuesta que revela que el PSC y CiU mantienen un empate técnico, aunque en los porcentajes de intención de voto el PSC continuaría por delante. En ambas encuestas, tanto el presidente de la Generalidad, Pasqual Maragall, como el líder de la oposición, Artur Mas, mejoran sustancialmente su valoración respecto a encuestas anteriores, aunque Maragall saca 19,3 puntos en la pugna por la presidencia de la Generalidad. Así, la encuesta de La Vanguardia elaborada por el Instituto Noxa entre los días 3 y 6 de octubre a 1.000 entrevistados, otorga al PSC 44 escaños y una intención de voto del 32,5 por ciento, mientras que CiU pasaría de los actuales 46 escaños a 43 y mantendría una intención de voto del 29,2 por ciento. ERC mantendría su estatus de tercera fuerza política con 23 escaños, al igual que el PP, aunque según la encuesta crece la intención de voto respecto a las elecciones de 2003 y alcanza el 12,7 por ciento. ICV- EA también subiría y podría alcanzar los 10 escaños. Por su parte, la encuesta de El Periódico realizada durante los mismos días por la empresa Gesop a 800 entrevistados sitúa a PSC y CiU con un voto estimado del 32 por ciento en ambos casos, aunque la intención de voto directa otorga al PSC un 31,5 por ciento y a CiU un 22,3 por ciento.
  • 8. • Intención de voto. • Número de hijos • Longitud del ala de un pájaro • Número de ejemplares de una especie en un continente. • Tiempo de recuperación de un ecosistema. • Número del despacho de distintos profesores. • …….
  • 9. La recogida de los datos se denomina muestreo. Tipos de muestreo: 1.- Muestreo aleatorio simple -Todos los individuos tienen a priori la misma probabi- lidad de ser escogidos. - La selección de la muestra se realiza AL AZAR (para evitar sesgo) 2.- Muestreo estratificado Se aplica cuando en la población se distinguen estratos que son relevantes para el estudio. Se escogen aleatoriamente individuos en cada estrato, proporcional- mente al tamaño del estrato.
  • 10. 3.- Muestreo sistemático. Se aplica cuando los individuos de la población apare- cen ordenados en una lista, de modo que individuos de características similares están próximos en ella. Si se desea escoger a n individuos de una población de tamaño N, se determina el nº k más próximo a N/n, se escoge un individuo al azar de entre los k primeros, y los demás se escogen de la lista a partir del anterior, a intervalos regulares.
  • 11. 4.- Muestreo polietápico o por conglomerados. Se divide previamente la población en unidades, siguien- do un cierto criterio, y se seleccionan aleatoriamente al- gunas de estas unidades. Sobre cada unidad, se realiza algún muestreo de los tipos anteriores (por ejemplo, para realizar un muestreo en una gran ciudad, se subdivide primero por barrios…)
  • 12. Una vez diseñada la muestra, recogemos los datos; después, la información proporcionada por ellos debe ORDENARSE Tablas y gráficas estadísticas (datos agrupados y no agrupados)
  • 13. Ejemplo 1: xi ni ó %i 17 18 19 21 22 DIAGRAMA DE BARRAS xi ni fi %i 17 2 0,1 10 18 10 0,5 50 19 4 0,2 20 21 3 0,15 15 22 1 0,05 5 20 1 100 TABLAS Y GRAFICAS ESTADISTICAS
  • 14. xi ni fi %i 3.75-5.95 4,85 2 0,05 5 5.95-8.15 7,05 4 0,1 10 8.15-10.35 9,25 10 0,25 25 10.35-12.55 11,45 16 0,4 40 12.55-14.75 13,65 6 0,15 15 14.75-16.95 15,85 2 0,05 5 Total: 62,1 40 1 100 Ejemplo 2: xi ni ó %i 3.75 5.95 8.15 10.35…. HISTOGRAMA
  • 15. 10% 50% 20% 15% 5% 17 18 19 21 22 Ejemplo 1: xi ni fi %i 17 2 0,1 10 18 10 0,5 50 19 4 0,2 20 21 3 0,15 15 22 1 0,05 5 20 1 100 DIAGRAMA DE SECTORES
  • 16. 2. Medidas de centralización. 1.- Media. 2.- Moda: el valor (unimodal) o valores (bimodal, etc.) con mayor frecuencia. 3.- Mediana: el valor que deja la mitad de los datos por debajo, una vez ordenados de menor a mayor. Estadístico ROBUSTO. ∑ ∑ = = ⋅ = k i i k i ii n nx x 1 1
  • 17. 3. Medidas de dispersión o variabilidad. La DISPERSION (o variabilidad) de un conjunto de datos es una medida de la distancia entre los datos, y su media. Poca dispersión = Datos homogéneos = Media muy representativa Mucha dispersión = Datos heterogéneos = Media poco representativa
  • 18. Ejemplo: En una investigación sobre deficiencias medioambientales encon- tradas en plantas industriales, se seleccionaron aleatoriamente 25 plantas de dos comunidades diferentes. Se obtuvieron los siguientes datos sobre el número de deficiencias encontradas: Nº deficiencias com. A Frecuencia 1 1 2 3 3 5 4 7 5 5 6 3 7 1 Nº deficiencias com. B Frecuencia 1 6 2 4 3 2 4 1 5 2 6 4 7 6 La media es 4, en cada comunidad; pero ¿en cuál de ellas la variable es más dispersa?
  • 19. 1 2 3 4 5 6 7 1 2 3 4 5 6 7 Nº deficiencias com. A Frecuencia 1 1 2 3 3 5 4 7 5 5 6 3 7 1 Nº deficiencias com. B Frecuencia 1 6 2 4 3 2 4 1 5 2 6 4 7 6 Ejemplo: En una investigación sobre deficiencias medioambientales encon- tradas en plantas industriales, se seleccionaron aleatoriamente 25 plantas de dos comunidades diferentes. Se obtuvieron los siguientes datos sobre el número de deficiencias encontradas: + disp.
  • 20. ¿Cómo podemos medir la dispersión? 1.- Rango: dif. entre el mayor y el menor de los datos. 2.- Varianza: 3.- Desviación típica: VS = ( ) ∑ ∑ = = ⋅− = k i i k i i n nxx S 1 1 2 2
  • 21. Propiedades de la varianza y la desviación típica: 1.- La varianza no puede ser negativa. 2.- A igualdad de medias, cuanto mayor sea la dispersión, mayor es la varianza (y la desv. típica). 3.- Si dos conjuntos de datos poseen medias similares, es más disperso aquel que tenga mayor varianza (desv. típica). 4.- El recíproco no es necesariamente cierto, porque la varianza (desv. típica) depende también del tamaño de los datos. Coeficiente de variación (CV) 5.- Al menos el 100(1-1/k2 ) de los datos está entre la media, y ±k veces la desviación típica (por ejemplo, al menos el 75% de los datos está entre la media y 2 veces la desv. típica).
  • 22. ¿Cómo podemos medir la dispersión? 1.- Rango. 2.- Varianza. 3.- Desviación típica. 4.- Coeficiente de variación: A mayor CV, mayor dispersión, y viceversa. x S CV = 5.- Cuasivarianza, cuasidesviación típica ( ) 1 1 1 2 2 − ⋅− = ∑ ∑ = = k i i k i i n nxx s 2 ss = (Util para estimar la varianza poblacional)
  • 23. 4. Medidas de posición. 50% 25% q1 q3 M 75% q1 : primer cuartil M : mediana q3: tercer cuartil Diagrama de caja y bigotes + Datos atípicos: Statgraphics
  • 25. 5. Medidas de forma. ( ) N nxx m k i i r i r ∑= ⋅− = 1 Parámetros que permiten evaluar ciertas características del diagrama de barras/histograma (simetría, apuntamiento). Momento de orden r con respecto a la media:
  • 26. Coeficiente de asimetría: Un conjunto de datos es simétrico, si lo es su histograma/diagrama de barras 1 2 3 4 5 6 7 1 2 3 4 5 6 7 Simetría Asimetría negativa (a la izqda.) Asimetría positiva (a la dcha.) x x
  • 27. Coeficiente de asimetría: Coeficiente de asimetría de Fisher: ( ) 3 1 3 3 3 NS nxx S m A k i ii F ∑= ⋅− == AF>0: Asimetría positiva (a la dcha.) AF=0: Simetría AF<0: Asimetría negativa (a la izqda.)
  • 28. Coeficiente de apuntamiento o curtosis: Previamente: curva normal N(µ,σ) o campana de Gauss 2 2 1 2 1 )(       − − ⋅= σ µ πσ x exf Un conjunto de datos es normal si su polígono de frecuencias se ajusta a esta curva.
  • 29. Normal Leptocúrtica: más apuntada g2>0 Mesocúrtica: normal g2=0 Platicúrtica: más aplanada g2<0 ( ) 33 4 1 4 4 4 2 − ⋅− =−= ∑= NS nxx S m g k i ii Coeficiente de apuntamiento o curtosis:
  • 30. Aceptamos que un conjunto de datos es “aproximadamente normal”cuando los coeficientes de asimetría y de curtosis tipificados están entre -2 y 2.