SlideShare una empresa de Scribd logo
1 de 27
TEMA 1
DESCRIPCIÓN DE DATOS:
ESTADÍSTICA DESCRIPTIVA
1.1 Introducción: conceptos básicos
1.2 Tablas estadísticas y representaciones
gráficas
1.3 Características de variables estadísticas
unidimensionales
1.3.1 Características de posición
1.3.2 Características de dispersión
1.3.3 Características de forma
1.4 Análisis exploratorio de datos:
gráfico de caja
* Estadística descriptiva: parte de la
estadística que se ocupa de las etapas 2 y 3
 ESTADÍSTICA: “Estudio de los métodos de recogida
y descripción de datos, así como del análisis de esta
información”
 Población: “Conjunto de elementos a los que se les
estudia una característica”
 Individuo: “Cada uno de los elementos de la población”
 Muestra: “Subconjunto representativo de la población”
 1.1. Introducción : conceptos básicos
 Etapas de un estudio estadístico
 Individuo, Población, Muestra
1 Recogida de datos
2 Ordenación, tabulación y gráficos*
3 Descripción de características*
4 Análisis formal
 Variable estadística (v.e.): ”Característica propia
del individuo objeto del estudio estadístico”
 Modalidad: “Cada una de las posibilidades o
estados diferentes de una variable estadística”
 Exhaustivas e incompatibles
 Variables estadísticas. Modalidades
Ejemplos:
- Estatura
- Salario
- Color del pelo
- Nivel de colesterol
- Nº de hijos de una familia
Ejemplo:
color del pelo:
- castaño
- rubio
- negro
 Cualitativas: Las características no son cuantificables
 Cuantitativas: Características cuantificables o numéricas
 Discretas: Numéricas numerables
 Continuas: Numéricas no numerables
 Tipos de variables estadísticas
Ejemplos:
Grupo sanguineo
Profesión
Color del pelo
Ejemplos:
Nº de hijos de una familia
Nº de nidos de procesionarias por árbol
Nº de virus en un cultivo
Ejemplos:
Estatura
Salario
Nivel de colesterol
 Frecuencias
♦
♦
♦
♦
1 2
1 2
Absolutas, (nº individuos modalidad i)
Absolutas acumuladas, ...
Relativas, (proporcion indiv. modalidad i)
Relativas acumuladas, ...
i
i i
i i
i i
n
N n n n
f n n
F f f f
= + + +
=
= + + +
Absolutas, ni
Relativas
fi = ni / n
Relativas
acumuladas
Fi = Ni / n
Absolutas
acumuladas, Ni
 Variables discretas
xi ni Ni fi Fi
x1
...
xi
...
xk
n1
...
ni
...
nk
N1
...
Ni
...
Nk
f1
...
fi
...
fk
F1
...
Fi
...
Fk
n 1
 1.2. Tablas estadísticas y representaciones
gráficas
 Variables continuas: Intervalos
Intervalo Ii xi ni Ni fi Fi
e0 – e1
...
ei-1 – ei
...
ek-1 – ek
x1
...
xi
...
xk
n1
...
ni
...
nk
N1
...
Ni
...
Nk
f1
...
fi
...
fk
F1
...
Fi
...
Fk
n 1
 Marca de clase xi (punto medio de cada intervalo)
 Amplitud ai (distancia entre los extremos)
 Intervalos cerrados por un extremo y abiertos por otro
 V. E. Cualitativas: Gráfico rectangular
20
10
Negro Gris Blanco Rojo Violeta
 Gráficos estadísticos
Color Plumaje Nº de Aves (ni)
Negro 10
Gris 14
Blanco 20
Rojo 6
Violeta 4
54
 V. E. Cualitativas: Gráfico de sectores
rojo
violeta
negro
grisblanco
Color
Plumaje
Nº de Aves
ni
fi
Grados
Negro 10 0,185 66,6
Gris 14 0,259 93,24
Blanco 20 0,37 133,2
Rojo 6 0,111 39,96
Violeta 4 0,074 26,64
54
Grados de un sector = 3600
x fi
0
5
10
15
20
25
30
35
2 3 4 5 6
 V. E. Discretas: Gráfico de barras
Nº de crías Nº animales: ni fi Fi
2 20 0.20 0.20
3 30 0.30 0.50
4 25 0.25 0.75
5 15 0.15 0.90
6 10 0.10 1
n = 100
Estatura ni hi = ni / ai
140–160 30 1.5
160–170 22 2.2
170–180 20 2
180–190 18 1.8
190–200 10 1
100
 V. E. Continuas: Histograma
 El área de
cada rectángulo
es proporcional
a la frecuencia”
1
1,5
1,8
140 160 170 180 200
hi
190
2.2
2
1
1
k
i ik
i
i i
i
n x
f x
n
x =
=
= =
∑
∑
 1.3. Características de variables
estadísticas unidimensionales
 1.3.1 Características de Posición
 Media aritmética
Estatura Nº Personas
ni
M. Clase
xi ni xi
140–150 20 145 2900
150–160 100 155 15500
160–180 80 170 13600
180–200 10 190 1900
n = 210 33900
339001 161.42
210
:
k
i i
i
n x
Media
n
x = == =
∑
175
224
453
362
341
nixi♦ Ejemplo
 Datos en tabla
 Datos en serie
2, 2, 3, 3, 3, 3, 5, 6, 7 Mo = 3
Mo = 3
 Valor de la variable más frecuente
 Puede haber más de una moda → Plurimodal
 Moda
 Variables discretas
( ) ( )
1
1 1
1
i
i i
i i
i i i
h h
Mo e a
h h h h
−
−
− +
−
= +
− + −
xi ni hi = ni / ai
140–160 30 1.5
160–170 22 2,2
170–180 20 2
180–190 18 1,8
190–200 10 1
100
 Variables continuas
♦ Ejemplo
 Observaciones:
1. Puede utilizarse la frecuencia relativa
2. Si las amplitudes son iguales, la moda se puede
obtener directamente con las frecuencias
( )
( ) ( )
2.2 1.5
160 10 167.777
2.2 1.5 2.2 2
Mo ×
−
= + =
− + −
 Valor de la variable que ocupa el lugar central en una
serie de datos ordenados.
 El 50% de los elementos de la población tienen un valor
de la variable menor o igual que la mediana. El 50% de los
elementos de la población tienen un valor de la variable
mayor o igualque la mediana.
 Nº par de observaciones: 3, 4, 6, 6, 6, 7, 8, 8, 9, 9
→ Me = 6 – 7 Indeterminada entre 6 y 7
 Mediana
 Variables discretas
 Datos en serie
xi ni Ni fi Fi
2 3 3 0,333 0,333
3 1 4 0,111 0,444
5 1 5 0,111 0,555
6 1 6 0,111 0,666
7 2 8 0,222 0,888
8 1 9 0,111 0,999
9 1
xi ni Ni fi Fi
3 1 1 0,1 0,1
4 1 2 0,1 0,2
6 3 5 0,3 0,5
7 1 6 0,1 0,6
8 2 8 0,2 0,8
9 2 10 0,2 1
10 1
 Nº impar de observaciones:
2, 2, 2, 3, 5, 6, 7, 7, 8 → Me = 5
 Datos en tabla
 Variables discretas
n/2 = 14
Fi = 0,5
Me = 2
♦ Ejemplo
284
3
2
1
0
xi
28
3
5
10
6
4
ni
1
0.892
0.714
0.357
0.142
Fi
1
0.107
0.178
0.357
0.214
0.142
fi
25
20
10
4
Ni
 Observación: Si n/2 coincide con un Ni
la mediana está indeterminada entre xi y xi+1
1
1
1 1
50
0,5 100
i
i
i i i i
i i
n N
F
Me e a e a
f n
−
−
− −
−
−
= + = +
0.5 0.45
160 10 160 2 162
0.25
Me ×
−
= + = + =
n/2 = 50
Fi = 0,5
 Variables continuas
♦ Ejemplo
 Observación: Si n/2 coincide con un Ni
la mediana es el extremo superior del intervalo que le
corresponde
1
0.90
0.70
0.45
0.15
Fi
0.10
0.20
0.25
0.30
0.15
fi
100
90
70
45
15
Ni
100
10180–200
20170–180
25160–170
30150–160
15140–150
ni
Estatura
 Definición: Pk , k: 1,2,...,99, “percentil k”, valor de la
variable que deja por debajo, el k% de los valores de la
variable
Q1 = P25 → Cuartil 1º
Q2 = P50 → Cuartil 2º = Me
Q3 = P75 → Cuartil 3º
D1 = P10 → Decil 1º
D2 = P20 → Decil 2º
….
D9 = P90 → Decil 9º
 Percentiles
1 1
1 1
100 100
i i
k i i i i
i i
k k
F n N
P e a e a
f n
− −
− −
− −
= + = +
 Cálculo para v.e. continuas:
 Cálculo para v.e. discretas:
Igual que la mediana, cambiando:
50
100 100
k
n por n
xi
ni Ni
2 20 20
3 30 50
4 44 94
5 20 114
6 10 124
124
Percentil 40, P40 = 3 Percentil 95, P95 = 6
nk /100 =
124x25/100 = 31
nk /100 =
124x50/100 = 62
nk /100 =
124x75/100 = 93
♦ Ejemplos percentiles v.e. discreta
Percentil 50, P50 = 4 = Me = Q2
Percentil 25, P25 = 3 = Q1
Percentil 75, P75 = 4 = Q3
40
124 49,6
100 100
k
n = =
95
124 117,8
100 100
k
n = =
1 1
1 1
100 100
i i
k i i i i
i i
k nk
F N
e a e a
f n
P
− −
− −
− −
= + = +
75 3
0.75 0.70 75 70
170 10 170 10 172.5
0.20 20
QP × × =
− −
= + = + =
40
0.4 0.15 40 15
150 10 150 10 158.33
0.30 30
P × ×=
− −
+ = + =
40P
75P
♦ Ejemplos percentiles v.e. continua
Tallas ni Ni fi Fi
140-150 15 15 0.15 0.15
150-160 30 45 0.30 0.45
160-170 25 70 0.25 0.70
170-180 20 90 0.20 0.90
180-200 10 100 0.10 1
100
 Q3 – Q1
 Valor máximo menos valor mínimo de la variable
 “Miden la Homogeneidad de las observaciones”
 1.3.2. Características de Dispersión
 Rango o recorrido
 Recorrido intercuartílico
. .C V
x
σ
=
2
σ σ=
( ) 22
22 1 1
i
k k
i i i
i i
n x x n x
x
n n
σ = =
−
= = −
∑ ∑
 Varianza
 Desviación típica
 Coeficiente de variación
xi ni nixi nixi
2
4 20 80 320
6 40 240 1440
8 44 352 2816
10 36 360 3600
12 22 264 3168
162 1296 11344
[ ]
2
222 1 11344 1296
6.02
162 162
k
i i
i
n x
Var X x
n
σ =  
= = − = − = ÷
 
∑
♦ Ejemplo
2
6.02 2.4535σ σ= = =
( )
1
i
k r
i
i
r
n x x
n
µ =
−
=
∑
( )
2
21
22
i
k
i
i
n x x
r
n
µ σ=
−
= → = =
∑
( )
1
11 0
i
k
i
i
n x x
r
n
µ =
−
= → = =
∑
 Momentos centrales (Respecto a la media)
 1.3.3 Características de forma
1 0Si γ > ⇒ Distribución sesgada a la derecha►
1 0Si γ = ⇒ Distribución simétrica►
1 0Si γ < ⇒ Distribución sesgada a la izquierda►
 Coeficiente de Sesgo (Asimetría)
3
1 3
µ
σ
γ =
2 0Si γ < ⇒
Distribución más aplastada que
la distribución Normal
►
2 0Si γ > ⇒
Distribución menos aplastada
que la distribución Normal
►
2 0Si γ = ⇒
Distribución igual de aplastada
que la distribución Normal
►
4
2 4
3
µ
σ
γ = −
 Coeficiente de Curtosis (Aplastamiento)
1.4 Gráfico de caja
Me Q3Q1f1F1mín f2 F2 máx
f1=Q1-1.5(Q3-Q1) frontera interior inferior
f2=Q3+1.5(Q3-Q1) frontera interior superior
F1=Q1-3(Q3-Q1) frontera exterior inferior
F2=Q3+3(Q3-Q1) frontera exterior superior
V.A.I.= Dato más próximo, por exceso, a f1
(valor adyacente inferior)
V.A.S.=Dato más proximo, por defecto, a f2
(valor adyacente superior)
Valores atípicos o anómalos: Datos inferiores a f1 ó
superiores a f2 (distinguiéndose)
* o**
o
Me
Q3Q1v.a.i.anómalos v.a.s anómalos
v.a.i. v.a.s.
Ejemplo
Sea la variable estadística “nº de hijos”. Los
datos de 30 familias son los siguientes:
1,2,0,0,2,4,3,0,1,1,1,2,3,4,8,3,0,1,1,3,2,1,0,4,10,5,1,0,2,4
mín = 0
máx = 10
Q1 = 1
Q3 = 3
Me = 2
f1 = -2
f2 = 6
F1 = -5
F2 = 9
Vai = 0
Vas = 5
Valores anómalos = 8, 10
0 1 2 3 4 5 6 7 8 9 10
*
o
Datos ordenados:
00000011111111222223333444458 10

Más contenido relacionado

La actualidad más candente

Proyecto investigacion de operaciones
Proyecto investigacion de operacionesProyecto investigacion de operaciones
Proyecto investigacion de operacionesjuancastillosiente
 
Analisis de Modelos por Método Grafico
Analisis de Modelos por Método GraficoAnalisis de Modelos por Método Grafico
Analisis de Modelos por Método GraficoLuis Guerrero
 
Ajuste de una_recta_por_minimos_cuadrados
Ajuste de una_recta_por_minimos_cuadradosAjuste de una_recta_por_minimos_cuadrados
Ajuste de una_recta_por_minimos_cuadradosAngie Garcia
 
Manejo de tabla distribución normal estándar
Manejo de tabla distribución normal estándarManejo de tabla distribución normal estándar
Manejo de tabla distribución normal estándarCecy Maestra TESCI
 
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)Sheyla Caraballo
 
Subir tarea estadistica chi cuadrado
Subir tarea estadistica chi cuadradoSubir tarea estadistica chi cuadrado
Subir tarea estadistica chi cuadradoAndy Shalom
 
Presentacion de estadistica probabilidad normal areas y aplicacion
Presentacion de estadistica probabilidad normal areas y aplicacionPresentacion de estadistica probabilidad normal areas y aplicacion
Presentacion de estadistica probabilidad normal areas y aplicacionanibal rodas
 
Ejemplo metodo grafico
Ejemplo metodo graficoEjemplo metodo grafico
Ejemplo metodo graficoxavier2011
 
Econometria I: modelo de regresión lineal simple
Econometria I: modelo de regresión lineal simple Econometria I: modelo de regresión lineal simple
Econometria I: modelo de regresión lineal simple ALEX ABURTO MEZA
 
Distrubución binomial
Distrubución binomialDistrubución binomial
Distrubución binomialricardo_gpe
 
Metodo simplex corposucre - micro clase
Metodo simplex   corposucre - micro claseMetodo simplex   corposucre - micro clase
Metodo simplex corposucre - micro claseCarlos Montes
 

La actualidad más candente (20)

Proyecto investigacion de operaciones
Proyecto investigacion de operacionesProyecto investigacion de operaciones
Proyecto investigacion de operaciones
 
Simplex
SimplexSimplex
Simplex
 
Formulas estadisticas
Formulas estadisticasFormulas estadisticas
Formulas estadisticas
 
Método gráfico
Método gráficoMétodo gráfico
Método gráfico
 
Método grafico. Teoría y Práctica
Método grafico. Teoría y PrácticaMétodo grafico. Teoría y Práctica
Método grafico. Teoría y Práctica
 
Analisis de Modelos por Método Grafico
Analisis de Modelos por Método GraficoAnalisis de Modelos por Método Grafico
Analisis de Modelos por Método Grafico
 
Ajuste de una_recta_por_minimos_cuadrados
Ajuste de una_recta_por_minimos_cuadradosAjuste de una_recta_por_minimos_cuadrados
Ajuste de una_recta_por_minimos_cuadrados
 
Problemas de Regresion Lineal
Problemas de Regresion LinealProblemas de Regresion Lineal
Problemas de Regresion Lineal
 
Manejo de tabla distribución normal estándar
Manejo de tabla distribución normal estándarManejo de tabla distribución normal estándar
Manejo de tabla distribución normal estándar
 
Clase03 eyp
Clase03 eypClase03 eyp
Clase03 eyp
 
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)
 
Subir tarea estadistica chi cuadrado
Subir tarea estadistica chi cuadradoSubir tarea estadistica chi cuadrado
Subir tarea estadistica chi cuadrado
 
Explicacion Ejercicios Distribucion Normal
Explicacion Ejercicios Distribucion NormalExplicacion Ejercicios Distribucion Normal
Explicacion Ejercicios Distribucion Normal
 
Presentacion de estadistica probabilidad normal areas y aplicacion
Presentacion de estadistica probabilidad normal areas y aplicacionPresentacion de estadistica probabilidad normal areas y aplicacion
Presentacion de estadistica probabilidad normal areas y aplicacion
 
Funciones
FuncionesFunciones
Funciones
 
Formulas para Descriptiva
Formulas para DescriptivaFormulas para Descriptiva
Formulas para Descriptiva
 
Ejemplo metodo grafico
Ejemplo metodo graficoEjemplo metodo grafico
Ejemplo metodo grafico
 
Econometria I: modelo de regresión lineal simple
Econometria I: modelo de regresión lineal simple Econometria I: modelo de regresión lineal simple
Econometria I: modelo de regresión lineal simple
 
Distrubución binomial
Distrubución binomialDistrubución binomial
Distrubución binomial
 
Metodo simplex corposucre - micro clase
Metodo simplex   corposucre - micro claseMetodo simplex   corposucre - micro clase
Metodo simplex corposucre - micro clase
 

Destacado

Krzysztof Nowicki - Sumika Electronic Materials Poland
Krzysztof Nowicki - Sumika Electronic Materials PolandKrzysztof Nowicki - Sumika Electronic Materials Poland
Krzysztof Nowicki - Sumika Electronic Materials PolandUrząd Miasta Włocławek
 
CT Plaza Sai Gon ( Khach san cho thue tai Quan 1 )
CT Plaza Sai Gon ( Khach san cho thue tai Quan 1 )CT Plaza Sai Gon ( Khach san cho thue tai Quan 1 )
CT Plaza Sai Gon ( Khach san cho thue tai Quan 1 )RELand.,Ltd
 
Master etiketten A12
Master etiketten A12Master etiketten A12
Master etiketten A12FerryHulstijn
 
Presentacion grupal
Presentacion grupalPresentacion grupal
Presentacion grupalsfmartinez
 
O suficiente para voc
O suficiente para vocO suficiente para voc
O suficiente para voclgrmattos50
 
Fallprevention 21 mars 2016
Fallprevention 21 mars 2016Fallprevention 21 mars 2016
Fallprevention 21 mars 2016SICAHT
 
Punto Vendita: come accrescerne il "percepito"
Punto Vendita: come accrescerne il "percepito"Punto Vendita: come accrescerne il "percepito"
Punto Vendita: come accrescerne il "percepito"Marketing Udine
 

Destacado (13)

Krzysztof Nowicki - Sumika Electronic Materials Poland
Krzysztof Nowicki - Sumika Electronic Materials PolandKrzysztof Nowicki - Sumika Electronic Materials Poland
Krzysztof Nowicki - Sumika Electronic Materials Poland
 
Herkimer Shootings PDF
Herkimer Shootings PDFHerkimer Shootings PDF
Herkimer Shootings PDF
 
CT Plaza Sai Gon ( Khach san cho thue tai Quan 1 )
CT Plaza Sai Gon ( Khach san cho thue tai Quan 1 )CT Plaza Sai Gon ( Khach san cho thue tai Quan 1 )
CT Plaza Sai Gon ( Khach san cho thue tai Quan 1 )
 
Master etiketten A12
Master etiketten A12Master etiketten A12
Master etiketten A12
 
Slideshare
SlideshareSlideshare
Slideshare
 
El éxodo
El éxodoEl éxodo
El éxodo
 
11
1111
11
 
tabla
tablatabla
tabla
 
IMG0003
IMG0003IMG0003
IMG0003
 
Presentacion grupal
Presentacion grupalPresentacion grupal
Presentacion grupal
 
O suficiente para voc
O suficiente para vocO suficiente para voc
O suficiente para voc
 
Fallprevention 21 mars 2016
Fallprevention 21 mars 2016Fallprevention 21 mars 2016
Fallprevention 21 mars 2016
 
Punto Vendita: come accrescerne il "percepito"
Punto Vendita: come accrescerne il "percepito"Punto Vendita: come accrescerne il "percepito"
Punto Vendita: come accrescerne il "percepito"
 

Similar a Tema1

Presentacion t student
Presentacion t studentPresentacion t student
Presentacion t studentpilosofando
 
Desarrollo de actividades 2 corte
Desarrollo de actividades 2 corteDesarrollo de actividades 2 corte
Desarrollo de actividades 2 corteelsy liseth galindo
 
Desarrollo de actividades 2 corte
Desarrollo de actividades 2 corteDesarrollo de actividades 2 corte
Desarrollo de actividades 2 corteelsy liseth galindo
 
Ejercicios y problemas resueltos de estadística ii
Ejercicios y problemas resueltos de estadística iiEjercicios y problemas resueltos de estadística ii
Ejercicios y problemas resueltos de estadística iiEliza Yanayaco Paucar
 
inei indicadores
inei indicadoresinei indicadores
inei indicadoresEddy Pineda
 
Pres8 medidas de_dispersion
Pres8 medidas de_dispersionPres8 medidas de_dispersion
Pres8 medidas de_dispersionAlejandro CQ
 
Algebra jose silva mechato
Algebra                               jose silva mechatoAlgebra                               jose silva mechato
Algebra jose silva mechatoanabelita_14_
 
Pres8 medidas de_dispersion
Pres8 medidas de_dispersionPres8 medidas de_dispersion
Pres8 medidas de_dispersionLeonardo Iriarte
 
Estadistica hecha por el ing yony maldonado
Estadistica hecha por el ing yony maldonadoEstadistica hecha por el ing yony maldonado
Estadistica hecha por el ing yony maldonadoyony20
 
Estadística y probabilidad de la universidad nacional de la amazonia peruana
Estadística y probabilidad de la universidad nacional de la amazonia peruanaEstadística y probabilidad de la universidad nacional de la amazonia peruana
Estadística y probabilidad de la universidad nacional de la amazonia peruanaJosueDavidTuanamaLin
 
Ecuaciones Empíricas
 Ecuaciones Empíricas Ecuaciones Empíricas
Ecuaciones EmpíricasSelf-employed
 
5.1 consistencia de datos de lluvia
5.1 consistencia de datos de lluvia5.1 consistencia de datos de lluvia
5.1 consistencia de datos de lluviaFátima Lds
 

Similar a Tema1 (20)

Presentacion t student
Presentacion t studentPresentacion t student
Presentacion t student
 
Unidad iii
Unidad iiiUnidad iii
Unidad iii
 
Desarrollo de actividades 2 corte
Desarrollo de actividades 2 corteDesarrollo de actividades 2 corte
Desarrollo de actividades 2 corte
 
Desarrollo de actividades 2 corte
Desarrollo de actividades 2 corteDesarrollo de actividades 2 corte
Desarrollo de actividades 2 corte
 
Pie
PiePie
Pie
 
Ejercicios y problemas resueltos de estadística ii
Ejercicios y problemas resueltos de estadística iiEjercicios y problemas resueltos de estadística ii
Ejercicios y problemas resueltos de estadística ii
 
inei indicadores
inei indicadoresinei indicadores
inei indicadores
 
Clase5 métodoslj
Clase5 métodosljClase5 métodoslj
Clase5 métodoslj
 
Pres8 medidas de_dispersion
Pres8 medidas de_dispersionPres8 medidas de_dispersion
Pres8 medidas de_dispersion
 
Algunos ejercisios
Algunos ejercisiosAlgunos ejercisios
Algunos ejercisios
 
Algebra jose silva mechato
Algebra                               jose silva mechatoAlgebra                               jose silva mechato
Algebra jose silva mechato
 
Pres8 medidas de_dispersion
Pres8 medidas de_dispersionPres8 medidas de_dispersion
Pres8 medidas de_dispersion
 
Estadistica hecha por el ing yony maldonado
Estadistica hecha por el ing yony maldonadoEstadistica hecha por el ing yony maldonado
Estadistica hecha por el ing yony maldonado
 
Estadística y probabilidad de la universidad nacional de la amazonia peruana
Estadística y probabilidad de la universidad nacional de la amazonia peruanaEstadística y probabilidad de la universidad nacional de la amazonia peruana
Estadística y probabilidad de la universidad nacional de la amazonia peruana
 
Ecuaciones Empíricas
 Ecuaciones Empíricas Ecuaciones Empíricas
Ecuaciones Empíricas
 
Tercer corte
Tercer corteTercer corte
Tercer corte
 
Descriptiva 1
Descriptiva 1 Descriptiva 1
Descriptiva 1
 
Formulas 2012 01pdf
Formulas 2012 01pdfFormulas 2012 01pdf
Formulas 2012 01pdf
 
Medidas resumen
Medidas resumenMedidas resumen
Medidas resumen
 
5.1 consistencia de datos de lluvia
5.1 consistencia de datos de lluvia5.1 consistencia de datos de lluvia
5.1 consistencia de datos de lluvia
 

Tema1

  • 1. TEMA 1 DESCRIPCIÓN DE DATOS: ESTADÍSTICA DESCRIPTIVA 1.1 Introducción: conceptos básicos 1.2 Tablas estadísticas y representaciones gráficas 1.3 Características de variables estadísticas unidimensionales 1.3.1 Características de posición 1.3.2 Características de dispersión 1.3.3 Características de forma 1.4 Análisis exploratorio de datos: gráfico de caja
  • 2. * Estadística descriptiva: parte de la estadística que se ocupa de las etapas 2 y 3  ESTADÍSTICA: “Estudio de los métodos de recogida y descripción de datos, así como del análisis de esta información”  Población: “Conjunto de elementos a los que se les estudia una característica”  Individuo: “Cada uno de los elementos de la población”  Muestra: “Subconjunto representativo de la población”  1.1. Introducción : conceptos básicos  Etapas de un estudio estadístico  Individuo, Población, Muestra 1 Recogida de datos 2 Ordenación, tabulación y gráficos* 3 Descripción de características* 4 Análisis formal
  • 3.  Variable estadística (v.e.): ”Característica propia del individuo objeto del estudio estadístico”  Modalidad: “Cada una de las posibilidades o estados diferentes de una variable estadística”  Exhaustivas e incompatibles  Variables estadísticas. Modalidades Ejemplos: - Estatura - Salario - Color del pelo - Nivel de colesterol - Nº de hijos de una familia Ejemplo: color del pelo: - castaño - rubio - negro
  • 4.  Cualitativas: Las características no son cuantificables  Cuantitativas: Características cuantificables o numéricas  Discretas: Numéricas numerables  Continuas: Numéricas no numerables  Tipos de variables estadísticas Ejemplos: Grupo sanguineo Profesión Color del pelo Ejemplos: Nº de hijos de una familia Nº de nidos de procesionarias por árbol Nº de virus en un cultivo Ejemplos: Estatura Salario Nivel de colesterol
  • 5.  Frecuencias ♦ ♦ ♦ ♦ 1 2 1 2 Absolutas, (nº individuos modalidad i) Absolutas acumuladas, ... Relativas, (proporcion indiv. modalidad i) Relativas acumuladas, ... i i i i i i i n N n n n f n n F f f f = + + + = = + + + Absolutas, ni Relativas fi = ni / n Relativas acumuladas Fi = Ni / n Absolutas acumuladas, Ni  Variables discretas xi ni Ni fi Fi x1 ... xi ... xk n1 ... ni ... nk N1 ... Ni ... Nk f1 ... fi ... fk F1 ... Fi ... Fk n 1  1.2. Tablas estadísticas y representaciones gráficas
  • 6.  Variables continuas: Intervalos Intervalo Ii xi ni Ni fi Fi e0 – e1 ... ei-1 – ei ... ek-1 – ek x1 ... xi ... xk n1 ... ni ... nk N1 ... Ni ... Nk f1 ... fi ... fk F1 ... Fi ... Fk n 1  Marca de clase xi (punto medio de cada intervalo)  Amplitud ai (distancia entre los extremos)  Intervalos cerrados por un extremo y abiertos por otro
  • 7.  V. E. Cualitativas: Gráfico rectangular 20 10 Negro Gris Blanco Rojo Violeta  Gráficos estadísticos Color Plumaje Nº de Aves (ni) Negro 10 Gris 14 Blanco 20 Rojo 6 Violeta 4 54
  • 8.  V. E. Cualitativas: Gráfico de sectores rojo violeta negro grisblanco Color Plumaje Nº de Aves ni fi Grados Negro 10 0,185 66,6 Gris 14 0,259 93,24 Blanco 20 0,37 133,2 Rojo 6 0,111 39,96 Violeta 4 0,074 26,64 54 Grados de un sector = 3600 x fi
  • 9. 0 5 10 15 20 25 30 35 2 3 4 5 6  V. E. Discretas: Gráfico de barras Nº de crías Nº animales: ni fi Fi 2 20 0.20 0.20 3 30 0.30 0.50 4 25 0.25 0.75 5 15 0.15 0.90 6 10 0.10 1 n = 100
  • 10. Estatura ni hi = ni / ai 140–160 30 1.5 160–170 22 2.2 170–180 20 2 180–190 18 1.8 190–200 10 1 100  V. E. Continuas: Histograma  El área de cada rectángulo es proporcional a la frecuencia” 1 1,5 1,8 140 160 170 180 200 hi 190 2.2 2
  • 11. 1 1 k i ik i i i i n x f x n x = = = = ∑ ∑  1.3. Características de variables estadísticas unidimensionales  1.3.1 Características de Posición  Media aritmética Estatura Nº Personas ni M. Clase xi ni xi 140–150 20 145 2900 150–160 100 155 15500 160–180 80 170 13600 180–200 10 190 1900 n = 210 33900 339001 161.42 210 : k i i i n x Media n x = == = ∑
  • 12. 175 224 453 362 341 nixi♦ Ejemplo  Datos en tabla  Datos en serie 2, 2, 3, 3, 3, 3, 5, 6, 7 Mo = 3 Mo = 3  Valor de la variable más frecuente  Puede haber más de una moda → Plurimodal  Moda  Variables discretas
  • 13. ( ) ( ) 1 1 1 1 i i i i i i i i h h Mo e a h h h h − − − + − = + − + − xi ni hi = ni / ai 140–160 30 1.5 160–170 22 2,2 170–180 20 2 180–190 18 1,8 190–200 10 1 100  Variables continuas ♦ Ejemplo  Observaciones: 1. Puede utilizarse la frecuencia relativa 2. Si las amplitudes son iguales, la moda se puede obtener directamente con las frecuencias ( ) ( ) ( ) 2.2 1.5 160 10 167.777 2.2 1.5 2.2 2 Mo × − = + = − + −
  • 14.  Valor de la variable que ocupa el lugar central en una serie de datos ordenados.  El 50% de los elementos de la población tienen un valor de la variable menor o igual que la mediana. El 50% de los elementos de la población tienen un valor de la variable mayor o igualque la mediana.  Nº par de observaciones: 3, 4, 6, 6, 6, 7, 8, 8, 9, 9 → Me = 6 – 7 Indeterminada entre 6 y 7  Mediana  Variables discretas  Datos en serie xi ni Ni fi Fi 2 3 3 0,333 0,333 3 1 4 0,111 0,444 5 1 5 0,111 0,555 6 1 6 0,111 0,666 7 2 8 0,222 0,888 8 1 9 0,111 0,999 9 1 xi ni Ni fi Fi 3 1 1 0,1 0,1 4 1 2 0,1 0,2 6 3 5 0,3 0,5 7 1 6 0,1 0,6 8 2 8 0,2 0,8 9 2 10 0,2 1 10 1  Nº impar de observaciones: 2, 2, 2, 3, 5, 6, 7, 7, 8 → Me = 5
  • 15.  Datos en tabla  Variables discretas n/2 = 14 Fi = 0,5 Me = 2 ♦ Ejemplo 284 3 2 1 0 xi 28 3 5 10 6 4 ni 1 0.892 0.714 0.357 0.142 Fi 1 0.107 0.178 0.357 0.214 0.142 fi 25 20 10 4 Ni  Observación: Si n/2 coincide con un Ni la mediana está indeterminada entre xi y xi+1
  • 16. 1 1 1 1 50 0,5 100 i i i i i i i i n N F Me e a e a f n − − − − − − = + = + 0.5 0.45 160 10 160 2 162 0.25 Me × − = + = + = n/2 = 50 Fi = 0,5  Variables continuas ♦ Ejemplo  Observación: Si n/2 coincide con un Ni la mediana es el extremo superior del intervalo que le corresponde 1 0.90 0.70 0.45 0.15 Fi 0.10 0.20 0.25 0.30 0.15 fi 100 90 70 45 15 Ni 100 10180–200 20170–180 25160–170 30150–160 15140–150 ni Estatura
  • 17.  Definición: Pk , k: 1,2,...,99, “percentil k”, valor de la variable que deja por debajo, el k% de los valores de la variable Q1 = P25 → Cuartil 1º Q2 = P50 → Cuartil 2º = Me Q3 = P75 → Cuartil 3º D1 = P10 → Decil 1º D2 = P20 → Decil 2º …. D9 = P90 → Decil 9º  Percentiles 1 1 1 1 100 100 i i k i i i i i i k k F n N P e a e a f n − − − − − − = + = +  Cálculo para v.e. continuas:  Cálculo para v.e. discretas: Igual que la mediana, cambiando: 50 100 100 k n por n
  • 18. xi ni Ni 2 20 20 3 30 50 4 44 94 5 20 114 6 10 124 124 Percentil 40, P40 = 3 Percentil 95, P95 = 6 nk /100 = 124x25/100 = 31 nk /100 = 124x50/100 = 62 nk /100 = 124x75/100 = 93 ♦ Ejemplos percentiles v.e. discreta Percentil 50, P50 = 4 = Me = Q2 Percentil 25, P25 = 3 = Q1 Percentil 75, P75 = 4 = Q3 40 124 49,6 100 100 k n = = 95 124 117,8 100 100 k n = =
  • 19. 1 1 1 1 100 100 i i k i i i i i i k nk F N e a e a f n P − − − − − − = + = + 75 3 0.75 0.70 75 70 170 10 170 10 172.5 0.20 20 QP × × = − − = + = + = 40 0.4 0.15 40 15 150 10 150 10 158.33 0.30 30 P × ×= − − + = + = 40P 75P ♦ Ejemplos percentiles v.e. continua Tallas ni Ni fi Fi 140-150 15 15 0.15 0.15 150-160 30 45 0.30 0.45 160-170 25 70 0.25 0.70 170-180 20 90 0.20 0.90 180-200 10 100 0.10 1 100
  • 20.  Q3 – Q1  Valor máximo menos valor mínimo de la variable  “Miden la Homogeneidad de las observaciones”  1.3.2. Características de Dispersión  Rango o recorrido  Recorrido intercuartílico
  • 21. . .C V x σ = 2 σ σ= ( ) 22 22 1 1 i k k i i i i i n x x n x x n n σ = = − = = − ∑ ∑  Varianza  Desviación típica  Coeficiente de variación
  • 22. xi ni nixi nixi 2 4 20 80 320 6 40 240 1440 8 44 352 2816 10 36 360 3600 12 22 264 3168 162 1296 11344 [ ] 2 222 1 11344 1296 6.02 162 162 k i i i n x Var X x n σ =   = = − = − = ÷   ∑ ♦ Ejemplo 2 6.02 2.4535σ σ= = =
  • 23. ( ) 1 i k r i i r n x x n µ = − = ∑ ( ) 2 21 22 i k i i n x x r n µ σ= − = → = = ∑ ( ) 1 11 0 i k i i n x x r n µ = − = → = = ∑  Momentos centrales (Respecto a la media)
  • 24.  1.3.3 Características de forma 1 0Si γ > ⇒ Distribución sesgada a la derecha► 1 0Si γ = ⇒ Distribución simétrica► 1 0Si γ < ⇒ Distribución sesgada a la izquierda►  Coeficiente de Sesgo (Asimetría) 3 1 3 µ σ γ =
  • 25. 2 0Si γ < ⇒ Distribución más aplastada que la distribución Normal ► 2 0Si γ > ⇒ Distribución menos aplastada que la distribución Normal ► 2 0Si γ = ⇒ Distribución igual de aplastada que la distribución Normal ► 4 2 4 3 µ σ γ = −  Coeficiente de Curtosis (Aplastamiento)
  • 26. 1.4 Gráfico de caja Me Q3Q1f1F1mín f2 F2 máx f1=Q1-1.5(Q3-Q1) frontera interior inferior f2=Q3+1.5(Q3-Q1) frontera interior superior F1=Q1-3(Q3-Q1) frontera exterior inferior F2=Q3+3(Q3-Q1) frontera exterior superior V.A.I.= Dato más próximo, por exceso, a f1 (valor adyacente inferior) V.A.S.=Dato más proximo, por defecto, a f2 (valor adyacente superior) Valores atípicos o anómalos: Datos inferiores a f1 ó superiores a f2 (distinguiéndose) * o** o Me Q3Q1v.a.i.anómalos v.a.s anómalos v.a.i. v.a.s.
  • 27. Ejemplo Sea la variable estadística “nº de hijos”. Los datos de 30 familias son los siguientes: 1,2,0,0,2,4,3,0,1,1,1,2,3,4,8,3,0,1,1,3,2,1,0,4,10,5,1,0,2,4 mín = 0 máx = 10 Q1 = 1 Q3 = 3 Me = 2 f1 = -2 f2 = 6 F1 = -5 F2 = 9 Vai = 0 Vas = 5 Valores anómalos = 8, 10 0 1 2 3 4 5 6 7 8 9 10 * o Datos ordenados: 00000011111111222223333444458 10