SlideShare una empresa de Scribd logo
1 de 56
Estadística descriptiva
INSTITUTO MEXICANO DEL SEGURO SOCIAL
COORDINACIÓN DE EDUCACIÓN EN SALUD
Unidad didáctica: Metodología de la investigación II
Docente: QFB Jaime Cesar Mejía Reséndiz
Estadística es la ciencia,
pura y aplicada, de creación,
desarrollo y de aplicación de
técnicas tales que la
incertidumbre de la
inferencia inductiva pueda
ser evaluada
Tomar decisiones es una gran
responsabilidad.
Para tomar decisiones se requiere
INFORMACIÓN disponible,
esperanzadamente confiable y útil.
Generalmente se necesita una porción
de la base de datos o muestra para
revelar un patrón lógico o realizar un
análisis estadístico.
Población Muestra
Estadística
Probabilidad
Objetivo de la Estadística Descriptiva
Conocer la información que se tiene
para poder identificar e interpretar
aspectos relevantes de una muestra.
Utilizar esta información para obtener
resultados, planear o hacer inferencia
acerca de la población bajo estudio.
Los datos son la materia prima del
estadístico.
Usa los números para interpretar la
realidad.
Todos los problemas estadísticos
involucran o la recolecta, la descripción
y el análisis de los datos, o
pensar cómo recolectar, describir y hacer el análisis
de los datos.
0
8
3
4
7
8 9
6
3 3
1
5
05
3
8
2
9
Población
Muestra
Transformación
Sumarización
Ilustración
Análisis
Estimación
Hipótesis
Tengo un 98% de
probabilidad de hacer
algo que tenga sentido
con estos números.
0
8
3
4
7
8 9
6
3 3
1
5
05
3
8
2
9
El conjunto de datos que describen un
fenómeno (nuestro objetivo) constituyen lo
que se llama Población
Una Muestra es un subconjunto de la
población sobre la cual vamos a realizar
las medidas sobre una o mas
características de interés
¿Por qué muestreamos?
- Poblaciones muy grandes
- Respuesta rápida
- Destrucción de la muestra
muestreo ...
Una característica importante de una
muestra es que sea Representativa
de la población de interés.
Cualquiera que sea nuestro objetivo:
describir a la población, analizar o
pronosticar el comportamiento de la
población, la muestra, al ser
representativa, será Confiable
muestreo ...
- Cada unidad tiene la misma
oportunidad de ser elegida
MuestreoAleatorio
- La selección de una unidad
no tiene influencia sobre la
elección de otra unidad
muestreo ...
Muestreo Estratificado
 Muestreo por
Conglomerado
 - Divide a la población
en grupos
 -Se extrae una muestra
aleatoria simple de los
grupos
 -Se muestrean todos
los elementos del
grupo seleccionado
- Divide a la población en
grupos homogéneos
- Se extrae una muestra
aleatoria simple de cada
grupo o estrato
muestreo ...
Muestreo
Sistemático
- Se elige aleatoriamente a
una unidad
- A partir de ésta se selecciona
cada k-ésima unidad que se
encuentra después de la
elegida
Muestreo
Oportunista
-Se muestrean los n primeros
elementos que se presentan
muestreo ...
Un parámetro es una medida numérica de
un aspecto de la población    
Una estadística es una medida numérica de
un aspecto de la muestra X, S, n, X
~
Una estadística consiste de un conjunto de
mediciones de dicha característica que varía
de una observación (unidad experimental) a
otra, y a estas mediciones las llamaremos
variable
No todas las variables son numéricas
entonces podemos clasificarlas de acuerdo a
su tipo en:
Cualitativas: Son variables que denotan una
cualidad o atributo y solo pueden ser
clasificadas en categorías o clases
mutuamente excluyentes y exhaustivas
Cuantitativas: Son aquellas variables que se
obtuvieron de un proceso de conteo
(discretas) o medición (contínuas)
Clasificación de las variables Cualitativas
de acuerdo a su escala de medición:
Nominal: Son clasificadas en categorías, sin
importar el orden. No tiene sentido hacer
operaciones aritméticas con ellas (género, grupo
sanguíneo, Fuma (si/no))
Ordinal: Las categorías se pueden arreglar en
orden, pero las distancias entre las clases no son
iguales (intensidad del dolor, escolaridad, nivel
socioeconómico)
Clasificación de las variables
Cuantitativas de acuerdo a su escala
de medición:
Intervalo: Son medidas en las que las distancias
entre los valores es significativa pero no existe un
cero absoluto (el cero no es ausencia de atributo) . No
tiene sentido hacer cociente o producto (temperatura,
usos horarios)
Razón: Las proporciones y razones tienen sentido
al determinar cuánto mas tiene una unidad que otra de
alguna característica. (peso, ingreso, rendimiento)
El análisis de cada variable se
hace de acuerdo a su escala de
medición
Podemos
hacer
diagramas,
tablas y
resúmenes
numéricos
de los datos
recopilados
¿Cómo presentar los datos?
La frecuencia absoluta
particular es el número de observaciones
que caen en cada clase.
n
La frecuencia relativa o porcentaje para
una clase particular es su frecuencia
absoluta entre el número total de
observaciones
fi
i
p 
fi para una clase
Esta frecuencia ayuda a
sumarizar en forma ordenada la
información contenida en la
muestra tanto en tablas como en
gráficas.
tabla de distribución de
frecuencias
diagrama de barras
género frecuencia porcentaje
0 19 0.63
1 1
1 0.37
T
otal 30 1
H
istograma
0.75
0.50
0.25
0.00
M F
G
énero
Frecuencia
Si las variables son cuantitativas
discretas las tablas de frecuencias
se realizan con la creación de
diferentes clases en base a los datos
que toma la variable.
edad frecuencia porcentaje
38 3 0.10
39 3 0.10
40 6 0.20
41 1 0.03
42 3 0.10
43 2 0.07
44 4 0.13
45 3 0.10
46 4 0.13
47 0 0.00
48 0 0.00
49 1 0.03
Total 30 1.00
H
istogramadeF
recuenciasparaE
dad
7
6
5
4
3
2
1
0
38 39 40 41 42 43 44 45 46 47 48 49
Edad
Frecuencia
Si las variables son cuantitativas
continuas las tablas de
frecuencias se realizan con la
creación de intervalos numéricos
que formarán las diferentes clases.
tie m p
o
fre c u e
n c ia
p o rc e n
ta je
9 3 3 1 - 9
9 3 1
1 0 .0 3
9 9 3 1 -1 0
5 3 1
1 0 .0 3
1 0 5 3 1 -1
1 1 3 1
3 0 .1 0
1 1 1 3 1 -1
1 7 3 1
6 0 .2 0
1 1 7 3 1 -1
2 3 3 1
5 0 .1 7
1 2 3 3 1 -1
2 9 3 1
5 0 .1 7
1 2 9 3 1 -1
3 5 3 1
6 0 .2 0
1 3 5 3 1 -1 3 0 .1 0
Histograma
0.30
0.20
0.10
0.00
9631 10231 10831 11431 12031 12631 13231 13831
Tiempo
Frecuenci
a
tie m p o (se g ) fre c u e n c ia p o rc e n ta je F re c . A c u m .
9 6 3 1 1 0 .0 3 3 0 .0 3 3
1 0 2 3 1 1 0 .0 3 3 0 .0 6 7
1 0 8 3 1 3 0 .1 0 0 0 .1 6 7
1 1 4 3 1 6 0 .2 0 0 0 .3 6 7
1 2 0 3 1 5 0 .1 6 7 0 .5 3 3
1 2 6 3 1 5 0 .1 6 7 0 .7 0 0
1 3 2 3 1 6 0 . 2 0 0 0 .9 0 0
1 3 8 3 1 3 0 .1 0 0 1 .0 0 0
T o ta l 3 0 1 .0 0
Podemos completar esta tabla de frecuencias
con una columna que nos de las Frecuencias
Acumuladas ¿qué uso tienen?
a) ¿qué frecuencia de individuos tuvieron un tiempo menor a
11,431 seg?
b) ¿qué porcentaje de individuos tuvieron un tiempo mayor o igual
a 12,631 seg?
c) ¿qué tiempo máximo es el que al menos el 50% de las personas
tuvieron?
a) 0.167
c) 46.7%
e) 12,031 seg
Otros diagramas de utilidad:
3 38 0 0 0
6 39 0 0 0
12 40 0 0 0 0 0 0
13 41 0
(3) 42 0 0 0
14 43
12 44
8 45
0 0
0 0 0 0
0 0 0
5 46 0 0 0 0
1 47
1 48
1 49 0
-se usa con pocos valores
-los datos están ordenados
-encontramos fácilmente
mínimo y máximo
-encontramos fácilmente los
porcentiles
-da una visión gráfica de la
distribución de los datos
diagrama de tallo y hojas
para la variable edad 38|0
= 38.0
Diagrama de puntos. Útil para cuando tenemos
pocos datos discretos
:
. . : . : . :
: : : . : : : : : .
+ + + + + + Edad
38.0 40.0 42.0 44.0 46.0 48.0
Polígono de Frecuencias Ojiva
PolígonodeFrecuencia
8
6
4
2
0
9000 10000 11000 13000 14000
12000
Tiempo
Frecuencia
Ojiva
1.00
0.75
0.50
0.25
0.00
9000 10000 13000 14000
11000 12000
Tiempo
Porcentaje
Acumulado
Métodos Numéricos
(válidos solo para datos cuantitativos)
0
9
8
4
3 1
0
0
8
9
3
9
8
4
2
32 1 5
0
0
3 8
5 3
5 3 30
Si pudiéramos escoger entre dos números que nos
ayuden a construir una imagen mental burda de la
distribución de un bonche de datos ¿Cuáles
escogeríamos?
-un número que esté
localizado cerca del centro
de la distribución
8
4
3 0 0 0
9 19 9
3
8 8
8 4 378
89
897 9
6 6
9
3 0304 3
758
8
3
3 2
0
48 9
75
68 9
6
5
2 5
0 3 3
31 3
1
9 51
8
8 4 378
7
68 9
6 6
6
3 3 2 0
2
3 2
3 325
1 5
53 1 5
5
3 8 75 3 304
8 9 3 75 3
30 59
-un número que mida la
dispersión de la
distribución
Medidas de Dispersión
Son números que indican qué tan separados están los
datos entre si: rango, desviación estándar, rango
intercuartil
Polígono de Frecuencia
8
6
4
2
0
9000 10000 11000 13000 14000
12000
Tiempo
Frecuencia
Medidas de Tendencia Central
Son números que se localizan cerca del centro o cerca
de donde se encuentran los datos con mayor frecuencia:
media, mediana, moda
Medidas de tendencia central

n
i
x
X  i1
1
n
 
i
 n 
 fi 
m 
X a 
k
i1
tie m p o (s
e g )
fre c u e n c i
a
p o rc e n ta j
e
F re c . A c u
m .
9 6 3 1 1 0 .0 3 0 .0 3
1 0 2 3 1 1 0 .0 3 0 .0 7
1 0 8 3 1 3 0 .1 0 0 .1 7
1 1 4 3 1 6 0 .2 0 0 .3 7
1 2 0 3 1 5 0 .1 7 0 .5 3
1 2 6 3 1 5 0 .1 7 0 .7 0
1 3 2 3 1 6 0 .2 0 0 .9 0
1 3 8 3 1 3 0 .1 0 1 .0 0
T o ta l 3 0 1
en el caso en que los datos estén agrupados:
media
X a  9631(0.03) 10231(0.03) 
10831(0.10)  13831(0.10)
12,187
mediana
y se observa
se localiza el valor central
el valor que toma 2
lX
~
n1
3 38 0 0 0
6 39 0 0 0
12 40 0 0 0 0 0 0
13 41 0
(3) 42 0 0 0
14 43 0 0
12 44 0 0 0 0
8 45 0 0 0
5 46 0 0 0 0
1 47
1 48
1 49 0
2
~ 15.5
301
lX
el valor que toma la
variable es 42.0 años
medidas de tendencia central ...
a pm
 A 0.5Pm1
B  A
X
~
donde A y B son los límites inferior y superior de la clase que
contiene a la mediana, Pm-1 es la frecuencia acumulada hasta la
clase anterior a la que contien la mediana y pm es la frecuencia
relativa de la clase que contiene a la mediana
para datos agrupados se estima como
tiempo frec. porc. Frec Acum
9331- 9931 1 0.033 0.033
9931-10531 1 0.033 0.067
1 0 5 3 1 -1 1 1
3 1
3 0 . 1 0
0
0 . 1 6
7
1 1 1 3 1 -1 1 7
3 1
6 0 . 2 0
0
0 . 3 6
7
1 1 7 3 1 -1 2 3
3 1
5 0 . 1 6
7
0 . 5 3
3
1 2 3 3 1 -1 2 9
3 1
5 0 . 1 6
7
0 . 7 0
0
1 2 9 3 1 -1 3 5
3 1
6 0 . 2 0
0
0 . 9 0
0
medidas de tendencia central ...
600
~
0.167
0.50.367
11731
a
X
moda
es el valor con la frecuencia mas alta.
La distribución puede ser unimodar, multimodal
cuando los datos están agrupados
podemos hablar de una clase modal o
estimar la moda:
donde A y B son los límites inferior y superior
de la clase modal, d1= fmo – fmo-1 y d2= fmo – fmo+1
Mo  A  B  A
d1d2
d1
medidas de tendencia central ...
Medidas de Dispersión
rango se define como la diferencia entre el valor
máximo y el mínimo:
Rango = max - min
Es una medida sensible a valores extremos y no es muy
informativa ya que es insensible a datos intermedios
amplitud intercuartílica es la distancia entre
el porcentil 75 y el porcentil 25:
AI = P75 - P25
Nos da una idea de la distancia entre los valores que
determinan el 50% de los datos centrales
Varianza es una variación
promedio alrededor de la media,
definida como

n 1
X  X 2
S2

n
i1 i
un problema de la varianza es que tiene las unidades al
cuadrado y su interpretación no es fácil, por lo que usamos
su raiz: desviación estándar
2
 X  X 
S 
n
i 1 i
n 1
es sensible a valores extremos.
Si los datos están agrupados en k intervalos, la varianza se
estima como:
2
2  f m  X 
S 
k
i1 a
i i
n1
a
para nuestro ejemplo ¿qué valor toma 2
Sa ?
medidas de dispersión...
Hay algunas formas de poner juntos a
la desviación estándar y a la media
muestrales
Coeficiente de Variación: es una medida de
variación relativa y expresa la desviación estándar
como un porcentaje de la media aritmética. Se
obtiene como CV 
S
x100
X
por su falta de dimensiones es muy útil para
comparar variación entre diferentes poblaciones,
que a simple vista serían difíciles de comparar.
medidas de dispersión...
Creación de Intervalos:
observaciones que caen dentro de ese
intervalo.
 Si nuestra distribución muestral tiene una
forma mas o menos simétrica y acampanada
podemos usar la regla empírica:
 alrededor del 69% de las observaciones cae
dentro de una desviación estándar de la
media
 alrededor del 95% de las observaciones
cae dentro de dos desviaciones estándar de la
y obtener el número de
con S y X se pueden formar intervalos de la forma
X kS
medidas de dispersión...
0
5
10
15
20
25
Frecuen
cia
1 3 5 7 9 11 13 15 17 19 21
s s
Intervalos
alrededor
de la media
X s
X 2s
X 3s
(7.57 , 15.75)
(3.48 , 19.84)
(-0.61 , 23.93)
n = 372
X = 11.66
s = 4.089
2s 2s
3s 3s
X
264 obs. 70.96%
353 obs. 94.89%
372 obs. 100.00%
Monóxido de Carbono en
el humo de los cigarros
medidas de dispersión...
Medidas de Posición Relativa
Son medidas descriptivas que localizan la
posición de una medición en relación a otras
mediciones.
Una medida que expresa esta posición en
términos de un porcentaje es llamado
porcentil
El porcentil de orden  (P ) es el valor de la
variable por debajo del cual se encuentra una
frecuencia acumulada .
El porcetil 25 o primer
cuartil Q1 = - 0.675 deja a
su izquierda el 25% de
las observaciones
El porcetil 70, es decir,
P70 = 0.525 deja a su
izquierda el 70% de las
observaciones
medidas de posición relativa...
El diagrama de tallo y hojas,
nos ayuda a localizarlos
rápidamente
 -los datos se ordenan
de menor a mayor
 -se encuentra la
localización de los
porcentiles:
3 38 0 0 0
6 39 0 0 0
12 40 0 0 0 0 0 0
13 41 0
(3) 42 0 0 0
14 43 0 0
12 44 0 0 0 0
8 45 0 0 0
5 46 0 0 0 0
1 47
1 48
1 49 0
-se lee el valor de dicha observación
-si la localización es fraccionaria se
toma el promedio del valor en la
localización anterior y posterior
los porcentiles no
necesariamente son
números observados

100

 
l(P )    (n)

medidas de posición relativa...
1 9 6
3 10 2 3
6 10 6 7 9
11 11 0 1 3 3 3
(5) 11 7 7 8 8 8
14 12 0 0 1 2 3
9 12 6 6 9 9
5 13 0 2 3 3 4
l(Q1) = (25/100)31 = 7.75
 Q1 = P25 = 11.05
l(Q3) = (75/100)31 = 23.25
 Q3 = P75 = 12.65
2
l(Q ) = (50/100)31 = 15.5
2
 Q = P50 = 11.8
Los cuartiles Q1 y Q3 son muy útiles para
construir lo que llamamos diagrama de
caja y brazos.
medidas de posición relativa...
25000
20000
15000
10000
Tie
mpo
Diagrama de Caja y Brazos
Nos permite ver la distribución de los datos, el
máximo, el mínimo, la localización de los
Cuartiles, y la dispersión por cuartiles. Nos
permitirá ver si existe un sesgo así como
puntos extremos.
Para hacer estadística diferente a la descriptiva,
podemos usar todas las técnicas hasta ahora
aprendidas y hacer algún análisis comparativo o
asociativo.
El problema de comparación consiste en
contrastar las distribuciones de frecuencia de
una variable de interés para dos o mas
subpoblaciones basándose en los datos de la
muestra.
Análisis Exploratorio de Datos
En el problema de comparación
surgen algunas preguntas:
¿Hay alguna diferencia en las distribuciones
poblacionales?
¿Cuál es la naturaleza de esas diferencias?
¿Qué tan grandes son esas diferencias?
El análisis exploratorio nos ayudará a darnos una
idea de las respuestas a estas preguntas
La comparación de las distribuciones de
frecuencia entre subpoblaciones cuando
la variable de interés es cualitativa se
hace con:
Hábitos de tabaquismo
Género
Nunca ha
fumado
Dejó de
fumar
Fuma
actualmente
Total
Masculino 154 25 185 364
Femenino 127 11 38 176
Total 281 36 223 540
una tabla de contingencias o
tabulación cruzada
las frecuencias pueden ser realtivas o absolutas y nos dan una idea de
qué tan frecuente se presentan simultáneamente ambos atributos en
una población
comparación...
El objetivo de la comparación es ver si una
característica determinada varía relativo a alguna
subclase, por lo que se calculan las frecuencias
relativas condicionales fij / fi
ó pij / pi (de ésta manera compensamos por
diferencias de tamaños) ...
Hábitos de tabaquismo (%)
Género
Nunca ha
fumado
Dejó de
fumar
Fuma
actualmente
Total
Masculino 28.5 4.6 34.3 67.4
Femenino 23.5 2.1 7.0 32.6
Total 52.0 6.7 41.3 100
comparación...
... y calculamos las
frecuencias relativas
condicionadas a género
¿el hábito de
tabaquismo
difiere si se es
hombre o
mujer?
Hábitos de tabaquismo condicionadas a género (%)
Género
Nunca ha
fumado
Dejó de
fumar
Fuma
actualmente
Total
Masculino 42.3 6.8 50.9 100
Femenino 72.1 6.5 21.5 100
Total 52.0 6.7 41.3 100
Hábito de Tabaquismo por Género
0.0
20.0
40.0
60.0
80.0
Nunca ha fumado Dejó de fumar Fuma actualmente
Frecuencia
Masculino Femenino
comparación...
0.00
15.00
30.00
45.00
Distribución de Edad por Género
Masculino
Femenino
Si la variable a analizar es
discreta se puede tratar como si
fuera cualitativa.
comparación...
Edad en años condicionada a género (%)
Género 39 40 41 42 Total
Masculino 10.53 21.05 42.11 26.32 100
Femenino 36.36 18.18 18.18 27.27 100
Total 20.00 20.00 33.33 26.67 100
39
40
41 42
¿hay alguna
diferencia entre
géneros con
respecto a la
edad?
F M
0
10000
20000
30000
Género
Orden
llegada
Tiempos por Género
En el caso de que la variable a analizar sea
contínua podemos estar interesados en
comparar tanto la localización como la
dispersión entre las distribuciones de
frecuencia de las subpoblaciones. Una
manera de hacerlo es por medio de un
diagrama esquemático
comparación...
¿Quién tiene
tiempos más
altos?
¿quién tiene
mayor
dispersión?
Muchas veces es importante saber si una
variable influye sobre el comportaminto de otra
variable. Con ello estudiamos el problema de
asociación.
Ambas Variables Ordinales
El uso de la tabla de contingencia y su
correspondiente diagrama de barras es de gran
utilidad para asociar variables cualitativas en
escala ordinal.
Ésta tabla se presenta con las frecuencias
relativas condicionadas a las clases de una de
las variables
Posición respecto al horario de verano
60.00
45.00
30.00
15.00
0.00
Bajo Medio Alto
Desacuerdo Indiferente Acuerdo
Posiciónrespectoalhorariodeverano
Desacuerdo Indiferente Acuerdo Total
Nivel
Socioeconóm
ico
Bajo
Medi
o
Alto
23.90
47.02
20.69
49.02
31.93
36.21
27.07
21.05
43.10
100.00
100.00
100.00
¿A mayor nivel
socioeconómico,
mayor aceptación?
asociación ...
asociación ...
Una Variable Ordinal y otra
Cuantitativa
Una manera de evidenciar la posible asociación
entre las variables es a través del diagrama
esquemático.
Éste diagrama nos da una idea de cómo
dependen la variable cuantitativa, no solo en
localización sino también en dispersión con
respecto al aumento o disminución en escala de
la variable cualitativa ordinal.
Grado Escolar
Maternal Kinder I Kinder II
68 255 425
35 202 370
145 317 380
173 327 476
190 247 410
225 100 358
340 448 338
123 412 373
228 228 377
192 467
297 388
Kinder II
Kinder I
Maternal
500
400
300
200
100
0
Habilidad
de
Lenguaje
¿Qué nos dice
este diagrama
esquemático?
asociación ...
Ambas Variables Cuantitativas
Para este caso el diagrama de dispersión es muy
usado para asociar variables cuantitativas.
Consiste en graficar parejas de valores ( xi , yi )
correapondientes a un solo individuo, sobre un
plano cartesiano.
Una medida de asociación que complementa este
diagrama es el coeficiente de correlación (medida
de relación lineal entre las variables) obtenido
como
asociación...
xy
i
i
SxSy
S

Y Y



n
i1
2
n
i1
n
i1
r(x, y) 
/(n1)
X  X2
/(n1)
X XY Y/(n1)
i i
30
40
50
60
70
80
90
100
160 170 180 190 200
100
90
80
70
60
50
40
30
140 150 160 170 180 190 200
0
10
20
30
40
50
70
60
80
140 150 160 170 180 190 200
30
80
130
180
230
280
330
140 150 160 170 180 190 200
r = 0.8 r = 0.1
140 150
r = 0.99 r = - 0.7
¿Se puede decir que si r es cero, las variables son independientes?
asociación ...
Edad versus Tiempo
75
60
45
30
15
0
0 10000 30000 40000
20000
Tiempo
Edad
r = 0.130
¿Existe alguna relación lineal
entre el tiempo que tomó
correr el maratón y la edad de
los participantes? ¿Confirma
el valor de r esta relación?
asociación ...

Más contenido relacionado

Similar a EstadisticaDescriptiva.pptx

PPT-de-Medidas-de-Tendencias-Centrales -bunoooooo.pdf
PPT-de-Medidas-de-Tendencias-Centrales -bunoooooo.pdfPPT-de-Medidas-de-Tendencias-Centrales -bunoooooo.pdf
PPT-de-Medidas-de-Tendencias-Centrales -bunoooooo.pdfvernersalcedo
 
Trabajo estadistica descriptiva ejemplo
Trabajo estadistica descriptiva ejemploTrabajo estadistica descriptiva ejemplo
Trabajo estadistica descriptiva ejemploJudith Espinoza
 
Estadística por Edison Iza
Estadística por Edison Iza Estadística por Edison Iza
Estadística por Edison Iza EdisonIza7
 
Análisis estadísticos.
Análisis estadísticos.Análisis estadísticos.
Análisis estadísticos.Neña Astur
 
Estadistica y probabilidad
Estadistica y probabilidadEstadistica y probabilidad
Estadistica y probabilidadAndre Santillan
 
3ra psicologia medidas de tendencia central
3ra psicologia  medidas de tendencia central3ra psicologia  medidas de tendencia central
3ra psicologia medidas de tendencia centralUniv Peruana Los Andes
 
3 medidas de tendencia central y de dispersion
3   medidas de tendencia central y de dispersion3   medidas de tendencia central y de dispersion
3 medidas de tendencia central y de dispersionrbarriosm
 
Estadstica descriptiva-1230745228674108-2
Estadstica descriptiva-1230745228674108-2Estadstica descriptiva-1230745228674108-2
Estadstica descriptiva-1230745228674108-2danilosaavedra
 
Estadística I ( medidas de tendencia)
Estadística I ( medidas de tendencia)Estadística I ( medidas de tendencia)
Estadística I ( medidas de tendencia)Gabriela Silva
 
Lecciones de estadistica descriptiva
Lecciones de estadistica descriptivaLecciones de estadistica descriptiva
Lecciones de estadistica descriptivamaurosc222
 
TEMA: MEDIDAS DE TENDENCIA CENTRAL, BIOESTADISTICA 2024 PRESENTACION PPT PAGI...
TEMA: MEDIDAS DE TENDENCIA CENTRAL, BIOESTADISTICA 2024 PRESENTACION PPT PAGI...TEMA: MEDIDAS DE TENDENCIA CENTRAL, BIOESTADISTICA 2024 PRESENTACION PPT PAGI...
TEMA: MEDIDAS DE TENDENCIA CENTRAL, BIOESTADISTICA 2024 PRESENTACION PPT PAGI...cinthyabalbis1
 
Cap 3c2 medidas numéricas si agrupadas
Cap 3c2   medidas numéricas si  agrupadasCap 3c2   medidas numéricas si  agrupadas
Cap 3c2 medidas numéricas si agrupadasleydycabade
 

Similar a EstadisticaDescriptiva.pptx (20)

PPT-de-Medidas-de-Tendencias-Centrales -bunoooooo.pdf
PPT-de-Medidas-de-Tendencias-Centrales -bunoooooo.pdfPPT-de-Medidas-de-Tendencias-Centrales -bunoooooo.pdf
PPT-de-Medidas-de-Tendencias-Centrales -bunoooooo.pdf
 
Trabajo estadistica descriptiva ejemplo
Trabajo estadistica descriptiva ejemploTrabajo estadistica descriptiva ejemplo
Trabajo estadistica descriptiva ejemplo
 
Estadística por Edison Iza
Estadística por Edison Iza Estadística por Edison Iza
Estadística por Edison Iza
 
Biometria clase 1_2a
Biometria clase 1_2aBiometria clase 1_2a
Biometria clase 1_2a
 
medidasestadisti cont.pptx
medidasestadisti cont.pptxmedidasestadisti cont.pptx
medidasestadisti cont.pptx
 
Variables
VariablesVariables
Variables
 
Análisis estadísticos.
Análisis estadísticos.Análisis estadísticos.
Análisis estadísticos.
 
Estadistica y probabilidad
Estadistica y probabilidadEstadistica y probabilidad
Estadistica y probabilidad
 
3ra psicologia medidas de tendencia central
3ra psicologia  medidas de tendencia central3ra psicologia  medidas de tendencia central
3ra psicologia medidas de tendencia central
 
Biometria clase 3
Biometria clase 3Biometria clase 3
Biometria clase 3
 
Biometria clase 3
Biometria clase 3Biometria clase 3
Biometria clase 3
 
3 medidas de tendencia central y de dispersion
3   medidas de tendencia central y de dispersion3   medidas de tendencia central y de dispersion
3 medidas de tendencia central y de dispersion
 
Estadstica descriptiva-1230745228674108-2
Estadstica descriptiva-1230745228674108-2Estadstica descriptiva-1230745228674108-2
Estadstica descriptiva-1230745228674108-2
 
Estadística I ( medidas de tendencia)
Estadística I ( medidas de tendencia)Estadística I ( medidas de tendencia)
Estadística I ( medidas de tendencia)
 
Nota de clase estad1
Nota de clase estad1Nota de clase estad1
Nota de clase estad1
 
Estadistica tercera clase
Estadistica  tercera claseEstadistica  tercera clase
Estadistica tercera clase
 
Lecciones de estadistica descriptiva
Lecciones de estadistica descriptivaLecciones de estadistica descriptiva
Lecciones de estadistica descriptiva
 
07 estadistica basica
07 estadistica basica07 estadistica basica
07 estadistica basica
 
TEMA: MEDIDAS DE TENDENCIA CENTRAL, BIOESTADISTICA 2024 PRESENTACION PPT PAGI...
TEMA: MEDIDAS DE TENDENCIA CENTRAL, BIOESTADISTICA 2024 PRESENTACION PPT PAGI...TEMA: MEDIDAS DE TENDENCIA CENTRAL, BIOESTADISTICA 2024 PRESENTACION PPT PAGI...
TEMA: MEDIDAS DE TENDENCIA CENTRAL, BIOESTADISTICA 2024 PRESENTACION PPT PAGI...
 
Cap 3c2 medidas numéricas si agrupadas
Cap 3c2   medidas numéricas si  agrupadasCap 3c2   medidas numéricas si  agrupadas
Cap 3c2 medidas numéricas si agrupadas
 

Más de CesarMejia625886

dokumen.tips_hematologia-serie-blanca.ppt
dokumen.tips_hematologia-serie-blanca.pptdokumen.tips_hematologia-serie-blanca.ppt
dokumen.tips_hematologia-serie-blanca.pptCesarMejia625886
 
pruebas-de-funcion-hepatica-160614020338.pdf
pruebas-de-funcion-hepatica-160614020338.pdfpruebas-de-funcion-hepatica-160614020338.pdf
pruebas-de-funcion-hepatica-160614020338.pdfCesarMejia625886
 
pruebas-de-funcion-hepatica-160614020338.pptx
pruebas-de-funcion-hepatica-160614020338.pptxpruebas-de-funcion-hepatica-160614020338.pptx
pruebas-de-funcion-hepatica-160614020338.pptxCesarMejia625886
 
investigacion documental.pptx
investigacion documental.pptxinvestigacion documental.pptx
investigacion documental.pptxCesarMejia625886
 

Más de CesarMejia625886 (7)

dokumen.tips_hematologia-serie-blanca.ppt
dokumen.tips_hematologia-serie-blanca.pptdokumen.tips_hematologia-serie-blanca.ppt
dokumen.tips_hematologia-serie-blanca.ppt
 
pruebas-de-funcion-hepatica-160614020338.pdf
pruebas-de-funcion-hepatica-160614020338.pdfpruebas-de-funcion-hepatica-160614020338.pdf
pruebas-de-funcion-hepatica-160614020338.pdf
 
pdf-biblioteca-268.pdf
pdf-biblioteca-268.pdfpdf-biblioteca-268.pdf
pdf-biblioteca-268.pdf
 
pruebas-de-funcion-hepatica-160614020338.pptx
pruebas-de-funcion-hepatica-160614020338.pptxpruebas-de-funcion-hepatica-160614020338.pptx
pruebas-de-funcion-hepatica-160614020338.pptx
 
REFERENCIAS APA.ppt
REFERENCIAS APA.pptREFERENCIAS APA.ppt
REFERENCIAS APA.ppt
 
investigacion documental.pptx
investigacion documental.pptxinvestigacion documental.pptx
investigacion documental.pptx
 
clase-uno-15-8-2012.pptx
clase-uno-15-8-2012.pptxclase-uno-15-8-2012.pptx
clase-uno-15-8-2012.pptx
 

Último

Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónLourdes Feria
 
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARONARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFAROJosé Luis Palma
 
30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdfgimenanahuel
 
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptxTECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptxKarlaMassielMartinez
 
la unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fiscala unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fiscaeliseo91
 
Dinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dDinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dstEphaniiie
 
Sesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxSesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxMaritzaRetamozoVera
 
Identificación de componentes Hardware del PC
Identificación de componentes Hardware del PCIdentificación de componentes Hardware del PC
Identificación de componentes Hardware del PCCesarFernandez937857
 
Heinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativoHeinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativoFundación YOD YOD
 
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptxEXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptxPryhaSalam
 
MAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMarjorie Burga
 
Lecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadLecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadAlejandrino Halire Ccahuana
 
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSTEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSjlorentemartos
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIACarlos Campaña Montenegro
 
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzel CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzprofefilete
 
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptxSINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptxlclcarmen
 
Neurociencias para Educadores NE24 Ccesa007.pdf
Neurociencias para Educadores  NE24  Ccesa007.pdfNeurociencias para Educadores  NE24  Ccesa007.pdf
Neurociencias para Educadores NE24 Ccesa007.pdfDemetrio Ccesa Rayme
 
celula, tipos, teoria celular, energia y dinamica
celula, tipos, teoria celular, energia y dinamicacelula, tipos, teoria celular, energia y dinamica
celula, tipos, teoria celular, energia y dinamicaFlor Idalia Espinoza Ortega
 
UNIDAD DPCC. 2DO. DE SECUNDARIA DEL 2024
UNIDAD DPCC. 2DO. DE  SECUNDARIA DEL 2024UNIDAD DPCC. 2DO. DE  SECUNDARIA DEL 2024
UNIDAD DPCC. 2DO. DE SECUNDARIA DEL 2024AndreRiva2
 
Historia y técnica del collage en el arte
Historia y técnica del collage en el arteHistoria y técnica del collage en el arte
Historia y técnica del collage en el arteRaquel Martín Contreras
 

Último (20)

Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcción
 
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARONARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
 
30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf
 
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptxTECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
 
la unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fiscala unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fisca
 
Dinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dDinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes d
 
Sesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxSesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docx
 
Identificación de componentes Hardware del PC
Identificación de componentes Hardware del PCIdentificación de componentes Hardware del PC
Identificación de componentes Hardware del PC
 
Heinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativoHeinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativo
 
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptxEXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
 
MAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grande
 
Lecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadLecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdad
 
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSTEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
 
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzel CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
 
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptxSINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
 
Neurociencias para Educadores NE24 Ccesa007.pdf
Neurociencias para Educadores  NE24  Ccesa007.pdfNeurociencias para Educadores  NE24  Ccesa007.pdf
Neurociencias para Educadores NE24 Ccesa007.pdf
 
celula, tipos, teoria celular, energia y dinamica
celula, tipos, teoria celular, energia y dinamicacelula, tipos, teoria celular, energia y dinamica
celula, tipos, teoria celular, energia y dinamica
 
UNIDAD DPCC. 2DO. DE SECUNDARIA DEL 2024
UNIDAD DPCC. 2DO. DE  SECUNDARIA DEL 2024UNIDAD DPCC. 2DO. DE  SECUNDARIA DEL 2024
UNIDAD DPCC. 2DO. DE SECUNDARIA DEL 2024
 
Historia y técnica del collage en el arte
Historia y técnica del collage en el arteHistoria y técnica del collage en el arte
Historia y técnica del collage en el arte
 

EstadisticaDescriptiva.pptx

  • 1. Estadística descriptiva INSTITUTO MEXICANO DEL SEGURO SOCIAL COORDINACIÓN DE EDUCACIÓN EN SALUD Unidad didáctica: Metodología de la investigación II Docente: QFB Jaime Cesar Mejía Reséndiz
  • 2. Estadística es la ciencia, pura y aplicada, de creación, desarrollo y de aplicación de técnicas tales que la incertidumbre de la inferencia inductiva pueda ser evaluada
  • 3. Tomar decisiones es una gran responsabilidad. Para tomar decisiones se requiere INFORMACIÓN disponible, esperanzadamente confiable y útil. Generalmente se necesita una porción de la base de datos o muestra para revelar un patrón lógico o realizar un análisis estadístico.
  • 5. Objetivo de la Estadística Descriptiva Conocer la información que se tiene para poder identificar e interpretar aspectos relevantes de una muestra. Utilizar esta información para obtener resultados, planear o hacer inferencia acerca de la población bajo estudio.
  • 6. Los datos son la materia prima del estadístico. Usa los números para interpretar la realidad. Todos los problemas estadísticos involucran o la recolecta, la descripción y el análisis de los datos, o pensar cómo recolectar, describir y hacer el análisis de los datos. 0 8 3 4 7 8 9 6 3 3 1 5 05 3 8 2 9
  • 8. Tengo un 98% de probabilidad de hacer algo que tenga sentido con estos números. 0 8 3 4 7 8 9 6 3 3 1 5 05 3 8 2 9
  • 9. El conjunto de datos que describen un fenómeno (nuestro objetivo) constituyen lo que se llama Población Una Muestra es un subconjunto de la población sobre la cual vamos a realizar las medidas sobre una o mas características de interés
  • 10. ¿Por qué muestreamos? - Poblaciones muy grandes - Respuesta rápida - Destrucción de la muestra muestreo ...
  • 11. Una característica importante de una muestra es que sea Representativa de la población de interés. Cualquiera que sea nuestro objetivo: describir a la población, analizar o pronosticar el comportamiento de la población, la muestra, al ser representativa, será Confiable muestreo ...
  • 12. - Cada unidad tiene la misma oportunidad de ser elegida MuestreoAleatorio - La selección de una unidad no tiene influencia sobre la elección de otra unidad muestreo ...
  • 13. Muestreo Estratificado  Muestreo por Conglomerado  - Divide a la población en grupos  -Se extrae una muestra aleatoria simple de los grupos  -Se muestrean todos los elementos del grupo seleccionado - Divide a la población en grupos homogéneos - Se extrae una muestra aleatoria simple de cada grupo o estrato muestreo ...
  • 14. Muestreo Sistemático - Se elige aleatoriamente a una unidad - A partir de ésta se selecciona cada k-ésima unidad que se encuentra después de la elegida Muestreo Oportunista -Se muestrean los n primeros elementos que se presentan muestreo ...
  • 15. Un parámetro es una medida numérica de un aspecto de la población     Una estadística es una medida numérica de un aspecto de la muestra X, S, n, X ~ Una estadística consiste de un conjunto de mediciones de dicha característica que varía de una observación (unidad experimental) a otra, y a estas mediciones las llamaremos variable
  • 16. No todas las variables son numéricas entonces podemos clasificarlas de acuerdo a su tipo en: Cualitativas: Son variables que denotan una cualidad o atributo y solo pueden ser clasificadas en categorías o clases mutuamente excluyentes y exhaustivas Cuantitativas: Son aquellas variables que se obtuvieron de un proceso de conteo (discretas) o medición (contínuas)
  • 17. Clasificación de las variables Cualitativas de acuerdo a su escala de medición: Nominal: Son clasificadas en categorías, sin importar el orden. No tiene sentido hacer operaciones aritméticas con ellas (género, grupo sanguíneo, Fuma (si/no)) Ordinal: Las categorías se pueden arreglar en orden, pero las distancias entre las clases no son iguales (intensidad del dolor, escolaridad, nivel socioeconómico)
  • 18. Clasificación de las variables Cuantitativas de acuerdo a su escala de medición: Intervalo: Son medidas en las que las distancias entre los valores es significativa pero no existe un cero absoluto (el cero no es ausencia de atributo) . No tiene sentido hacer cociente o producto (temperatura, usos horarios) Razón: Las proporciones y razones tienen sentido al determinar cuánto mas tiene una unidad que otra de alguna característica. (peso, ingreso, rendimiento)
  • 19. El análisis de cada variable se hace de acuerdo a su escala de medición Podemos hacer diagramas, tablas y resúmenes numéricos de los datos recopilados
  • 20. ¿Cómo presentar los datos? La frecuencia absoluta particular es el número de observaciones que caen en cada clase. n La frecuencia relativa o porcentaje para una clase particular es su frecuencia absoluta entre el número total de observaciones fi i p  fi para una clase
  • 21. Esta frecuencia ayuda a sumarizar en forma ordenada la información contenida en la muestra tanto en tablas como en gráficas. tabla de distribución de frecuencias diagrama de barras género frecuencia porcentaje 0 19 0.63 1 1 1 0.37 T otal 30 1 H istograma 0.75 0.50 0.25 0.00 M F G énero Frecuencia
  • 22. Si las variables son cuantitativas discretas las tablas de frecuencias se realizan con la creación de diferentes clases en base a los datos que toma la variable. edad frecuencia porcentaje 38 3 0.10 39 3 0.10 40 6 0.20 41 1 0.03 42 3 0.10 43 2 0.07 44 4 0.13 45 3 0.10 46 4 0.13 47 0 0.00 48 0 0.00 49 1 0.03 Total 30 1.00 H istogramadeF recuenciasparaE dad 7 6 5 4 3 2 1 0 38 39 40 41 42 43 44 45 46 47 48 49 Edad Frecuencia
  • 23. Si las variables son cuantitativas continuas las tablas de frecuencias se realizan con la creación de intervalos numéricos que formarán las diferentes clases. tie m p o fre c u e n c ia p o rc e n ta je 9 3 3 1 - 9 9 3 1 1 0 .0 3 9 9 3 1 -1 0 5 3 1 1 0 .0 3 1 0 5 3 1 -1 1 1 3 1 3 0 .1 0 1 1 1 3 1 -1 1 7 3 1 6 0 .2 0 1 1 7 3 1 -1 2 3 3 1 5 0 .1 7 1 2 3 3 1 -1 2 9 3 1 5 0 .1 7 1 2 9 3 1 -1 3 5 3 1 6 0 .2 0 1 3 5 3 1 -1 3 0 .1 0 Histograma 0.30 0.20 0.10 0.00 9631 10231 10831 11431 12031 12631 13231 13831 Tiempo Frecuenci a
  • 24. tie m p o (se g ) fre c u e n c ia p o rc e n ta je F re c . A c u m . 9 6 3 1 1 0 .0 3 3 0 .0 3 3 1 0 2 3 1 1 0 .0 3 3 0 .0 6 7 1 0 8 3 1 3 0 .1 0 0 0 .1 6 7 1 1 4 3 1 6 0 .2 0 0 0 .3 6 7 1 2 0 3 1 5 0 .1 6 7 0 .5 3 3 1 2 6 3 1 5 0 .1 6 7 0 .7 0 0 1 3 2 3 1 6 0 . 2 0 0 0 .9 0 0 1 3 8 3 1 3 0 .1 0 0 1 .0 0 0 T o ta l 3 0 1 .0 0 Podemos completar esta tabla de frecuencias con una columna que nos de las Frecuencias Acumuladas ¿qué uso tienen? a) ¿qué frecuencia de individuos tuvieron un tiempo menor a 11,431 seg? b) ¿qué porcentaje de individuos tuvieron un tiempo mayor o igual a 12,631 seg? c) ¿qué tiempo máximo es el que al menos el 50% de las personas tuvieron? a) 0.167 c) 46.7% e) 12,031 seg
  • 25. Otros diagramas de utilidad: 3 38 0 0 0 6 39 0 0 0 12 40 0 0 0 0 0 0 13 41 0 (3) 42 0 0 0 14 43 12 44 8 45 0 0 0 0 0 0 0 0 0 5 46 0 0 0 0 1 47 1 48 1 49 0 -se usa con pocos valores -los datos están ordenados -encontramos fácilmente mínimo y máximo -encontramos fácilmente los porcentiles -da una visión gráfica de la distribución de los datos diagrama de tallo y hojas para la variable edad 38|0 = 38.0
  • 26. Diagrama de puntos. Útil para cuando tenemos pocos datos discretos : . . : . : . : : : : . : : : : : . + + + + + + Edad 38.0 40.0 42.0 44.0 46.0 48.0 Polígono de Frecuencias Ojiva PolígonodeFrecuencia 8 6 4 2 0 9000 10000 11000 13000 14000 12000 Tiempo Frecuencia Ojiva 1.00 0.75 0.50 0.25 0.00 9000 10000 13000 14000 11000 12000 Tiempo Porcentaje Acumulado
  • 27. Métodos Numéricos (válidos solo para datos cuantitativos) 0 9 8 4 3 1 0 0 8 9 3 9 8 4 2 32 1 5 0 0 3 8 5 3 5 3 30 Si pudiéramos escoger entre dos números que nos ayuden a construir una imagen mental burda de la distribución de un bonche de datos ¿Cuáles escogeríamos? -un número que esté localizado cerca del centro de la distribución 8 4 3 0 0 0 9 19 9 3 8 8 8 4 378 89 897 9 6 6 9 3 0304 3 758 8 3 3 2 0 48 9 75 68 9 6 5 2 5 0 3 3 31 3 1 9 51 8 8 4 378 7 68 9 6 6 6 3 3 2 0 2 3 2 3 325 1 5 53 1 5 5 3 8 75 3 304 8 9 3 75 3 30 59 -un número que mida la dispersión de la distribución
  • 28. Medidas de Dispersión Son números que indican qué tan separados están los datos entre si: rango, desviación estándar, rango intercuartil Polígono de Frecuencia 8 6 4 2 0 9000 10000 11000 13000 14000 12000 Tiempo Frecuencia Medidas de Tendencia Central Son números que se localizan cerca del centro o cerca de donde se encuentran los datos con mayor frecuencia: media, mediana, moda
  • 29. Medidas de tendencia central  n i x X  i1 1 n   i  n   fi  m  X a  k i1 tie m p o (s e g ) fre c u e n c i a p o rc e n ta j e F re c . A c u m . 9 6 3 1 1 0 .0 3 0 .0 3 1 0 2 3 1 1 0 .0 3 0 .0 7 1 0 8 3 1 3 0 .1 0 0 .1 7 1 1 4 3 1 6 0 .2 0 0 .3 7 1 2 0 3 1 5 0 .1 7 0 .5 3 1 2 6 3 1 5 0 .1 7 0 .7 0 1 3 2 3 1 6 0 .2 0 0 .9 0 1 3 8 3 1 3 0 .1 0 1 .0 0 T o ta l 3 0 1 en el caso en que los datos estén agrupados: media X a  9631(0.03) 10231(0.03)  10831(0.10)  13831(0.10) 12,187
  • 30. mediana y se observa se localiza el valor central el valor que toma 2 lX ~ n1 3 38 0 0 0 6 39 0 0 0 12 40 0 0 0 0 0 0 13 41 0 (3) 42 0 0 0 14 43 0 0 12 44 0 0 0 0 8 45 0 0 0 5 46 0 0 0 0 1 47 1 48 1 49 0 2 ~ 15.5 301 lX el valor que toma la variable es 42.0 años medidas de tendencia central ...
  • 31. a pm  A 0.5Pm1 B  A X ~ donde A y B son los límites inferior y superior de la clase que contiene a la mediana, Pm-1 es la frecuencia acumulada hasta la clase anterior a la que contien la mediana y pm es la frecuencia relativa de la clase que contiene a la mediana para datos agrupados se estima como tiempo frec. porc. Frec Acum 9331- 9931 1 0.033 0.033 9931-10531 1 0.033 0.067 1 0 5 3 1 -1 1 1 3 1 3 0 . 1 0 0 0 . 1 6 7 1 1 1 3 1 -1 1 7 3 1 6 0 . 2 0 0 0 . 3 6 7 1 1 7 3 1 -1 2 3 3 1 5 0 . 1 6 7 0 . 5 3 3 1 2 3 3 1 -1 2 9 3 1 5 0 . 1 6 7 0 . 7 0 0 1 2 9 3 1 -1 3 5 3 1 6 0 . 2 0 0 0 . 9 0 0 medidas de tendencia central ... 600 ~ 0.167 0.50.367 11731 a X
  • 32. moda es el valor con la frecuencia mas alta. La distribución puede ser unimodar, multimodal cuando los datos están agrupados podemos hablar de una clase modal o estimar la moda: donde A y B son los límites inferior y superior de la clase modal, d1= fmo – fmo-1 y d2= fmo – fmo+1 Mo  A  B  A d1d2 d1 medidas de tendencia central ...
  • 33. Medidas de Dispersión rango se define como la diferencia entre el valor máximo y el mínimo: Rango = max - min Es una medida sensible a valores extremos y no es muy informativa ya que es insensible a datos intermedios amplitud intercuartílica es la distancia entre el porcentil 75 y el porcentil 25: AI = P75 - P25 Nos da una idea de la distancia entre los valores que determinan el 50% de los datos centrales
  • 34. Varianza es una variación promedio alrededor de la media, definida como  n 1 X  X 2 S2  n i1 i un problema de la varianza es que tiene las unidades al cuadrado y su interpretación no es fácil, por lo que usamos su raiz: desviación estándar 2  X  X  S  n i 1 i n 1 es sensible a valores extremos. Si los datos están agrupados en k intervalos, la varianza se estima como: 2 2  f m  X  S  k i1 a i i n1 a para nuestro ejemplo ¿qué valor toma 2 Sa ? medidas de dispersión...
  • 35. Hay algunas formas de poner juntos a la desviación estándar y a la media muestrales Coeficiente de Variación: es una medida de variación relativa y expresa la desviación estándar como un porcentaje de la media aritmética. Se obtiene como CV  S x100 X por su falta de dimensiones es muy útil para comparar variación entre diferentes poblaciones, que a simple vista serían difíciles de comparar. medidas de dispersión...
  • 36. Creación de Intervalos: observaciones que caen dentro de ese intervalo.  Si nuestra distribución muestral tiene una forma mas o menos simétrica y acampanada podemos usar la regla empírica:  alrededor del 69% de las observaciones cae dentro de una desviación estándar de la media  alrededor del 95% de las observaciones cae dentro de dos desviaciones estándar de la y obtener el número de con S y X se pueden formar intervalos de la forma X kS medidas de dispersión...
  • 37. 0 5 10 15 20 25 Frecuen cia 1 3 5 7 9 11 13 15 17 19 21 s s Intervalos alrededor de la media X s X 2s X 3s (7.57 , 15.75) (3.48 , 19.84) (-0.61 , 23.93) n = 372 X = 11.66 s = 4.089 2s 2s 3s 3s X 264 obs. 70.96% 353 obs. 94.89% 372 obs. 100.00% Monóxido de Carbono en el humo de los cigarros medidas de dispersión...
  • 38. Medidas de Posición Relativa Son medidas descriptivas que localizan la posición de una medición en relación a otras mediciones. Una medida que expresa esta posición en términos de un porcentaje es llamado porcentil El porcentil de orden  (P ) es el valor de la variable por debajo del cual se encuentra una frecuencia acumulada .
  • 39. El porcetil 25 o primer cuartil Q1 = - 0.675 deja a su izquierda el 25% de las observaciones El porcetil 70, es decir, P70 = 0.525 deja a su izquierda el 70% de las observaciones medidas de posición relativa...
  • 40. El diagrama de tallo y hojas, nos ayuda a localizarlos rápidamente  -los datos se ordenan de menor a mayor  -se encuentra la localización de los porcentiles: 3 38 0 0 0 6 39 0 0 0 12 40 0 0 0 0 0 0 13 41 0 (3) 42 0 0 0 14 43 0 0 12 44 0 0 0 0 8 45 0 0 0 5 46 0 0 0 0 1 47 1 48 1 49 0 -se lee el valor de dicha observación -si la localización es fraccionaria se toma el promedio del valor en la localización anterior y posterior los porcentiles no necesariamente son números observados  100    l(P )    (n)  medidas de posición relativa...
  • 41. 1 9 6 3 10 2 3 6 10 6 7 9 11 11 0 1 3 3 3 (5) 11 7 7 8 8 8 14 12 0 0 1 2 3 9 12 6 6 9 9 5 13 0 2 3 3 4 l(Q1) = (25/100)31 = 7.75  Q1 = P25 = 11.05 l(Q3) = (75/100)31 = 23.25  Q3 = P75 = 12.65 2 l(Q ) = (50/100)31 = 15.5 2  Q = P50 = 11.8 Los cuartiles Q1 y Q3 son muy útiles para construir lo que llamamos diagrama de caja y brazos. medidas de posición relativa...
  • 42. 25000 20000 15000 10000 Tie mpo Diagrama de Caja y Brazos Nos permite ver la distribución de los datos, el máximo, el mínimo, la localización de los Cuartiles, y la dispersión por cuartiles. Nos permitirá ver si existe un sesgo así como puntos extremos.
  • 43. Para hacer estadística diferente a la descriptiva, podemos usar todas las técnicas hasta ahora aprendidas y hacer algún análisis comparativo o asociativo. El problema de comparación consiste en contrastar las distribuciones de frecuencia de una variable de interés para dos o mas subpoblaciones basándose en los datos de la muestra. Análisis Exploratorio de Datos
  • 44. En el problema de comparación surgen algunas preguntas: ¿Hay alguna diferencia en las distribuciones poblacionales? ¿Cuál es la naturaleza de esas diferencias? ¿Qué tan grandes son esas diferencias? El análisis exploratorio nos ayudará a darnos una idea de las respuestas a estas preguntas
  • 45. La comparación de las distribuciones de frecuencia entre subpoblaciones cuando la variable de interés es cualitativa se hace con: Hábitos de tabaquismo Género Nunca ha fumado Dejó de fumar Fuma actualmente Total Masculino 154 25 185 364 Femenino 127 11 38 176 Total 281 36 223 540 una tabla de contingencias o tabulación cruzada las frecuencias pueden ser realtivas o absolutas y nos dan una idea de qué tan frecuente se presentan simultáneamente ambos atributos en una población comparación...
  • 46. El objetivo de la comparación es ver si una característica determinada varía relativo a alguna subclase, por lo que se calculan las frecuencias relativas condicionales fij / fi ó pij / pi (de ésta manera compensamos por diferencias de tamaños) ... Hábitos de tabaquismo (%) Género Nunca ha fumado Dejó de fumar Fuma actualmente Total Masculino 28.5 4.6 34.3 67.4 Femenino 23.5 2.1 7.0 32.6 Total 52.0 6.7 41.3 100 comparación...
  • 47. ... y calculamos las frecuencias relativas condicionadas a género ¿el hábito de tabaquismo difiere si se es hombre o mujer? Hábitos de tabaquismo condicionadas a género (%) Género Nunca ha fumado Dejó de fumar Fuma actualmente Total Masculino 42.3 6.8 50.9 100 Femenino 72.1 6.5 21.5 100 Total 52.0 6.7 41.3 100 Hábito de Tabaquismo por Género 0.0 20.0 40.0 60.0 80.0 Nunca ha fumado Dejó de fumar Fuma actualmente Frecuencia Masculino Femenino comparación...
  • 48. 0.00 15.00 30.00 45.00 Distribución de Edad por Género Masculino Femenino Si la variable a analizar es discreta se puede tratar como si fuera cualitativa. comparación... Edad en años condicionada a género (%) Género 39 40 41 42 Total Masculino 10.53 21.05 42.11 26.32 100 Femenino 36.36 18.18 18.18 27.27 100 Total 20.00 20.00 33.33 26.67 100 39 40 41 42 ¿hay alguna diferencia entre géneros con respecto a la edad?
  • 49. F M 0 10000 20000 30000 Género Orden llegada Tiempos por Género En el caso de que la variable a analizar sea contínua podemos estar interesados en comparar tanto la localización como la dispersión entre las distribuciones de frecuencia de las subpoblaciones. Una manera de hacerlo es por medio de un diagrama esquemático comparación... ¿Quién tiene tiempos más altos? ¿quién tiene mayor dispersión?
  • 50. Muchas veces es importante saber si una variable influye sobre el comportaminto de otra variable. Con ello estudiamos el problema de asociación. Ambas Variables Ordinales El uso de la tabla de contingencia y su correspondiente diagrama de barras es de gran utilidad para asociar variables cualitativas en escala ordinal. Ésta tabla se presenta con las frecuencias relativas condicionadas a las clases de una de las variables
  • 51. Posición respecto al horario de verano 60.00 45.00 30.00 15.00 0.00 Bajo Medio Alto Desacuerdo Indiferente Acuerdo Posiciónrespectoalhorariodeverano Desacuerdo Indiferente Acuerdo Total Nivel Socioeconóm ico Bajo Medi o Alto 23.90 47.02 20.69 49.02 31.93 36.21 27.07 21.05 43.10 100.00 100.00 100.00 ¿A mayor nivel socioeconómico, mayor aceptación? asociación ...
  • 52. asociación ... Una Variable Ordinal y otra Cuantitativa Una manera de evidenciar la posible asociación entre las variables es a través del diagrama esquemático. Éste diagrama nos da una idea de cómo dependen la variable cuantitativa, no solo en localización sino también en dispersión con respecto al aumento o disminución en escala de la variable cualitativa ordinal.
  • 53. Grado Escolar Maternal Kinder I Kinder II 68 255 425 35 202 370 145 317 380 173 327 476 190 247 410 225 100 358 340 448 338 123 412 373 228 228 377 192 467 297 388 Kinder II Kinder I Maternal 500 400 300 200 100 0 Habilidad de Lenguaje ¿Qué nos dice este diagrama esquemático? asociación ...
  • 54. Ambas Variables Cuantitativas Para este caso el diagrama de dispersión es muy usado para asociar variables cuantitativas. Consiste en graficar parejas de valores ( xi , yi ) correapondientes a un solo individuo, sobre un plano cartesiano. Una medida de asociación que complementa este diagrama es el coeficiente de correlación (medida de relación lineal entre las variables) obtenido como asociación... xy i i SxSy S  Y Y    n i1 2 n i1 n i1 r(x, y)  /(n1) X  X2 /(n1) X XY Y/(n1) i i
  • 55. 30 40 50 60 70 80 90 100 160 170 180 190 200 100 90 80 70 60 50 40 30 140 150 160 170 180 190 200 0 10 20 30 40 50 70 60 80 140 150 160 170 180 190 200 30 80 130 180 230 280 330 140 150 160 170 180 190 200 r = 0.8 r = 0.1 140 150 r = 0.99 r = - 0.7 ¿Se puede decir que si r es cero, las variables son independientes? asociación ...
  • 56. Edad versus Tiempo 75 60 45 30 15 0 0 10000 30000 40000 20000 Tiempo Edad r = 0.130 ¿Existe alguna relación lineal entre el tiempo que tomó correr el maratón y la edad de los participantes? ¿Confirma el valor de r esta relación? asociación ...