2. ESTADISTICA
Ciencia, su sustento es teoría de las probabilidades
Para procesar información y tomar decisiones
Herramienta para investigación
Conjunto de métodos y procedimientos para captar, elaborar e
interpretar datos sujetos a variaciones.
Predice
fenómenos
cuantitativamente.
aleatorios
que
pueden
expresarse
Utiliza para ser inferencias validas para una población mas amplia de
características similares.
La finalidad del análisis es establecer las conclusiones a una
población donde la muestra sea representativa.
3. ESTADÍSTICA
SCHWARTS (1981)
Métodos de razonamiento, interpreta datos de la ciencias de
la vida.
Su carácter es la variabilidad.
LAST (1988)
Resumen y analiza datos sujetos a variaciones aleatorias.
4. ESTADÍSTICA DESCRIPTIVA
Comprende la organización, presentación de datos de manera
científica.
Incluye diversos métodos
gráficamente los datos.
de
organizar
y
representar
Revisa y clasifica datos.
Calcula medidas de tendencia central y de dispersión.
Representa gráficamente los datos
Comprende la organización, presentación y síntesis de datos de
manera científica
5. ESTADÍSTICA INFERENCIAL
• Describe lo que esta pasando y realiza inferencias.
• Toma decisiones probabilísticas.
• Toda generalización tiene un margen de error.
• Comprende las bases lógicas mediante las cuales se
establecen conclusiones.
6. ESTADÍSTICA INFERENCIAL
Proporciona métodos para
estimar las características
de un grupo (población)
basándose en los datos de
un
conjunto
pequeño
(muestra).
Población
Población
Muestra
7. ESTADÍSTICA EN MEDICINA
El resultado de un análisis estadístico no es un objetivo
en sí mismo, sino una herramienta para:
Comprobar o rechazar una hipótesis de trabajo,
Representar de una forma eficiente y resumida un
colectivo de observaciones, para validar un modelo de
un proceso fisiológico.
8. DATOS CUANTITATIVOS
En el grupo de datos cuantitativos tenemos:
Aquellos cuyo resultado puede variar de forma
continua, como puede ser el peso, la presión arterial,
el nivel de colesterol, etc.
Los que sólo pueden tomar valores enteros como por
ejemplo el número de hijos, el número de ingresados
en el Servicio de Ortopedia, un día concreto, etc.
9. DATOS CUALITATIVOS
Pueden ser:
Nominales, que constituyen una simple etiqueta como puede
ser el sexo, el grupo sanguíneo, etc.
Ordinales, en las que se da una relación de orden entre las
respuestas, por ej. resultado de una patología/tratamiento
(fallece, empeora, sin cambios, mejora, curación).
10. PRESENTACIÓN DE DATOS CUALITATIVOS
Indicar un valor central y uno de variabilidad o
dispersión.
Cuando es razonable suponer que los datos pueden seguir
una distribución normal, se estimará la media y la
desviación estándar.
Ejemplo: La media de la PAS fue de 139.2 ± 14.9 mmHg.
11. MEDIDAS DE TENDENCIA CENTRAL
Son valores promedios que representan a toda la muestra
de valores
Indican el punto medio de la distribución.
Nos indican en torno a que valor (centro) se distribuyen
los datos.
En una distribución de frecuencias las medidas de
tendencia central son: Media, mediana y moda.
12. MEDIA
Es un valor representativo o promedio.
x se calcula a partir de la distribución de frecuencias.
Suma l os valores de todas las observaciones y se divide por el numero total.
Ventaja. Su fácil manejo matemático y estadístico.
Se usa en datos intervalicos y proporcionales.
Limitación sensibilidad a los valores extremos
X1, x2, x3, ………xn
x = x1, x2, x3, … xn
n
x = Ʃ xi
n
13. PROPIEDADES DE LA MEDIA ARITMÉTICA
Propiedades de la media aritmética
La suma de las desviaciones de todas las puntuaciones de una
distribución respecto a la media de la misma igual a cero.
Las suma de las desviaciones de los números 8, 3, 5, 12, 10 de su media
aritmética 7.6 es igual a 0:
8 − 7.6 + 3 − 7.6 + 5 − 7.6 + 12 − 7.6 + 10 − 7.6 =
= 0. 4 − 4.6 − 2.6 + 4. 4 + 2. 4 = 0
14. CALCULO DE LA MEDIA : EJEMPLOS
1.- DATOS NO AGRUPADOS: Los pesos de 6 amigos son
84,91,72,68,87 y 78 kilos. Hallar el peso medio.
_
X = 84 +91 +72 +68 +87 + 78 =
6
480 = 80
6
15. 2.- DATOS AGRUPADOS:
Si lo s datos vienen agrupados en una
X = Σxi . fi
N
tabla de frecuencia
fi
xi · fi
[10, 20)
15
1
15
[20, 30)
25
8
200
[30,40)
35
10
350
[40, 50)
45
9
405
[50, 60
55
8
440
[60,70)
65
4
260
[70, 80)
75
2
150
42
1 820
xi
_
16. En un brote de hepatitis A, 6 personas iniciaron síntomas 24 a 31 días
después de la exposición. Calcule el promedio del período de incubación en
éste brote; los períodos de incubación para las i personas afectadas (X)
fueron: 29,31,24,29,30 y 25.
1.- Para calcular el numerador sume las observaciones individuales
x = 29+31+24+29+30+25= 168
2.- Para calcular el denominador cuente el número de las observaciones : n=6
3.- Para calcular la media divida el numerador sumatoria de las observaciones)
entre el denominador (numero de las observaciones).
media x = 29 31 24 29 30 25 = 168 = 28 días
6
6
Entonces: el promedio del período de incubación del brote es 28 días.
17. En una lista de 5 variables para 11 personas. Vamos a demostrar como se
calcula la media de cada variable (A-E) en el listado.
Persona # Variable A Variable B
1
0
0
2
0
4
3
1
4
4
1
4
5
1
5
6
5
5
7
9
5
8
9
6
9
9
6
10
10
6
11
10
10
Variable C
0
1
2
3
4
5
6
7
8
9
10
Variable D Variable E
0
0
1
6
1
7
2
7
2
7
2
8
3
8
3
8
3
9
4
9
10
10
18. 1.
Para calcular el numerador, sume todas las observaciones individuales:
A. ∑i x = 0+0+1+1+1+5+9+9+9+10+10 = 55
B. ∑i x = 0+4+4+4+5+5+5+6+6+6+10 = 55
C. ∑i x = 0+1+2+3+4+5+6+7+8+9+10 = 55
D. ∑i x = 0+1+1+2+2+2+3+3+3+4+10 = 31
E. ∑i x = 0+6+7+7+7+8+8+8+9+9+10 = 79
2
.- Para calcular el denominador cuente el número de observaciones (n=11) para cada
variable.
3.- Para calcular la media, divida el numerador (suma de las observaciones) entre el
denominador (número de las observaciones).
» Media de la variable A= 55/11= 5
» Media de la variable B= 55/11= 5
» Media de la variable C= 55/11= 5
» Media de la variable D= 31/11= 2.82
» Media de la variable E= 79/11= 7.18
19. MEDIANA
Se define a la observación equidistante de los extremos.
Es un valor que va a dividir una representación ordenada en dos partes iguales.
La mitad de las observaciones tienen valor inferior o igual a la mediana y la otra
mitad igual o mayor a la mediana.
Los cálculos se ordenan según su valor en la escala de medición.
Si N es impar la mediana será el valor correspondiente a la observación situada en
el centro
1,2, 3,4, 5,7, 9
Si N es par la mediana será la media de las variaciones centrales
3, 7, 5, 4, 2, 8, 11, 1 Ventaja : Se usa en variables ordinales
1, 2, 3, 4, 5, 7, 8, 11 Desventaja: Limitaciones de su manejo matemático.
Me= 4+5 = 4.5
2
20. MEDIDAS DE TENDENCIA CENTRAL. MEDIANA
DATOS AGRUPADOS:
La mediana es el valor de la variable que tiene la propiedad de que los valores
menores que él son tan frecuentes como los mayores que él .
X = Li +
N/2 – fd
fc
i
Rango mediano = (n+1)
2
donde: Li = Límite inferior del intervalo crítico
N = Nº total de datos
fd = Frecuencia acumulada por debajo del intervalo crítico
fc = Frecuencia del intervalo crítico
i = Amplitud del intervalo
21. fi
Fac.
151,5 – 172,5
5
5
172,5 – 193,5
7
12
193,5 – 214,5
9
21
214,5 – 235,5
6
27
235,5 – 256,5
3
30
30
INTERVALOS
X = Li +
N/2 – fd
fc
. i = 193,5 +
Rango mediano = (n+1)
2
30 /2 - 12 . 21 = 200,5
9
22. CARACTERÍSTICAS DE LA MEDIANA
Es menos sensible que la media a la variación de las puntuaciones .
Ejemplo: A 24,25,29,30,31 Media 28.0 mediana 29
B 24,25,29,30,131 Media 44.7 mediana 29
Se puede calcular aunque existan algún intervalo abierto, siempre que no
sea ese el intervalo crítico
Es más representativa cuando la distribución tiene puntuaciones muy
extremas.
23. MODA
Es el valor de mayor frecuencia en el conjunto de observaciones.
Se representa por MO
Ventaja: se usa para datos nominales.
Limitación: Puede no existir ninguna moda o existir mas de uno.
- Hallar la moda de la distribución:
2, 3, 3,4,4,4,5,5,
MO = 4
24. Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y
esa frecuencia es la máxima, la distribución es bimodal o multimodal, es
decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9
Cuando todas las puntuaciones de
frecuencia, no hay moda.
2, 2, 3, 3, 6, 6, 9, 9.
un
grupo
tienen
la misma
Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es
el promedio de las dos puntuaciones adyacentes.
0, 1, 3, 3, 5, 5, 7, 8 Mo = 4
25. CURVA NORMAL ESTADÍSTICA
Curva de Gauss o en campana.
Se caracteriza porque dado el promedio y la Ds es posible reconstruirlo y precisar el
área que existe bajo cualquier segmento.
Se extiende entre – 0 a +0 su comportamiento bajo la curva es igual a la unidad.
En ella coincide la media, mediana y moda.
Es la distribución teórica de probabilidad mas importante y se usa en la mayoría de
variables continuas biológicas.
Entre el valor central y una Ds se encuentra el 68.3 del área
Dos Ds equivale al 95%; 2.5 Ds equivale al 98.8 y 3 Ds equivale al 99.7%
26. IMPORTANCIA
Describe fenómenos biológicos ya que tiene una distribución
de este tipo para un valor promedio que establece la tendencia
central del fenómeno en medición.
Estima probabilidad de ocurrencia de diversos eventos.
La mayoría de los Test estadísticos dan por supuesto que
provienen de una distribución normal.
27. PROPIEDADES
Es simétrica, una de las partes es fiel reflejo de la otra.
La validez de la media aritmética son iguales en una distribución
normal.
El intervalo de valores o recorrido son las medidas de variabilidad.
Es la distancia entre los valores máximos y mininos.
La media, mediana y moda tienen el mismo valor.
Las colas de la curva están cada vez mas próximos al eje x.
Es unimodal .
28. INTERPRETACION
Se aplica al raciocinio de las pruebas de significación estadística
La determinación de la significación estadística es un fenómeno probabilístico:
Mide la probabilidad de que un evento sea debido al azar.
El resultado de la significación esta estrechamente ligado al numero de
observaciones realizadas.
Una diferencias estadísticamente significativa solo indica que existe una baja
probabilidad de que el azar explique la diferencia.
El limite de significación para que el hallazgo se considere significativo tiene que
ser igual o menor a 0.05 %.
La dos probalidades de error:
- Error tipo 1 o @ existe diferencia significativa cuando de hecho no
diferencia real.
- Error tipo 2 o ɞ no existe la diferencia cuando en verdad existe
existe
34. MEDIDAS DE ORDEN
Permiten conocer otros puntos característicos
de la distribución que no son los valores
centrales.
Cuartiles, deciles y percentiles.
35. PERCENTILES
Los percentiles dividen en dos partes las observaciones.
Por ejemplo, el percentil 20, P20, es el valor que deja por
debajo un 20%
y por encima un 80% de las
observaciones.
PERCENTILES (P):
Es el valor de la variable por debajo del cual se
encuentra un
porcentaje determinado de
observaciones.
37. ÍNDICES DE POSICIÓN
CUARTILES (Q): Son los valores de la variable que dejan por debajo el:
25% de los datos ............... Primer cuartil
Q1 (25%)
50% de los datos................ Segundo cuartil Q2 (50%)
75% de los datos................ Tercer cuartil
Q3 (75%)
40. MEDIDAS DE DISPERSIÓN
Estudia lo concentrada o dispersa que está la
distribución de los datos con respecto a la media
aritmética.
Rango o recorrido, desviación media, varianza y
desviación típica o estándar, y coeficiente de variación.
41. MEDIDAS DE DISPERSIÓN
RANGO, RECORRIDO O AMPLITUD:
Es la diferencia entre los valores más grande y más pequeño de la
distribución.
Ejemplo:
En éste ejemplo se demuestra cómo se encuentran los valores
_
mínimo y máximo y el rango de los siguientes datos:
29,31,24,29,30,25.
1.- Organice los datos de menor a mayor: 24,25,29,29,30,31.
2.- Identifique los valores mínimo y máximo: mínimo=24 y máximo=31
3.- Calcule el rango: rango = máximo - mínimo =31-24=7; entonces el rango
es igual a 7.
42. RANGO INTERCUARTILICO
Es la diferencia entre el tercer cuartil y el primero (Q3 – Q1).
1. Organice las observaciones en orden ascendente.
Dados estos datos: 13, 7, 9, 15, 11, 5, 8, 4,
hay que organizarlos así: 4, 5, 7, 8, 9, 11, 13, 15.
2. Encuentre la posición del primer y el tercer cuartil. Dado que hay 8
observaciones, n = 8.
posición del primer cuartil (Q1) = (n + 1) / 4
= (8 + 1) / 4 = 2.25
posición del tercer cuartil (Q3) = 3(n + 1) / 4 = 3 x Q1
3(8 + 1) / 4 = 6.75
Así, se encuentra Q1 (1/4) de las observaciones entre 2 y 3 y Q3 es
(3/4) entre las observaciones entre 6 y 7.
43. 3. Identifique el valor del primer y el tercer cuartil.
Valor de Q1: La posición de Q1 es 2 1/4; así, el valor de Q1 es el
valor de la observación 2 más 1/4 de la diferencia entre los valores
de las observaciones 2 y 3.
Valor de la observación 3 (ver paso 1) : 7
Valor de la observación 2: 5
Q1 = 5 + 1/4( 7-5 ) = 5 + 1/4(2) = 5 + 0,5 = 5.5
44. Valor de Q3:
La posición de Q1 es 6 3/4; así, el valor de Q3 es el valor de la
observación 6 más 3/4 de la diferencia entre los valores de las
observaciones 6 y 7.
Valor de la observación 7 (ver paso 1) : 13
Valor de la observación 6: 11
Q3 = 11 + 3/4( 13-11 ) = 11 + 3/4 (2) = 11 + 1.5 = 12.5
45. 4. Calcule el rango intercuartílico como Q3 menos Q1.
Q3 = 12,5 (ver paso 3) Q1 = 5,5
Rango intercuartílico = 12,5 - 5,5 = 7
En general, se usan los cuartiles y el rango intercuartílico
para describir la variabilidad cuando se está usando la
mediana como la medida de tendencia central.
Cuando se está usando la media aritmética, hay que usar
la desviación típica.
46. VARIANZA: Es la media de los cuadrados de las diferencias entre cada valor de
la variable y la media aritmética.
_
S² = Σ (xi - X )² o bien S² = 1
_
N
N
También:
S² =
Σxi ² - X ²
N
Σxi ² - (Σxi )²
N
Para datos agrupados:
_
S² = Σfi (xi - X )² o bien S² = 1
N
N
_
También:
S² = Σfixi ² - X ²
N
Σfi . xi ² - (Σfi . xi )²
N
47. VARIANZA Y DESVIACIÓN TIPICA
Si se resta la media aritmética de cada observación, la suma de las
diferencias es cero.
Este concepto de restar la media de cada observación es la base para dos
medidas de dispersión: la varianza y la desviación típica o estándar.
Para estas medidas, hay que elevar al cuadrado las diferencias para eliminar
los números negativos.
Después, se suma el cuadrado de las diferencias y se divide por n-1 para
encontrar la "media" de las diferencias al cuadrado.
Esta "media" es la VARIANZA
48. DESVIACIÓN TÍPICA
DESVIACIÓN TÍPICA: Es la raíz cuadrada de la varianza
Para convertir la varianza a las unidades originales, hay que
obtener la raíz cuadrada. Se denomina DESVIACIÓN TIPICA
Ó ESTANDAR .
49. Valor menos la media
Diferencia
Diferencias al cuadrado
24 - 28
-4
16
25 - 28
-3
9
29 - 28
+1.0
1
29 - 28
+1.0
1
30 - 28
+2.0
4
31 - 28
+3.0
9
-7+7=0
40
168 - 168 = 0
50. Varianza = ∑ diferencias cuadráticas = 40 = 8
n-1
5
Desvío estándar= √8 = 2.83
La varianza y la desviación estándar son medidas de la desviación
o dispersión de las observaciones alrededor de la media de la
distribución.
La varianza es la media de las diferencias cuadradas de las
observaciones alrededor de la media. Se representa como "S2 " en
las fórmulas.
La desviación estándar es la raíz cuadrada de la varianza; se
representa con "s"
51. El CV es igual al cociente entre la desviación típica y la
media.
Si encontramos que el coeficiente de variación es próximo o
mayor que 0.5 y no puede haber datos negativos, la
distribución no es normal.
52. COEFICIENTE DE VARIACIÓN DE PEARSON:
Es la «desviación típica medida en unidades de media» y se mide en %; o lo
que es lo mismo, indica el tanto por ciento de la media que representa la
desviación típica. Así:
CV = S / X . 100
Una distribución tiene X = 140 y s = 28 y otra X = 150 y s = 24. ¿Cuál de
las dos presenta mayor dispersión?
La primera distribución presenta mayor dispersión.
Notas del editor
Cada
tipo variable tiene requerimientos propios en cuanto a presentación y en cuanto a las pruebas que se utilizan
para contrastar los valores entre diferentes grupos.