1. Centro de Ciencias de la Salud
Centro de Ciencias de la Salud
Departamento de Optometría
Departamento de Optometría
MAESTRÍA EN REHABILITACIÓN VISUAL
MÉTODOS ESTADÍSTICOS
ACTIVIDAD 1
RECABANDO Y DESCRIBIENDO
DATOS
Profesor:
DCC Rogelio Salinas Gutiérrez
Alumna:
Lic. Opt. Tania Lucila Soto Ortiz
Aguascalientes, Ags.
7 de Febrero de 2014
2. INDICE
INTRODUCCION……..…………………………………………………………………………………………………………………. I
REPRESENTACIONES GRÁFICAS DE VARIABLES CUALITATIVAS
DIAGRAMA DE SECTOR………………………………………………………………………………………………2
DIAGRAMA DE BARRAS……………………………………………………………………………………………..3
REPRESENTACIONES GRÁFICAS DE VARIABLES CUANTITATIVAS
VARIABLES CUANTITATIVAS DISCRETAS
DIAGRAMA DE BARRAS (DIFERENCIAL) …………………………………………………….6
DIAGRAMA DE BARRAS (ACUMULADO O INTEGRAL)…………………………….7
VARIABLES CUANTITATIVAS CONTINUAS
HISTOGRAMA (DIFERENCIAL) ……………………………………………………………………8
POLIGONO DE FRECUENCIAS (DIAGRAMA) ……………………………………………9
POLIGONO DE FRECUENCIAS ACUMULADAS (INTEGRAL) ……………………9
MEDIDAS DESCRIPTIVAS
MEDIDAS DE TENDENCIA CENTRAL
MEDIA, MEDIANA Y MODA……………………………………………………………………..10
MEDIDAS DE DISPERSIÓN
RANGO, VARIANZA Y DESVIACIÓN TÍPICA O ESTÁNDAR……………………11
ESTADÍSTICA DE POSICIÓN
PERCENTILES……………………………………………………………………………………………12
ESTADÍSTICA DE ASIMETRÍA…………………………………………………………………………………14
CONCLUSIONES…………………………………………………………………………………………………………………15
REFERENCIAS…………………………………………………………………………………………………………………….16
3. INTRODUCCIÓN
La estadística descriptiva es la rama de las matemáticas que recolecta, presenta y caracteriza un
conjunto de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela,
temperatura en los meses de verano, etc.) con el fin de describir apropiadamente las diversas características
de ese conjunto.
Al conjunto de los distintos valores numéricos que adopta un carácter cuantitativo se llama variable
estadística.
Las variables pueden ser de dos tipos:
• Variables cualitativas o categóricas: no se pueden medir numéricamente (por ejemplo: nacionalidad,
color de la piel, sexo).
• Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos anuales).
Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:
• Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos
(puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podrá ser 3.45).
• Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un
vehículo puede ser 90.4 km/h, 94.57 km/h...etc.
Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos:
• Individuo: cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si
estudiamos la altura de los niños de una clase, cada alumno es un individuo; si se estudia el precio de la
vivienda, cada vivienda es un individuo.
• Población: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información
sobre el fenómeno que se estudia. Por ejemplo, si se estudia el precio de la vivienda en una ciudad, la
población será el total de las viviendas de dicha ciudad.
• Muestra: subconjunto que seleccionado de una población. Por ejemplo, si se estudia el precio de la
vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad
(sería una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda
que es suficientemente representativo.
ORGANIZACIÓN DE LOS DATOS: DISTRIBUCIÓN DE FRECUENCIA
La distribución de frecuencia es una ordenación tabulada de los datos recopilados en una
investigación o estudio, de acuerdo a la clase o intervalo a que pertenece y con el número de veces o
frecuencias que se repite. Una distribución de frecuencias se represente por medio de tablas de frecuencia y
gráficas.
CLASES DE FRECUENCIAS
FRECUENCIA ABSOLUTA
La frecuencia absoluta de una variable estadística, es el número de veces que aparece en la muestra dicho
valor de la variable, la representaremos por fi
FRECUENCIA RELATIVA
Es una medida útil para poder comparar. La frecuencia relativa es el cociente entre la frecuencia absoluta y
el tamaño de la muestra. Generalmente se expresa en porcentaje. Se denota por fr
Donde n = Tamaño de la muestra fi = frecuencia absoluta
I
4. FRECUENCIA ABSOLUTA ACUMULADA
Para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable estadística ha de ser
cuantitativa. La frecuencia absoluta acumulada de un valor de la variable, es el número de veces que ha
aparecido en la muestra un valor menor o igual que el de la variable y lo representaremos por Fi.
FRECUENCIA RELATIVA ACUMULADA
Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia absoluta acumulada
dividido por el tamaño de la muestra, y la denotaremos por Fr
REPRESENTACIÓN GRÁFICA
Los gráficos que representan de manera adecuada una distribución de frecuencias son:
o Histograma de frecuencia
o Polígono de frecuencia
o Diagrama de barras
o Diagrama de sectores
MEDIDAS DESCRIPTIVAS
Las medidas descriptivas son valores numéricos calculados a partir de la muestra y que nos resumen la
información contenida en ella.
MEDIDAS DE CENTRALIZACIÓN
Con ellas pretendemos condensar los distintos valores de la variable en uno sólo que los resuma.
Media, mediana y moda
MEDIDAS DE POSICIÓN
Una vez ordenados los datos de menor a mayor será necesario identificar la posición de los valores.
Percentiles, cuartiles, deciles
MEDIDAS DE DISPERSIÓN.
Las medidas de centralización nos condensan los datos en uno sólo pero no nos aportan información
ninguna sobre la concentración o dispersión de los datos, habrá pues que introducir medidas que palien esta
carencia.
Varianza, desviación típica, coeficiente de variación, rango
MEDIDAS DE FORMA
Apuntamiento o curtosis
Asimetría
Nota: La determinación de estas medidas no tiene sentido para variables cualitativas pues no es posible
realizar operaciones con sus modalidades.
II
5. VARIABLES CUALITATIVAS
V
250 individuos probaron 5 antirreflejantes de distinta marca y se les pidió que
eligieran aquel con el que percibieran menor reflejo al trabajar en la computadora.
Se encontró que 31 individuos prefirieron el AR1; 89 individuos, el AR2; 23
individuos, el AR3; 68 individuos, el AR4 y 39 individuos, el AR5). A continuación se
muestra la descripción de frecuencias:
Modalidades
AR 1
AR 2
AR 3
AR 4
AR 5
Frecuencia
absoluta (ni)
Frecuencia
relativa (fi)
f1=n1/n
n1= 31
n2= 89
n3= 23
n4= 68
n5= 39
250
0.124 (12.4%)
0.356 (35.6%)
0.092 (9.2%)
0.272 (27.2%)
0.156 (15.6%)
1.0 (100%)
Frec. Absoluta
Acumulada (Ni)
N1= n1
N3= n1+….+n3
N1 = 31
N2= 120
N3= 143
N4= 211
N5= 250
Frec. Relativa
Acumulada (Fi)
F1= N1/n
F2= N2/n
0.124 (12.4%)
0.48 (48%)
0.572 (57.2%)
0.844 (84.4%)
1.0 (100%)
Variables cualitativas: las 5 marcas de antirreflejante
n=250
En la siguiente página se encontrará un diagrama de sectores que representan los
resultados obtenidos. En el primero se utilizó la frecuencia relativa y en el segundo, la frecuencia
absoluta.
Ambos muestran sectores iguales ya que el estudio se realizó en una sola población.
De haberse efectuado en dos poblaciones de diferente tamaño, sólo se utilizaría la frecuencia
relativa para la obtención del diagrama.
Se muestra también un diagrama de barras representando los mismos resultados.
Igualmente se utilizó la frecuencia relativa para la obtención del primer diagrama y para el
segundo, la frecuencia absoluta. De la misma manera que en el diagrama de sector, ambas
representaciones gráficas son iguales.
1
6. DIAGRAMAS DE SECTOR
PREFERENCIA DE ANTIRREFLEJANTES
DEL MERCADO
AR5
16%
AR1
12%
AR4
27%
AR2
36%
AR3
9%
*El diagrama muestra
la frecuencia relativa
Individuos
encuestados: 250
PREFERENCIA DE ANTIRREFLEJANTES EN EL MERCADO
AR5, 39
AR4, 68
*El diagrama muestra
la frecuencia absoluta
AR1, 31
AR2, 89
AR3, 23
Individuos
encuestados: 250
2
7. DIAGRAMAS DE BARRAS
PREFERENCIA DE ANTIRREFLEJANTES EN EL MERCADO
35.6
27.2
15.6
12.4
AR1
9.2
AR2
AR3
AR4
AR5
Individuos encuestados: 250
*El diagrama muestra la frecuencia relativa (%)
PREFERENCIA DE ANTIRREFLEJANTES DEL
MERCADO
89
68
31
AR1
39
23
AR2
AR3
*El diagrama muestra la frecuencia absoluta
AR4
AR5
Individuos
encuestados: 250
3
8. Al realizar el mismo estudio en otra población de 140 individuos se obtuvieron los
siguientes datos: 18 individuos prefirieron el AR1; 49 individuos, el AR2; 11 individuos, el
AR3; 39 individuos, el AR4 y 23 individuos, el AR5). A continuación se muestra la
descripción de frecuencias.
N=140
Modalidades
Frecuencia
absoluta (ni)
Frecuencia
relativa (fi)
f1=n1/n
n1= 8
n2= 57
n3= 16
n4= 31
n5= 28
140
0.057 (5.7%)
0.407 (40.7%)
0.114 (11.4%)
0.222 (22.2%)
0.20 (20%)
1.0 (100%)
AR 1
AR 2
AR 3
AR 4
AR 5
Frec. Absoluta
Acumulada (Ni)
N1= n1
N3= n1+….+n3
N1 = 8
N2= 65
N3= 81
N4= 112
N5= 250
Frec. Relativa
Acumulada (Fi)
F1= N1/n
F2= N2/n
0.057 (5.7%)
0.464 (46.4%)
0.578 (57.8%)
0.80 (80%)
1.0 (100%)
PREFERENCIA DE ANTIRREFLEJANTES
DEL MERCADO
57
31
8
AR1
28
AR4
AR5
16
AR2
AR3
*El diagrama muestra la frecuencia absoluta
Individuos encuestados: 140
PREFERENCIA DE ANTIRREFLEJANTES
DEL MERCADO
40.7
11.4
5.7
AR1
AR2
AR3
*El diagrama muestra la frecuencia relativa
22.2
AR4
20
AR5
Individuos encuestados: 140
4
9. Para realizar una comparación de los resultados en las dos distintas poblaciones, se deberá
utilizar la frecuencia relativa (porcentaje de cada población) para su representación, tal como se
observa en el primer diagrama, donde se observa que la preferencia por cada tipo de
antirreflejante es muy semejante, es decir, no se observa ningún dato disparado.
Si por el contrario se utilizara la frecuencia absoluta, como se observa en la segunda tabla,
se obtendrían una representación no fiel a los resultados, ya que haría pensar que el AR2 y AR4
superan por mucho a los demás antirreflejantes en la población 1, mientras que en la población 2.
En estos casos, el uso de la frecuencia relativa produce representaciones fidedignas.
PREFERENCIA DE ANTIREFLEJANTES DEL
MERCADO EN DOS POBLACIONES
FRECUENCIA RELATIVA
Series1
35.6
40.7
27.2
12.4
9.2
22.2
11.4
5.7
AR1
AR2
Series2
20
15.6
Series2
Series1
AR3
AR4
AR5
PREFERENCIA DE ANTIRREFLEJANTES DEL
MERCADO EN 2 POBLACIONES
FRECUENCIA ABSOLUTA
Series1
Series2
89
68
31 57
23
8
AR1
16
AR2
AR3
39
31
AR4
28
AR5
5
10. VARIABLES CUANTITATIVAS
CUANTITATIVA DISCRETA
Se realizó un estudio en los alumnos del sexto semestre de una preparatoria privada para conocer
cuántos libros leían al año. Estos fueron los resultados:
3, 8, 4, 1, 7, 3, 1, 0, 1, 5, 4, 3, 6, 0, 6, 4, 8, 4, 5, 5, 4, 2, 4, 2, 3
Xi
(No. Libros
leídos al año)
0
1
2
3
4
5
6
7
8
ni
fi
(n1/n)
2
3
2
4
6
3
2
1
2
25 alumnos
n1=2/25=0.08=8%
n2=3/25=0.12=12%
n3=2/25=0.08=8%
n4=4/25=0.16=16%
n5=6/25=0.24=24%
n6=3/25=0.12=12%
n7=2/25=0.08=8%
n8=1/25=0.04=4%
n9=2/25=0.08=8%
1.0 = 100%
Ni
(Frecuencia Abs.
Acumulada)
2
5
7
11
17
20
22
23
25
Fi
(Frecuencia Rel.
Acumulada)
F1=2/25=0.08=8%
F2=5/25=0.20=20%
F3=7/25=0.28=28%
F4=11/25=0.44=44%
F5=17/25=0.68=68%
F6=20/25=0.8=80%
F7=22/25=0.88=88%
F8=23/25=0.92=92%
F9=25/25=1=100%
DIAGRAMA DE BARRAS (DIFERENCIAL)
Enseguida se muestra la representación gráfica diferencial usando en el primer diagrama la
frecuencia relativa y en el segundo, la frecuencia absoluta. En ambos diagramas la representación
de los datos es la misma.
FRECUENCIA RELATIVA (%)
LIBROS LEIDOS AL AÑO POR ALUMNOS DEL 6°
SEMESTRE DE LA PREPARATORIA "X"
24
16
12
8
12
8
8
8
4
01
2
1
3
2
4
3
5
4
6
5
7
6
NÚMERO DE LIBROS LEÍDOS AL AÑO
8
7
9
8
*25 alumnos
encuestados
6
11. FRECUENCIA ABSOLUTA
(NÚMERO DE ALUMNOS)
LIBROS LEIDOS AL AÑO POR ALUMNOS DEL 6°
SEMESTRE DE LA PREPARATORIA "X"
6
4
3
3
2
2
2
2
1
1
0
2
1
3
2
4
3
5
4
6
5
7
6
87
9
8
*25 alumnos
encuestados
NÚMERO DE LIBROS LEÍDOS AL AÑO
DIAGRAMA DE BARRAS (ACUMULADO O INTEGRAL)
A continuación se muestra el diagrama acumulado o integral de los datos obtenidos, y se observa
que es un diagrama creciente.
0
1
2
3
4
5
6
7
8
7
12. VARIABLES CUANTITATIVAS
CUANTITATIVA CONTINUA
En el siguiente conjunto de datos, se proporcionan los pesos (peso en libra redondeado) de niños
nacidos en cierto intervalo de tiempo:
4, 8, 4, 6, 8, 6, 7, 7, 7, 8, 10, 9, 7, 6, 10, 8, 5, 9, 6, 3, 7, 6, 4, 7, 6, 9, 7, 4,
7,6, 8, 8, 9, 11, 8, 7, 10, 8, 5, 7, 7, 6, 5, 10, 8, 9, 7, 5, 6, 5.
n=50
Número de barras recomendadas :
log (n)/log (2) = log (50)/log (2) = 1.69/0.30 = 5.6 = entre 5 y 6 barras.
Xi
Peso en libras
Inicio de
Término de
intervalo (valor
intervalo
no incluido)
(valor incluido)
2
4
4
6
6
8
8
10
10
12
ni
(Frec.
Absoluta)
Ni
(Frecuencia Abs.
Acumulada)
fi
(Frec. Relativa)
n1/n
5
14
21
9
1
50 niños
5
19
40
49
50
0.10= 10%
0.28= 28%
0.42= 42%
0.18= 18%
0.02= 2%
1.0= 100%
Fi
(Frecuencia Rel.
Acumulada)
Ni/n
0.10= 10%
0.38= 38%
0.80= 80%
0.98= 98%
1.0= 100%
Histograma (Diagrama Diferencial)
Enseguida se muestra el histograma de los datos previamente mencionados. Se utilizó la
frecuencia absoluta.
8
13. Polígono de frecuencias (Diagrama Diferencial)
Ahora se muestra el polígono de frecuencias. Se utilizó igualmente la frecuencia absoluta para la
representación gráfica.
Polígono de frecuencias acumulados (Diagrama Integral)
A continuación se muestra el diagrama acumulado o integral de los datos obtenidos; se puede ver
que es un diagrama creciente.
9
14. MEDIDAS DESCRIPTIVAS
MEDIDAS DE TENDENCIA CENTRAL
Número de cigarros que fuman al día, datos recabados en un grupo de 12 personas:
2, 8, 4, 6, 8, 6, 7, 7, 7, 8, 10, 9
MEDIA
_
X = 2+ 8 + 4 + 6 + 8 + 6 + 7 + 7 + 8 + 8 + 10 + 9 = 83 = 6.9 cigarros
12
12
MEDIANA
2, 4, 6, 6, 7, 7, 8, 8, 8, 8, 9, 10
M= 7+8 = 15 =7.5 cigarros
2
2
MODA
8 cigarros
10
15. MEDIDAS DE DISPERSIÓN
Número de cigarros que fuman al día, datos recabados en un grupo de 12 personas:
2, 8, 4, 6, 8, 6, 7, 7, 7, 8, 10, 9
RANGO
2, 4, 6, 6, 7, 7, 8, 8, 8, 8, 9, 10
R= 10 – 2= 8
VARIANZA (S2 o V) Y DESVIACIÓN ESTÁNDAR (S)
VARIANZA: es la media de las diferencias cuadráticas de las n puntuaciones con respecto a su
media aritmética. Su fórmula es la siguiente:
Número de cigarros que fuman al día, datos recabados en un grupo de 12 personas:
2, 8, 4, 6, 8, 6, 7, 7, 7, 8, 10, 9
_
X= 2+ 8 + 4 + 6 + 8 + 6 + 7 + 7 + 8 + 8 + 10 + 9 = 83 = 6.9
12
12
V= (2-6.9)2+(8-6.9)2+(4-6.9)2+(6-6.9)2+(8-6.9)2+(6-6.9)2+(7-6.9)2+(7-6.9)2+(7-6.9)2+(8-6.9)2+(10-6.9)2+(9-6.9)2=
12-1
V=24.01+1.21+8.41+0.81+1.21+0.81+0.01+0.01+0.01+1.21+9.61+4.41 =
11
51.72 = 4.70
11
La media de las diferencias cuadráticas de las 12 puntuaciones con respecto a su media aritmética
(6.9) es de 4.70.
11
16. DESVIACIÓN ESTÁNDAR o TÍPICA
La desviación estándar es la raíz cuadrada de la varianza y puede interpretarse como la “distancia
media” que existe entre los valores de los datos y su media; a mayor desviación estándar, mayor
es la dispersión de la distribución.
Número de cigarros que fuman al día, datos recabados en un grupo de 12 personas:
2, 8, 4, 6, 8, 6, 7, 7, 7, 8, 10, 9
S= 4.70
4.70
S= 2.16
En promedio, fuman 6.9 cigarros al día y hay una desviación estándar de +2.16 cigarros.
ESTADÍSTICOS DE POSICIÓN
PERCENTILES
Número de cigarros que fuman al día, datos recabados en un grupo de 12 personas:
2, 4, 6, 6, 7, 7, 8, 8, 8, 8, 9, 10
Xi
Número de cigarros
Inicio de
Término de
intervalo (valor
intervalo
no incluido)
(valor incluido)
1
3
3
5
5
7
7
9
9
11
ni
(Frec.
Absoluta)
Ni
(Frecuencia Abs.
Acumulada)
fi
(Frec. Relativa)
n1/n
1
1
4
5
1
12 personas
1
2
6
11
12
0.0833= 8.33%
0.0833= 8.33%
0.333= 33.3%
0.416= 41.6%
0.0833= 8.33%
1.0= 100%
Fi
(Frecuencia Rel.
Acumulada)
Ni/n
0.0833= 8.33%
0.166= 16.6%
0.5= 50%
0.916= 91.6%
1.0= 100%
12
17. Primer cuartil (P25)
n/4= 12/4= 3 Intervalo 5 -7
Q1= 5 + [(3-2)/4 ] * 2 = 5 + ¼*2 = 5.5
Segundo cuartil (P50)
2n/4= 24/4= 6 Intervalo 7 - 9
Q2= 7 + [(6-6)/5 ] * 2 = 7 + 0*2 = 7 Equivale a la Mediana
(*Pero la mediana la había calculado como 7.5)
Tercer cuartil (P75)
3n/4= 36/4= 9 Intervalo 7-9
Q3= 7 + [(9-6)/5 ] * 2 = 7 +3/5*2 = 8.2
Rango de Intercuartil
IQR= Q3-Q1= 8.2 – 5.5= 2.7
P75
P50
P25
P25
13
18. ESTADÍSTICOS DE ASIMETRÍA
Diremos que hay asimetría positiva si As > 0 y negativa si As < 0.
As= 6.9 – 8 = -1.1 = -0.509
2.16
2.16
En este caso, la asimetría es negativa. Esto se confirma al observar el histograma en el que
se muestra que las frecuencias más altas se encuentran en el lado derecho de la media (6.9),
mientras que en el lado izquierdo hay frecuencias más pequeñas (cola).
Media (6.9)
14
19. CONCLUSIONES
La estadística descriptiva es una parte de la estadística que se dedica a recolectar, ordenar,
analizar y representar un conjunto de datos, con el fin de describir apropiadamente las
características de éste.
A partir de un conjunto de datos obtenidos (cualitativos o cuantitativos obtenidos por
medio de encuesta o medición), se elaboran tablas donde se muestre la distribución de
frecuencias (absoluta, relativa, absoluta acumulada y relativa acumulada).
Con esos datos se prosigue a la representación gráfica de los mismos (histograma,
polígono de frecuencias, diagrama de barras o de sector).
Las medidas descriptivas nos permitan resumir la información que contienen esas tablas,
por ejemplo: al calcular una serie de medidas de tendencia central (moda, media, mediana), para
ver en qué medida los datos se agrupan o dispersan en torno a un valor central (media o
mediana).
15
20. REFERENCIAS
Biblioteca Virtual UAA
o
MADSEN, Birger; STATISTICS FOR NON-STATISTICIANS, Ed. Springer, 2011
Recurso de la plataforma http://www.ambitoacademico.uaa.mx:
o
RIUS DIAZ, Francisca, BIOESTADÍSTICA: MÉTODOS Y APLICACIONES; versión
electrónica del manual de la Universidad de Málaga.
http://www.fca.unam.mx/docs/apuntes_matematicas/34.%20Estadistica%20Descriptiva.p
df
http://www.inpahu.edu.co/tecnologias/Estadistica/distribucion.html
http://www.ematematicas.net/estadistica/medidas/?tipo=intro
http://www.tuveras.com/estadistica/estadistica02.htm
16