Informe final de estadística, Ana María Pavón Reyes
1. INFORME FINAL DE ESTADÍSTICA
ANA MARÍA PAVÓN REYES
Primer curso de Enfermería, Macarena Grupo A.Primer curso de Enfermería, Macarena Grupo A.
2. ÍnÍndidicece
0. Resumen del contenido
1. Vista de la matriz de datos
1.1 Vista de variables
1.2 Vista de datos / vista de datos mostrando los nombres de los valores
2. Tablas de frecuencias y estadísticos
2.1 Sexo
2.2 Año de nacimiento
2.3 Trabajo
2.4 Fumar tabaco
2.5 Peso
2.6 Altura
2.7 Gasto de móvil
2.8 Transporte
3. ÍnÍndidicece
3. Gráficos
3.1 Sexo
3.2 Año de nacimiento
3.3 Trabajo
3.4 Fumar tabaco
3.5 Peso
3.6 Altura
3.7 Gasto de móvil
3.8 Transporte
4. Tabla cruzada
4.1 Tabla cruzada: sexo-gasto de móvil
4. 0.0. ResuResumen dmen del coel contenintenidodo
La matriz de datos que he construido consta de las siguientes variables:
Sexo
Año de nacimiento
Trabajo
Fumar tabaco
Peso
Altura
Gasto de móvil
Transporte
De cada una de ellas vamos a obtener:
Tabla de frecuencia
Estadísticos de tendencia central, posición y dispersión
Gráficos
5. ResuResumen dmen del coel contenintenidodo
Estadísticos de tendencia central
● Media: es la suma de los valores de cada una de las unidades de análisis de
nuestra población, divida por el número de unidades. Se calcula de la siguiente
forma:
● Mediana: es la puntuación que ocupa la posición central de la distribución. Para
poder hallarla necesitamos que nuestros datos estén ordenados, de forma creciente
o decreciente.
La mediana deja a un lado y a otro el 50% de los casos y divide la distribución en dos
mitades. Cuando el número de unidades de análisis sea par, cualquier número entre
las dos puntuaciones centrales servirá como mediana.
● Moda: es la categoría o valor de la variable que se presenta mayor número de
veces, es decir, la variable que presenta mayor frecuencia.
1
n
i
i
X
X
n
=
=
∑
6. ResuResumen dmen del coel contenintenidodo
Estadísticos de posición
● Percentiles: dividen la distribución de frecuencia en 100 partes iguales.
● Deciles: dividen la distribución de frecuencia en 10 partes iguales.
● Cuartiles: son las puntuaciones que dividen a la distribución en cuatro partes iguales, cada
una de ellas con el 25% de los casos, por lo tanto hay tres cuartiles. La forma de identificar
estos tres cuartiles, y una vez ordenadas las puntuaciones de menor a mayor, es la
siguiente:
- Primer cuartil, Q1, es la puntuación que deja a su izquierda el primer 25%
de las observaciones. Es decir, la puntuación que ocupa la posición N/4 en
la población.
- Segundo cuartil, Q2, es la puntuación que deja a su izquierda el 50% de los
casos. Coincide con la mediana. Por lo tanto, es la puntuación que ocupa la
posición 2N/4.
- Tercer cuartil, Q3, es la puntuación que deja a su izquierda el 75% de la
población es la puntuación que ocupa el lugar 3N/4.
Para calcularlo en la distribución de frecuencias se calcula la frecuencia porcentual acumulada.
7. ResuResumen dmen del coel contenintenidodo
Estadísticos de dispersión
● Desviación media: es la media aritmética de los valores absolutos de las diferencias entre
cada valor de la distribución (x) y su media aritmética . Su fórmula para calcularla es:
Dm= x- /n. Cuánto menor sea el valor de la DM menor será la dispersión de los datos.
● Varianza: mide la dispersión de los valores respecto a un valor central (media), es decir, es
el cuadrado de las desviaciones:
● Desviación típica: informa del grado de homogeneidad de los datos o de dispersión que
presentan respecto a la media. La desviación típica es más baja si los datos están más
próximos a la media; es más alta si hay puntuaciones extremas muy alejadas de la media.
● Rango: es la diferencia entre el valor máximo y el valor mínimo en un grupo de números
aleatorios. Su formula para calcularlo es la siguiente: Rango = Máximo - mínimo
2
( )
N
i
X
X X
N
σ
−
=
∑
8. 1.1. VistVista de la de la mata matriz deriz de datosdatos
1.1 Vista de variables
En la imagen que vamos a ver a continuación, podemos apreciar la matriz de datos que he
construido tras haber elegido 8 variables para realizar este trabajo.
Las variables elegidas son sexo, año de nacimiento, trabajo, fumar tabaco, peso, altura, gasto de
móvil y transporte.
En la vista de variables podemos observar, entre otras cosas, la medida de cada variable y los
valores que toman si es que los presentan.
Tipo de variables:
Sexo →nominal
Año de nacimiento →escala
Trabajo →ordinal
Fumar tabaco →nominal
Peso →escala
Altura →escala
Gasto de móvil →ordinal
Transporte →nominal
9.
Sexo:
1. Varón, 2. Mujer
Trabajo:
1. Sí, a media jornada; 2. Sí, fines de semana; 3. Sí, de manera ocasional; 4. No, nunca
Fumar tabaco:
1. Sí, 2. No
Gasto de móvil:
1. menos de 15 euros; 2. de 15 a 25 euros; 3. de 26 a 35 euros; 4. de 36 a 45 euros; 5. más de 45
euros
Transporte:
1. A pié; 2. Coche; 3. Bicicleta; 4. Autobús; 5. Metro; 6. Metro y autobús
Valores que toman algunas de las variables elegidas:
10.
11. 1.2 Vista de datos
En este tipo de vista, podemos observar el conjunto de datos que presenta cada
variable.
12. Si pulsamos sobre este
icono, obtendremos los
nombres que le hemos
asignado a nuestros
valores.
13. 2.2. TablaTablas de frs de frecuencecuencias y esias y estadístadísticosticos
Para obtener la tabla de frecuencias de cada una de nuestras variables vamos a realizar el
siguiente proceso:
1. Pulsamos sobre “analizar”
2.Pulsamos sobre “estadísticos descriptivos”
3.Pulsamos sobre “Frecuencias”
4.Elegimos la variable de la cual queremos obtener la tabla de frecuencias
Con todo este proceso realizado, nos aparecerá la tabla de frecuencias de la variable elegida.
Para obtener los estadísticos de cada una de ellas realizamos el siguiente proceso:
1. Pulsamos sobre el cuadro “estadísticos”
2. Según el tipo de variable (caulitativa o cuantitativa) marcaremos unos estadísticos y otros.
Si la variable es cualitativa (nominal u ordinal) sólo eligiremos moda.
Si la variable es cuantitativa (o de escala) elegiremos media, mediana, moda, rango, máximo
y mínimo, varianza, desviación típica y cuartiles.
14. 2.1 Sexo
La primera variable que hemos elegido es la variable “Sexo”.
Es una variable cualitativa, es decir, son variables que expresan distintas cualidades,
características o modalidad. Las variables cualitativas pueden ser dicotómicas cuando sólo
pueden tomar dos valores posibles, ó politómicas cuando pueden adquirir tres o más valores.
Por tanto, la variable sexo es una variable cualitativa dicotómica porque sólo puede tener dos
valores (varón y mujer).
Además, es una variable nominal porque sus valores no pueden ser sometidos a un orden.
Al ser una variable nominal no presenta:
Estadísticos de tendencia central: media y mediana. Sólo presenta moda (la moda es la
categoría o valor de la variable que se presenta mayor número de veces, es decir, la variable que
presenta mayor frecuencia).
Estadísticos de posición: cuartiles, deciles y percentiles.
Estadísticos de dispersión: rango (máximo y mínimo), desviación típica y varianza.
En la siguiente imagen observamos la moda de esta variable y la tabla de frecuencias de la
misma.
15. La moda al ser 2
correspondería con
“mujer”,por lo que hay
un mayor número
de mujeres que
de hombres.
16. 2.2 Año de nacimiento
La siguiente variable que nos encontramos es la variable “Año de nacimiento”.
Es una variable cuantitativa, es decir, son las variables que toman como argumento cantidades
numéricas. Son variables matemáticas. Las variables cuantitativas además pueden ser:
● Variable discreta: variables que admiten un número limitado de valores y no se pueden
subdividir en partes más pequeñas. Toman sólo valores enteros. Ejemplo, número de hijos.
● Variable continua: variables que admiten un número infinito de valores y se pueden
subdividir en partes más pequeñas. Ejemplo, edad, altura, peso, tensión arterial.
Por tanto, la variable “Año de nacimiento” es una variable cuantitativa discreta.
Al ser una variable cuantitativa presenta:
● Estadísticos de tendencia central: media, mediana y moda.
● Estadísticos de posición: cuartiles, deciles y percentiles.
● Estadísticos de dispersión: rango (máximo y mínimo), desviación típica y varianza.
En la siguiente imagen observaremos estos estadísticos nombrados anteriormente, y la tabla de
frecuencias de esta variable.
19. 2.3 Trabajo
La variable que analizaremos a continuación, es la variable “Trabajo”.
Es una variable cualitativa y politómica porque adquiere más de dos valores.
Además, es una variable ordinal porque además de clasificar, como las nominales,
ordenan a las unidades de análisis, es decir, ordena sus valores de mayor a
menor intensidad (1. Sí, a media jornada; 2. Sí, fines de semana; 3. Sí, de manera
ocasional; 4. No, nunca)
Al ser una variable ordinal presenta:
Estadísticos de tendencia central: moda. No presenta media ni mediana.
Estadísticos de posición: cuartiles, deciles y percentiles.
Estadísticos de dispersión: no presenta rango (máximo y mínimo), desviación típica
ni varianza.
En la siguiente imagen observamos la moda de esta variable y la tabla de frecuencias
de la misma.
20. Los cuartiles de esta
variable son los
siguientes:
El percentil 25
corresponde con el
Q1; el percentil 50
con el Q2; y el
percentil 75 con
el Q3.
21. 2.4 Fumar tabaco
La siguiente variable que analizaremos es la variable “Fumar tabaco”.
Es una variable cualitativa dicotómica porque sólo puede tener dos valores (sí y
no).
Además, es una variable nominal porque sus valores no pueden ser sometidos a un
orden.
Al ser una variable nominal no presenta:
● Estadísticos de tendencia central: ni media, ni mediana. Sólo presenta moda.
● Estadísticos de posición: no presenta cuartiles, deciles ni percentiles.
●Estadísticos de dispersión: no presenta rango (máximo y mínimo), desviación
típica ni varianza.
En la siguiente imagen observamos la moda de esta variable y la tabla de frecuencias
de la misma.
23. 2.5 Peso
La siguiente variable que nos encontramos es la variable “Peso”.
Es una variable cuantitativa y continua.
Al ser una variable cuantitativa presenta:
● Estadísticos de tendencia central: media, mediana y moda.
● Estadísticos de posición: cuartiles, deciles y percentiles.
● Estadísticos de dispersión: rango (máximo y mínimo), desviación típica y
varianza.
En la siguiente imagen observaremos estos estadísticos nombrados
anteriormente, y la tabla de frecuencias de esta variable.
27. 2.6 Altura
La siguiente variable que nos encontramos es la variable “Altura”.
Es una variable cuantitativa y continua.
Al ser una variable cuantitativa presenta:
● Estadísticos de tendencia central: media, mediana y moda.
● Estadísticos de posición: cuartiles, deciles y percentiles.
● Estadísticos de dispersión: rango (máximo y mínimo), desviación típica y
varianza.
En la siguiente imagen observaremos estos estadísticos nombrados
anteriormente, y la tabla de frecuencias de esta variable.
30. 2.7 Gasto de móvil
La variable que analizaremos a continuación, es la variable “Gasto de móvil”.
Es una variable cualitativa y politómica porque adquiere más de dos valores.
Además, es una variable ordinal porque además de clasificar, como las nominales,
ordenan a las unidades de análisis, es decir ordena los valores de menor a mayor ( 1.
menos de 15 euros; 2. de 15 a 25 euros; 3. de 26 a 35 euros; 4. de 36 a 45 euros; 5. más
de 45 euros)
Al ser una variable ordinal presenta:
Estadísticos de tendencia central: moda. No presenta media ni mediana.
Estadísticos de posición: cuartiles, deciles y percentiles.
Estadísticos de dispersión: no presenta rango (máximo y mínimo), desviación típica ni
varianza.
En la siguiente imagen observamos la moda de esta variable y la tabla de frecuencias de
la misma.
31. Los cuartiles de esta
variable son los
siguientes:El percentil 25
corresponde con el
Q1; el percentil 50
con el Q2; y el
percentil 75 con
el Q3.
Moda de
15-25
euros
32. 2.8 Transporte
La siguiente variable que analizaremos es la variable “Transporte”.
Es una variable cualitativa politómica porque presenta más de dos valores.
Además, es una variable nominal porque sus valores no pueden ser sometidos a un
orden.
Al ser una variable nominal no presenta:
● Estadísticos de tendencia central: media y mediana. Sólo presenta moda.
● Estadísticos de posición: no presenta cuartiles, deciles ni percentiles.
●Estadísticos de dispersión: no presenta rango (máximo y mínimo), desviación
típica ni varianza.
En la siguiente imagen observamos la moda de esta variable y la tabla de frecuencias
de la misma.
34. 3. Gráficos
Según el tipo de variable que queramos representar debemos de utilizar unos gráficos u otros.
Para variables cualitativas y cuasicuantitativas utilizaremos los siguientes gráficos:
Diagrama de Sectores Circulares
Diagrama de Barras Simples
Diagrama de Barras Compuestas
Para una sola variable cuantitativa utilizaremos los siguientes gráficos:
Histograma
Polígono de Frecuencias
Diagrama de Cajas
Para dos variables cuantitativas utilizaremos el siguiente gráfico:
Diagrama de dispersión
35. 3.1 Sexo
Como esta variable es de tipo nominal hemos seleccionado el Diagrama de
Barras que es utilizado para variables cualitativas y cuasicuantitativas.
36. 3.2 Año de nacimiento
Como esta variable es de escala la hemos representado mediante un Histograma, ya que
este tipo de gráfico es utilizado para variables cuantitativas.
37. 3.3 Trabajo
Para esta variable hemos utilizado el Diagrama de sectores circulares, ya que es una
variable ordinal, y este tipo de gráficos puede ser usado para este tipo de variables.
38. 3.4 Fumar tabaco
Como esta variable es de tipo nominal hemos seleccionado el Diagrama de
Barras que es utilizado para variables cualitativas y cuasicuantitativas.
39. 3.5 Peso
Como esta variable es de escala la hemos representado mediante un Diagrama de Cajas, ya
que este tipo de gráfico es utilizado para variables cuantitativas.
40.
41. 3.6 Altura
Como esta variable es de escala la hemos representado mediante un Histograma, ya que
este tipo de gráfico es utilizado para variables cuantitativas.
42. 3.7 Gasto de móvil
Para esta variable hemos utilizado el Diagrama de sectores circulares, ya que es una
variable ordinal, y este tipo de gráficos puede ser usado para este tipo de variables.
43. 3.8 Transporte
Como esta variable es de tipo nominal hemos seleccionado el Diagrama de
Barras que es utilizado para variables cualitativas y cuasicuantitativas.
44. 4.4. TabTabla cla cruzruzadaada
4.1 Tabla cruzada sexo-gasto de móvil