2. Seminario 5:
• Una vez dada la teoría que ese día debíamos
aprender, comenzamos con la práctica. Esta vez se trataba
de realizar gráficos y tablas con el programa IBM SPSS
Statistics 20.
La práctica consistía en realizar una serie de actividades, que
son las siguientes:
3. • Para ello, tuvimos que añadir al programa todos los datos de las
tablas. Como ya aprendimos en el seminario anterior, teníamos
que ir metiendo dato a dato en la “Vista de Variables” e ir
configurándolas.
Nos quedó algo así:
Tras esto comenzamos con la primera actividad.
4. Actividad 1:
• En esta actividad teníamos que calcular varios
datos (media, moda, varianza…). Para ello, le
dimos a “Analizar > Estadísticos Descriptivos >
Frecuencias…”. A continuación se nos abrió un
cuadro donde tuvimos que elegir las variables de
las que queríamos calcular dichas operaciones. Tras
ello, le dimos a “Estadísticos” en la derecha, que
abrió otra ventana donde elegimos las operaciones
que queríamos que analizara el equipo.
• [A continuación podréis ver los pasos]:
5.
6. • El resultado nos quedaría algo así en la página de
“Resultado”:
7. - INTERPRETACIÓN DE LOS DATOS:
Como sabemos, en estadísticas, además de las frecuencias (absoluta, relativa y porcentaje) y
frecuencias acumuladas, necesitamos averiguar otras medidas para conocer su comportamiento estadístico.
De esta forma, hemos calculado una serie de datos de gran importancia que nos pueden dar una información
bastante precisa y resumida de lo que tenemos en las tablas de frecuencia.
Los datos que hemos calculado son:
• Media aritmética: Se calcula dividiendo el sumatorio de todos los valores entre el número total de valores.
De esta forma sabremos el valor promedio de todos estos.
En nuestro caso, hemos hallado que la media de edad de todos los participantes de nuestra muestra es de 42, 60
años de edad; mientras que la media del volumen corpuscular de los hematíes cae sobre los 89,30 mL.
• Moda: se define como el valor que más se repite en la muestra.
Como observamos, en los datos que hemos recogido hay varios valores que se repiten. Así, podemos decir que se
tratan de distribuciones bimodales o multimodales; aunque el sistema nos ha dado el valor más bajo que se ha
repetido.
De este modo, podemos ver que la edad de 38 años es la edad más repetida en la muestra; lo mismo ocurre con el
volumen de 90 mL. que se repite en más de dos ocasiones.
• Varianza: se define como el promedio de las desviaciones/diferencias cuadráticas de los datos obtenidos
respecto a la media. En otras palabras, es la media aritmética del cuadrado de las desviaciones respecto a
la media de una distribución estadística.
Su fórmula sería: δ² = Σ (Xi –μ)2/N.
De esta forma, hemos calculado que el promedio de las desviaciones de las distintas edades sería de 270, 989.
La varianza del volumen corpuscular correspondería a unos 44,537.
• Desviación típica: que corresponde a la medida de dispersión más usada. Se define como la raíz cuadrada
de la varianza.
En este ejercicio, hemos calculado que la DT de las edades es de 16, 462; mientras que para el volumen es de 6,674.
• Rango: es la diferencia entre el valor máximo y el valor mínimo de los valores observador. Esto nos informa
del recorrido de la variable; y se calcula restando al valor máximo el valor mínimo.
En nuestro caso, podemos comprobar que el rango existente entre las diferentes edades corresponde a 53; en
cambio, respecto al volumen hemos calculado que es de unos 25 mL.
8. Actividad 2:
• La actividad 2 consistía en realizar tablas de frecuencias
de las tres variables. Para ello, debemos de abrir la
misma ventana que anteriormente (Archivo > Estadisticos
descriptivos > Frecuencias…). Una vez abierto le
daremos a “Mostrar tablas de Frecuencias” y a
“Aceptar”. Tal que así:
10. - INTERPRETACIÓN DE LOS DATOS:
Como sabemos, tras realizar una investigación y haber recopilado los datos o la información de las variables estudiadas en
los sujetos de la muestra, se realizan tablas de frecuencias donde se organizan los datos para facilitar la extracción de información ya que
proporciona una visión rápida de los datos. De esta forma, cada variable se describe mediante su distribución de frecuencias y su
representación gráfica.
De este modo, nosotros hemos construido mediante el programa IBM SPSS tablas de frecuencia para las distintas variables (Edad, Sexo y
VCH):
En cada tabla, hemos añadido varias columnas (aunque en las tablas de las variables cuantitativas podríamos haber metido muchas más
operaciones):
En primer lugar hemos calculado la Frecuencia absoluta de una modalidad que corresponde al nº de veces que se ha observado ésta en
el experimento.
Así, vemos que la mayoría de las edades no se repiten excepto dos de ellas que aparecen dos veces.
Respecto al VCH, ocurre prácticamente igual, apenas se repiten las modalidades, excepto tres de éstas que aparecen repetidas en pocas
ocasiones.
En cambio, la variable sexo, al presentar tan pocas modalidades, hacen que se repitan en gran cantidad ambas de éstas de tal modo que
forman el 50 % de la muestra cada una.
En segundo lugar, hemos calculado el porcentaje de cada una de las modalidades de las tres variables. Éstos pueden ser calculados
fácilmente si aplicamos la fórmula que plantea la multiplicación de la frecuencia relativa (dato obtenido de la división de cada Frec.
Absoluta por el nº total de la muestra) por 100%. De esta forma:
Obtenemos que en la edad casi todas las modalidades forman un 5% de la muestra, excepto las dos que se repiten que formarían un 10%
respectivamente.
Las distintas modalidades del VCH forman también el 5% de la muestra, excepto las tres repetidas que serían 10% dos de ellas y un 15%
otra.
En cambio, las dos modalidades del sexo, como dijimos, son mitad y mitad de la muestra (50% cada una).
En tercer lugar calculamos el porcentaje válido que correspondería a todos aquellos que resultan válidos para la muestra. Como en este
caso todos los datos nos resultan útiles, los porcentajes válidos serían equivalentes a los porcentajes calculados anteriormente.
Y en último lugar, calculamos el porcentaje acumulado que se calcula sumando cada una de los porcentajes hasta formar la unidad
(100%). Esto nos ayudaría a saber el nº de individuos de la muestra que tienen un valor de la variable igual o inferior a cada uno de ellos.
11. Actividad 3:
• En dicha actividad tuvimos que realizar varios gráficos
para conocer la distribución de dichos valores. Para ello
debemos realizar los siguientes pasos:
12. • En mi caso, yo elegí los gráficos de barra; por lo que me quedó
así para la variable del SEXO:
13. Interpretacióndelasgráficas:
Como sabemos, esta variable corresponde al tipo
de Variable cualitativa nominal dicotómica, por lo que
para representarla gráficamente hemos tenido que recurrir
a un diagrama de sectores.
De esta forma, podemos observar claramente cómo este
gráfico nos muestra que el número de hombres es igual al
número de mujeres existentes en la muestra.
También podríamos decir que el grupo de hombres se
correspondería con el color azul mientras que el número
de mujeres es identificado por el color verde.
14. • Para las otras dos variables, por ser
cuantitativas, elegí los histogramas con sus
respectivas curvas o campanas de Gauss. Los
pasos para elegir el uso de histograma es el
siguiente:
15. • Por tanto, los resultados son los siguientes:
- EDAD:
Debido al tipo de variable del que se trata (Cuantitativa
discreta), usaremos el diagrama de barras. Así, podemos
observar como la edad (eje horizontal) viene
representada en función de su frecuencia (eje vertical).
Esto nos indica el número de veces que han sido repetidas
las distintas edades que tenemos como datos. Cabe
destacar que las edades de 38 años y de 59 años se
repiten dos veces, respectivamente. En cambio, en las
demás modalidades representadas sólo aparece un
individuo por edad.
16. - VCH:
Para este tipo de variable (Cuantitativa continua) usaremos
el Histograma donde se muestran los datos, también, en
forma de barras. En este gráfico podemos observar
claramente como el mayor número de individuos estudiados
presentan un volumen corpuscular establecido entre los 85 y
90 mL.
Así mismo, también nos indica que los demás resultados se
encuentran cercanos a una distribución normal. Esto lo
sabemos gracias a la Campana de Gauss.
17. Actividad 4:
• Aquí tuvimos que realizar un gráfico que relacionase el
VCH y el sexo. Para ello, optaremos por un gráfico de
caja o de bigotes. Lo realizaremos así:
18. • Se nos abrirá las siguientes veranas. Así tendremos
que elegir el tipo de gráfico que prefiramos
20. Interpretación de la gráfica:
Esta gráfica la hemos utilizado para representar la
comparación del VCH con el sexo. De esta
forma, podemos comentar que este tipo de gráfico
consiste en una caja alargada que nos indica, con sus
límites, los cuartiles. Podemos decir que el primer cuartil
estaría en los 85 mL tanto en hombres como en mujeres;
mientras que el tercero estaría en los 95 para hombres y en
los 92 mL para mujeres.
La línea media que divide el recuadro nos indicaría la
mediana, que corresponde a 92 mL para hombres y los 88
mL en la mujer.
En cambio, lo que sobre sale de las cajas se llaman
“bigotes”. Sus límites se corresponden con los valores
máximos y mínimos de todos los datos obtenidos. Así, en el
caso del hombre tendríamos un valor máximo de 103 mL y
un valor mínimo de 79. En cambio la mujer tendría un v.
máximo de 100mL y uno mínimo de 78 mL
aproximadamente.
21. Actividad 5:
• Para este ejercicio tenemos que relacionar la edad
y el sexo en una tabla de contingencia. Esta
actividad se realiza de la siguiente manera:
22.
23. • Como no sabíamos el orden que nos pedían, lo hemos
calculado de las dos formas: El sexo en relación de la
edad.
24. Interpretación de la gráfica:
Las tablas de contingencia se utilizan cuando queremos
comparar dos variables. En nuestro caso, compararemos
el sexo con la edad.
En dicha tabla podemos ver el número y porcentajes de
hombres que poseen una determinada edad. Lo mismo
ocurre con las mujeres. Un ejemplo de ello sería el 10% de
hombres que poseen 69 años; edad compartida también
por el mismo número de mujeres. El total de personas de la
muestra que presentan dicha edad es el 5% de todos los
datos obtenidos.
25. • Con dichas últimas tablas e interpretaciones
podemos dar por finalizado el trabajo (:.
FIN.