El documento describe cómo importar datos de Excel a R y generar resúmenes estadísticos. Se importan datos sobre edad y glucemia de 40 individuos. Se calculan medidas de tendencia central, dispersión y forma para ambas variables. La edad varía entre 18-80 años con desviación estándar mayor que la glucemia de 0.8-3.92 g/L. También se presentan tablas de frecuencias y un gráfico sobre la distribución de glucemia por sexo.
2. Para empezar, hay que pasar los datos que se nos da a R, y tenemos 3 formas
distintas de hacerlo: a través de un blog de notas, a través de un documento Excel, o
pasar directamente los datos a R. yo lo voy a hacer a través del documento Excel.
3. • Abrimos el programa de R, y utilizaremos la ventana de R commander.
• A partir de ahí, accedemos a la pestaña de “datos”, luego “importar datos”, y ahí
escogemos el método que hayamos usado para recoger la información.
4. • Le damos un nombre al documento y cliqueamos en “aceptar”.
5. • Una vez que ya tenemos el documento con los datos, nos dirigimos a la pestaña de
“Estadísticos”, luego “resúmenes”, y por último “resúmenes numéricos”.
• Aparecerá una nueva ventana donde elegiremos los datos que vayamos a estudiar.
En nuestro caso, van a ser “glucemia” y “edad”.
6. Edad:
• Valor máximo: 80
• Valor mínimo: 18
• Media: 47,35
• Mediana: 47
• Desviación típica: 18,03636
• Rango intercuartílico: 24
• Primer cuartil: 35,5
• Segundo cuartil: 47
• Tercer cuartil: 59,5
• Asimetría: -0,07872191
• Curtosis: -0,9078610
Glucemia:
• Valor máximo: 3,92
• Valor mínimo: 0,8
• Media: 1,5935
• Mediana: 1,155
• Desviación típica: 0,8823993
• Rango intercuartílico: 1,04
• Primer cuartil: 0,95
• Segundo cuartil: 1,155
• Tercer cuartil: 1,99
• Asimetría: 1,1861730
• Curtosis: 0,3105253
7. • La desviación atípica es una medida de dispersión de los datos con respecto al valor
promedio. Cuanto más se acerquen los valores utilizados a la media, menor será la
desviación típica.
• Al tener la variable “edad” más números de variables que la “glucemia”, tiene un
mayor desviación típica que la otra.
• Las cifras de la “edad” varían entre 18 y 80, mientras que la “glucemia” entre 0,8 y
3,92.
• Los cuartiles son valores que dividen una muestra de datos en cuatro partes iguales.
Estos cuartiles representan el 25, 50 y 75 por ciento de los datos que es menor o
igual a esos valores. La mediana coincide con el segundo cuartil.
8. • Las medidas de forma es la apariencia externa de una colección de datos
cuantitativos y viene dada representada por el aspecto gráfico.
• Dentro de la forma se incluye la simetría o asimetría de la curva y el grado de
apuntamiento o achatamiento de la curva.
• Con el dato “Skewness” podemos averiguar si la curva es simétrica o asimétrica, o si
es positiva o negativa en el caso de que sea asimétrica.
• En nuestros datos, la variable “edad” es asimétrica negativa, mientras que la
“glucemia” es asimétrica positiva.
9. Cabello fa fr pi Fa Fr Pi
Negro 28 0,7 70% 28 0,7 70%
Rubio 5 0,125 12,5% 33 0,825 82,5%
Castaño 7 0,175 17,5% 40 1 100%
Total 40 1 100%
Sexo fa fr pi Fa Fr Pi
Hombre 16 0,4 40% 16 0,4 40%
Mujer 24 0,6 60% 40 1 100%
Total 40 1 100%
11. En esta gráfica se puede observar que
la mayoría de las personas están
alrededor de 1g/L.
Los hombres no sobrepasan los 3g/L,
mientras que las mujeres se acercan a
los 4g/L
Por último, cabe destacar en la
investigación participaron más
mujeres que hombre (16 hombre y 28
mujeres).