El documento describe los pasos para importar y analizar datos numéricos en R Commander. Explica cómo cargar los datos de edad y glucemia de un archivo de Excel o bloc de notas en R Commander y realizar un resumen estadístico de estas variables. Estos resúmenes incluyen estadísticos como la media, mediana, desviación estándar, cuartiles y medidas de forma para cada variable. También compara los resultados entre las variables de edad y glucemia.
2. En primer lugar, debemos pasar los datos a un bloc de notas o a un archivo Excel o
pasarlo directamente desde el programa R Commander.
3. Si elegimos la opción de escribir el archivo en un documento Excel o en un bloc de
notas, como ha sido en mi caso, en el menú de R Commander nos dirigimos hacia
las pestaña “Datos”, y clicamos en la opción “desde archivos de texto, portapapeles o
URL…” que se despliega al colocar el cursor sobre “importar datos”.
4. Tras clicar, le damos un nombre al archivo con el que vamos a trabajar. En mi caso, en
“carácter decimal” viene por defecto elegida la opción “Punto”, la cual he tenido que cambiar
porque en mi bloc de notas, los decimales están detrás de la coma.
En la segunda foto ya tenemos el conjunto de datos cargado y como podemos ver a la derecha
del todo, se puede visualizar el conjunto de datos activo
5. Tras tener nuestro conjunto de datos activo, nos dirigimos a la opción “Estadísticos”,
“Resúmenes” y por último, “Resúmenes numéricos”.
En el desplegable que aparece, elegimos la edad y la glucemia, ya que son los únicos datos
que podemos estudiar numéricamente.
8. La desviación típica es una medida del grado de dispersión de los datos con respecto al valor
promedio. Dicho de otra manera, la desviación estándar es simplemente el "promedio" o variación
esperada con respecto a la media aritmética. Cuanto más se acerquen los valores utilizados a la
media, menor será la desviación típica.
En la variable “Edad” existe una desviación típica mayor en comparación a la variable “Glucemia”.
Esto se debe a que la variable “Edad” posee un gran número de variables que se encuentran
entre los valores 18 a 80. Por el contrario, en el caso de la “Glucemia”, la cifras varían entre 0,8 y
3,92. También hay que añadir que la desviación típica en la “Glucemia” en comparación con su
media aritmética son cifras bastante parecidas, no pudiendo decir los mismo en el caso de la
variable “Edad”.
Los cuartiles son valores que dividen una muestra de datos en cuatro partes iguales.
En ambos casos, el primer, segundo y tercer cuartil representan lo mismo. El 1º cuartil representa
que el 25% de los datos es menor que o igual a este valor. El 2º cuartil posee el mismo valor que
la mediana y representa que el 50% de los datos es menor que o igual a este valor. El 3º cuartil
representa que el 75% de los datos es menor que o igual a este valor.
9. Las medidas de forma es la apariencia externa de una colección de datos cuantitativos y viene
dada representada por el aspecto gráfico.
Dentro de la forma se incluye la simetría o asimetría de la curva y el grado de apuntamiento o
achatamiento de la curva.
A través del dato “Skewness” podemos saber si la curva va a ser simétrica o asimétrica y, en
el último caso, si la asimetría es positiva o negativa. En el caso de “Edad”, es una asimetría
negativa. Por el contrario, en “Glucemia”, la asimetría es positiva.
12. En esta gráfica tenemos representadas las
variables “Glucemia” y “Sexo”.
podemos observar que la mayoría de
individuos se sitúan alrededor de 1g/l. Como
dato destacable, podemos decir que algunas
mujeres rozan casi los 4g/l , en comparación a
los hombres, que ninguno sobrepasa los 3g/l.
Otro dato es que existe un mayor número de
mujeres en comparación a hombres en la
gráfica.