Este documento describe los pasos iniciales para analizar datos sobre riesgo sexual en R Commander. Primero, se establece el directorio de trabajo y se importan los datos de un archivo Excel. Luego, se crea una variable llamada "riesgosexual" que suma variables relacionadas con el riesgo sexual. Finalmente, esta variable se recodifica en una variable dicotómica llamada "riesgosexual2" que categoriza el riesgo sexual como alto o bajo.
2. INTRODUCCIÓN
R/ R Commander R es un lenguaje y entorno de programación
para análisis estadístico y gráfico.
En este trabajo vamos a empezar a realizar una serie de tareas
básicas en R commander para familiarizarnos con este
programa estadístico. En nuestro trabajo/estudio, pretendemos
explorar el nivel de riesgo sexual en los individuos incluidos en
la base de datos “activos en salud” (.xls). Las actividades a
realizar son:
Crear la variable “Riesgo sexual” como una variable que sea
igual a la suma de todas las variables que evalúen las
conductas de riesgo sexual de la muestra de individuos.
transformar la variable “Riesgo sexual” en una variable
dicotómica con categorías: alto riesgo y bajo riesgo sexual.
4. 1. Inicialmente, abremos el programa R, que a su vez abrirá R commander. Una vez en R
commander, vamos a fijar una carpeta específica como directorio de trabajo.
En nuestro caso, nuestro directorio de trabajo
será la carpeta “Seminario 5 estadística”
5. 2. Una vez que hemos
especificado el directorio
de trabajo, vamos a
importar los datos a R
DESE UN ARCHIVO
EXCEL.
A nuestro conjunto de datos vamos a llamarlos “activosensalud”.Tras pulsar en “aceptar”, nos
aparecerá para buscar el archivo “estadistica_tics.xls”.
6. Tras realizar las acciones anteriores, quedarán los datos “activosensalud” para ser
utilizados en R commander. El comando que quedará reflejado es:
setwd("/Users/Ismael/Desktop/SEMINARIO 5 ESTADISTICA")activosensalud <-
readXL("/Users/Ismael/Desktop/SEMINARIO 5 ESTADISTICA/Seminario 5
estadística/estadistica_tics.xls", rownames=FALSE, header=TRUE, na="",
sheet="estadistica_tics", stringsAsFactors=TRUE)
7. 3. Ahora vamos a crear la nueva variable a la que vamos a llamar “riesgosexual”.
Pulsamos en “datos”, luego
“modificar variables del conjunto de
datos activos” y luego a “calcular
una nueva variable”. Y nos
aparecerá lo siguiente:
Una vez aquí, ponemos el nombre a nuestra variable y elegimos todas aquellas variables relacionadas con
el riesgo sexual (marchaatras, proteccionpreservativo, parejassexuales y pildoradiadespues).
Nuestra “expresión a calcular” será “marchaatras+ parejassexuales+ proteccionpreservativo+
pildoradiadespues”. PD: el “+” funciona uniendo o sumando variables.
8. Una vez realizado lo anterior, quedará el comando en R: “activosensalud$riesgosexual <-
with(activosensalud, proteccionpreservativo+ marchaatras+ parejassexuales+
pildoradiadespues). Podemos visualizar los datos y quedaría mostrada una nueva
columna con nuestra variable “riesgo sexual”.
10. 1. Primeramente, vamos a “datos”, a “Modificar variables del conjunto de datos activos y luego a
“recodificar variables”.
Las directrices de recodificación serán:
• Los valores menores a una puntuación de 7, tendrán alto riesgo (lo:7=“altoriesgo”).
• Los valores mayores a una puntuación de 8, tendrán bajo riesgo (8:hi=“bajoriesgo”).
Elegimos la variable “riesgo sexual” y
posteriormente otro nombre
“riesgosexual2”
11. Realizadas las acciones anteriores, podemos visualizar los resultados y observamos nuestra
variable dicotómica.