algoritmos en R Studio

UNIVERSIDAD REGIONAL AUTÓNOMA DE LOS ANDES
“UNIANDES”
NOMBRE
JUAN ALARCÓN
NIVEL
NOVENO SISTEMAS
MATERIA
SISTEMA DE SOPORTE A TOMA DE DECISIONES
TUTOR
LUIS GUALLPA
Evaluación parcial 2

Objetivos
1. El análisis de complejidad de los algoritmos, así como en el diseño e
implementación de éstos con las técnicas y métodos más usados.
2. Desarrollar habilidades en el uso de las técnicas de análisis y diseño de algoritmos
computacionales.
3. Analizar la eficiencia de diversos algoritmos para resolver una variedad de
problemas, principalmente no numéricos más bien estadísticos.
4. diseñar y analizar nuevos algoritmos estadísticos para una empresa.
5. Reconocer y clasificar los problemas de complejidad polinómica y no
polinómica.
Fundamento Teórico
La razón fundamental de este desarrollo es comprobar la mejora del rendimiento que,
como se demuestra en este trabajo, puede obtenerse con la compilación de determinadas
partes del código. En esta memoria se desarrollan todas las temáticas necesarias para la
comprensión del objetivo de los algoritmos y las técnicas utilizadas. Esto incluye un
estado del arte sobre informática, estadística, Programación Dinámica, alineamiento y
análisis de secuencias estadísticas, matrices de puntuación, técnicas y tipos de
alineamiento, Agentes Inteligentes, entre otros.

DESARROLLO DE LAS PRÁCTICAS
Ejercicio 1
Arboles De Decisiones
Cargamos los paquetes necesarios con los para crear y visualizar arboles
Leemos los conjuntos de datos dim(wdbc);

Vemos que este conjunto tiene 569 muestras con 32 columnas

Esta línea de código nos muestra la base de datos con sus variables
wdbc$V7=as.numeric(recode(wdbc$V7, "'?'=NA"));
La siguiente codificación nos muestra una tabla x con un conjunto de datos 569objetos
y 32 variables
Nos da el conjuntó final

Esta sentencia nos da el tamaño de conjunto
# train (2/3), test (1/3)
N=dim(x)[1];
all=seq(1,N);
Hacemos el simple de 2/3 estas formaran el conjunto de entrenamiento y el tercio
restante formara el conjunto de test
# select 2/3 randomly
train=sort(sample(N,N*2/3.0));
test=setdiff(all,train);
xtrain=x[train,];
xtest=x[test,];

Crearemos el conjunto de entrenamiento xtrain

Crear el primer árbol usando parámetros predeterminados
# create first tree using default parameters
t1=rpart(as.factor(V11) ~ V2+V3+V4+V5+V6+V7+V8+V9+V10, data=xtrain,
method="class");
prp(t1, extra=1);
Vemos que hemos creado un árbol
Donde el nodo v10 pregunta al nodo V9 si la variable es menor que 0.19 si no loes este
nos lleva a un nodo considerado terminal de clase 0.2096
Caso contrario nos lleva a la variable V3 nos dice que si v3 mayor o igual a 16

Calculamos la matriz de confusión para cada uno de los dos conjuntos
# analyze how good is t1 as a classifier
confusionMatrix(table(xtrain$V11,y1train));
confusionMatrix(table(xtest$V11,y1test));

EJERCICIO 2 PCA
Ejemplo sintético con datos en formato pequeño.
Ingresamos los datos tanto de X como de Y
Calculamos la media tanto de X como de Y
Posteriormente tenemos que restar la media de cada uno de los valores ingresados tanto
de X como de Y
La matriz Data contiene dos columnas la cual es de X y la otra es de Y restadas sus
medias

Matriz de covarianza
Vectores de la matriz covarianza
Ejemplo con datos de alta dimensionalidad
De una base de datos de pacientes para identificar si uno de ellos tiene cáncer maligno o
benigno para la visualización en 2D.
Descargamos la base de datos del siguiente link:
dataCancer <- read.table("http://archive.ics.uci.edu/ml/machine-learning-
databases/breast-cancer-wisconsin/wdbc.data", sep=",");
En el programa nos saldrá lo siguiente cuanto la base de datos ya este descargada

Mediante este comando se reflejara los atributos de la base de datos
En la cual en la etiqueta V2 nos mostrara si el cáncer el benigno o maligno
B= benigno
M: maligno
Guardamos los siguientes datos para calcularlos

En la siguiente instrucción nos mostrara el cuadro de como contribuye el valor propio a
la variable ejecutada.
Al digitar este comando seleccionado nos quedamos con tan solo los componentes

Visualizaremos nuestros datos de componentes
Representando las etiquetas en la parte superior de la parcela 2D para señalar con
colores distintos.

EJERCICIO 3 SVM
set.seed(1011). Cargamos los datos
x = matrix(rnorm(400), 200, 2). Generaremos 200 puntos en 2 dimensiones
y = rep(c(-1, 1), c(100, 100)). Generamos las etiquetas -1 y 1
x[y == 1,] = x[y == 1,] + 4.5. Añadimos 4.5 a todos los puntos de la primera clase

plot(x, col = y + 3, pch = 19). Procedemos a graficar y observamos que se separaron los
puntos
library(e1071). Cargamos la librería
train=data.frame(x,y=as.factor(y)). Generamos un data frame

svmfit=svm(y~.,data=train,kernel="linear",cost=1,scale=FALSE). Mediante la
función svm cambiamos los valores de las etiquetas
print(svmfit). Veremos la información de este modelo

plot(svmfit,train). Visualizamos el modelo
x = matrix(rnorm(400), 200, 2). Generamos otra matriz de datos

y = rep(c(-1, 1), c(100, 100)). Generamos las etiquetas -1 y 1
x[y == 1,] = x[y == 1,] + 3. Añadimos 3 a todos los puntos de la primera clase
plot(x, col = y + 3, pch = 19). Dibujaremos el plano

test=data.frame(x,y=as.factor(y)). Ejecutamos un data frame

out=predict(svmfit,test). Corremos la función predict
plot(svmfit,test). Ejecutamos un tets
sum(out==y)/200. Ejecutamos la suma

Conclusiones
Manejar los datos con R studio y otras herramientas para la creación de ficheros
destinados al análisis conocer métodos de simulación para evaluar procedimientos y
tomar decisiones en la representación de datos estadísticos. También podremos ser
capaces de describir y depurar los datos mecanizados de forma automática podremos
reorganizar la información de los datos para una lectura y verificación ágil o un análisis
posterior.
Recomendaciones
Tener r studio completo con su respectiva licencia por que el demo no nos va a permitir
trabajar cómodamente con todas sus librerías y no obtendremos los resultados que
deseamos

algoritmos en R Studio

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a algoritmos en R Studio

Similar a algoritmos en R Studio (20)

Más de juan198

Más de juan198 (8)

Último

Último (20)

algoritmos en R Studio