SlideShare una empresa de Scribd logo
Pontificia Universidad Católica del Ecuador Sede Santo Domingo-Escuela de Ingeniería de Sistemas. Vega Daniel, Bonilla
Patricio, González Luis. DUCT.

1

Deserciones Universitarias: Caso de estudio:
Carreras técnicas más difíciles o menos atractivas.
Vega, Daniel., Bonilla, Patricio y González, Luis.
Estudiantes PUCE SD

Resumen— Este artículo aborda el tema sobre las
deserciones universitarias, con la finalidad de elaborar un
modelo que permita identificar el porcentaje de estudiantes
que abandonan la carrera semestre a semestre tomando como
referencia información obtenida de la Pontificia Universidad
Católica del Ecuador Sede Santo Domingo.
El análisis de este tema permitirá obtener información que
pueda ayudar a prevenir las deserciones.
El objetivo de este trabajo es investigar el porcentaje de
deserciones por carrera existente en la PUCE SD, conocer el
grado de aceptación que ha obtenido la institución periodo a
periodo debido al incremento de exigencia como consecuencia
de la acreditación de universidades realizada a nivel nacional.
La técnica que se ha implementado para obtener los resultados
de las deserciones ha sido minería de datos o data mining a
través de la herramienta open source denominada Weka, esta
herramienta utiliza diferentes algoritmos para la ejecución, el
algoritmo utilizado ha sido el de agrupamiento
SimpleKMeans.
Índice de Términos— deserción, modelo, educación
superior, acreditación de universidades, weka.
Abstract- This paper addresses the issue of university
dropouts, in order to develop a model to identify the
percentage of students who drop out of race semester to
semester by reference information from the Catholic
University of Santo Domingo Ecuador Headquarters.
The analysis of this issue will provide information that can
help prevent defections.
The aim of this paper is to investigate the percentage of
desertions by existing career in PUCE SD, determine the
degree of acceptance that has earned the institution period to
period due to increased demand as a result of the accreditation
of universities on a national level.
The technique has been implemented to obtain the results of
defections has been data mining or data mining through open
source tool called weka , this tool using different algorithm to
implement the algorithm used was the grouping
SimplekMeans.



Index Terms-dropout model, higher education, accreditation
of universities, weka.

I. INTRODUCCIÓN
La deserción es uno de los principales problemas que afrontan
las instituciones de Educación Superior. Es un problema que
preocupa debido a sus consecuencias sociales, institucionales
y personales que trae como repercusión este tema.
Los estudios revisados de investigación sobre el tema de
deserciones universitarias muestran que existen diferentes
causas como: escasa información previa, reiterados fracasos
en los exámenes finales, origen social, la elección inadecuada
de la carrera, características familiares, circunstancias de la
vida, entre otras. En este artículo no trataremos a fondo sobre
estas causas debido a que es muy complicado tener
información real estadística sobre las causas antes
mencionadas.
Las universidades en el país se encuentran cursando un
periodo de acreditaciones, el cual ha sido ejecutado por parte
del gobierno poniendo a estas en grandes apuros provocando
un incremento necesario en sus exigencias administrativas y
educativas, dando a ciertas universidades créditos como
también a otras provocando pérdidas económicas y de
estudiantes.
Este artículo es un grado de avance de investigación sobre la
temática de deserciones universitarias en las carreras que
existen en la PUCE SD, Ingeniería Comercial, Contabilidad y
Auditoría, Comunicación Social, Diseño, Enfermería,
Ingeniería de Sistemas, Hotelería y Turismo, Licenciatura en
Docencia y Gestión de Educación Básica.
El objetivo general de este trabajo de investigación es
determinar el porcentaje de deserciones por cada una de las
carreras de la PUCE SD.
La técnica que se ha implementado para obtener los resultados
de las deserciones ha sido minería de datos o data mining a
través de la herramienta open source denominada weka, esta
herramienta utilizas diferentes algoritmos para el análisis de
datos, el algoritmo utilizado ha sido el de agrupamiento
SimpleKMeans, este algoritmo permite agrupar la información
como conjuntos, haciendo mas fácil su interpretación.
Esta herramienta contiene una colección de modelos de
visualización y algoritmos para el análisis de datos y
Pontificia Universidad Católica del Ecuador Sede Santo Domingo-Escuela de Ingeniería de Sistemas. Vega Daniel, Bonilla
Patricio, González Luis. DUCT.
modelado predictivo, unido a una interfaz gráfica de usuario
para acceder fácilmente a sus funcionalidades.
Los puntos fuertes de weka son:
• Está disponible libremente bajo licencia pública
GNU.
• Es muy portable porque está completamente
implementado en java y puede correr en casi
cualquier plataforma.
• Contiene una extensa colección de técnicas para pre
procesamiento de datos y modelado.
• Fácil de utilizar.
Las redes neuronales son un paradigma de aprendizaje
automático inspirado en la forma en que funciona el sistema
nervioso de animales. Es un sistema de interconexión de
neuronas que interactúan entre sí para producir una salida a
través de estímulos. En inteligencia artificial se los denomina
redes neuronales.
El porcentaje de deserciones es mayor en las carreras técnicas
que en las demás carreras, es la hipótesis que se plantea en
este trabajo.
A la PUCE SD le interesa conocer el porcentaje de
deserciones por carrera, manejando a través de un proyecto
con sus estudiantes esta investigación, justificando de esta
manera la elaboración y ejecución de este artículo, mediante
las siguientes preguntas de investigación.
¿Este artículo permitirá tener una visión clara para la toma de
decisiones? ¿El porcentaje de deserciones por carrera
presentado en este trabajo determinara si las carreras técnicas
son más complejas o no?
II.

MÉTODOS Y MATERIALES

La herramienta weka soporta varias tareas estándar de minería
de
datos,
especialmente,
pre
procesamiento
de
datos, clustering, clasificación, regresión, visualización, y
selección. Todas las técnicas de Weka se fundamentan en la
asunción de que los datos están disponibles en un fichero
plano (flat file) o una relación, en la que cada registro de datos
está descrito por un número fijo de atributos (normalmente
numéricos o nominales, aunque también se soportan otros
tipos). Weka también proporciona acceso a bases de datos
vía SQL gracias a la conexión JDBC (Java Database
Connectivity) y puede procesar el resultado devuelto por una
consulta hecha a la base de datos. No puede realizar minería
de datos multi-relacional, pero existen aplicaciones que
pueden convertir una colección de tablas relacionadas de una
base de datos en una única tabla que ya puede ser procesada
con Weka.1
El algoritmo utilizado fue redes neuronales debido a que en
minería de datos se manejan dos tipos de técnicas las
predictivas y las descriptivas, en nuestro artículos se trata
sobre un tema de investigación cuyo estudio necesita ser
realizado a través de variables y resultados predictivos, las
redes neuronales está dentro del grupo de estas técnicas por
ese motivo se escogió esta técnica. Al basarse en el sistema

2

nervioso y principalmente el en cerebro tiene varias ventajas
como:
•

Aprendizaje: Las RNA tienen la habilidad de

•

aprender mediante una etapa que se llama etapa de
aprendizaje. Esta consiste en proporcionar a la RNA
datos como entrada a su vez que se le indica cuál es
la salida (respuesta) esperada.
Auto organización: Una RNA crea su propia

•

representación de la información en su interior,
descargando al usuario de esto.
Tolerancia a fallos: Debido a que una RNA

•

almacena la información de forma redundante, ésta
puede seguir respondiendo de manera aceptable aun
si se daña parcialmente.
Flexibilidad: Una RNA puede manejar cambios no

•

importantes en la información de entrada, como
señales con ruido u otros cambios en la entrada (por
ejemplo si la información de entrada es la imagen de
un objeto, la respuesta correspondiente no sufre
cambios si la imagen cambia un poco su brillo o el
objeto cambia ligeramente).
Tiempo real: La estructura de una RNA es paralela,
por lo cual si esto es implementado con
computadoras
o
en dispositivos
electrónicos
especiales, se pueden obtener respuestas en tiempo
real.

III.

RESULTADOS

El total de estudiantes matriculados por carrera en cada uno de
los periodos investigados son:
Pontificia Universidad Católica del Ecuador Sede Santo Domingo-Escuela de Ingeniería de Sistemas. Vega Daniel, Bonilla
Patricio, González Luis. DUCT.
Test mode:

3

evaluate on training data

=== Clustering model (full training set) ===
kMeans
======
Number of iterations: 2
Within cluster sum of squared errors: 0.0
Missing values globally replaced with mean/mode
Cluster centroids:
De acuerdo a los datos recopilados en la investigación y
después de haber utilizado la herramienta y aplicado el
algoritmo de agrupación se ha obtenido la información y
gráficos que se muestran a continuación separados en
diferentes grupos según el indicador deseado.
Desertores por Escuelas

Título: Gráfico 1
Autores: Los Investigadores
El número de deserciones en los periodos estudiado es relativo
al número de estudiantes que ingresan a la carrera o escuela.
Teniendo en mayor número a la Escuela de Ciencias
Administrativas y Contables seguida de la Escuela de
Sistemas.
La herramienta utilizada refleja las siguientes líneas y
porcentajes según los datos ingresados.
=== Run information ===
Scheme:
weka.clusterers.SimpleKMeans -N 8 -A
"weka.core.EuclideanDistance -R first-last" -I 500 -num-slots
1 -S 10
Relation: desercionesweka.filters.unsupervised.attribute.Remove-R2-5
Instances: 783
Attributes: 1
escuela

Cluster#
Attribute
Data
1
3
5

Full
0
2
4
6

(783)
(129)
(325)
(49)
(123)
(57)
(58)
(42)
============================================
============================================
============================================
============================================
============================================
============================================
============================================
===========================
escuela
CIENCIAS_ADMINISTRATIVAS_Y_CONTABLES
ENFERMERIA
CIENCIAS_ADMINISTRATIVAS_Y_CONTABLES
DISEÑO
SISTEMAS
HOTELERIA_Y_TURISMO
COMUNICACION_SOCIAL
CIENCIAS_DE_LA_EDUCACION

Time taken to build model (full training data) : 0.01 seconds
=== Model and evaluation on training set ===
Clustered Instances
0
1
2
3
4

129 ( 16%)
325 ( 4%)2
49 ( 6%)
123 ( 16%)
57 ( 7%)

ESCUELAS
Pontificia Universidad Católica del Ecuador Sede Santo Domingo-Escuela de Ingeniería de Sistemas. Vega Daniel, Bonilla
Patricio, González Luis. DUCT.
5
6

4

58 ( 7%)
42 ( 5%)

Desertores según Género

Time taken to build model (full training data) : 0.01 seconds
=== Model and evaluation on training set ===
Clustered Instances
0
1

513 ( 66%)
270 ( 34%)

GÉNEROS

Resultados finales
Estudio realizado durante los periodos: 201001, 201002,
201101, 201102, 201201, 201202, 201301.
Total
Matriculados

Carreras

Titulo: Grafico 2
Autores: Los Investigadores

CIENCIAS ADMINISTRATIVAS Y
CONTABLES

Total
Desertores

%
Deserciones

Extrañamente la sumatoria entre las carreras, los estudiantes
que desertan en mayor cantidad son de sexo femenino, en la
escuela que más mujeres desertan es en la de Ciencias
Administrativas y Contables, seguido de Enfermería.
En este caso la herramienta mostró los siguientes datos:

3.815

325

8,5

%

CIENCIAS DE LA EDUCACION

637

42

6,6

%

COMUNICACION SOCIAL

807

58

7,2

%

DISEÑO

864

49

5,7

%

1.314

129

9,8

%

949

57

6,0

%

1.104

123

11,1

%

ENFERMERIA
HOTELERIA Y TURISMO
SISTEMAS

=== Run information ===
IV.
Scheme:
weka.clusterers.SimpleKMeans -N 8 -A
"weka.core.EuclideanDistance -R first-last" -I 500 -num-slots
1 -S 10
Relation: desercionesweka.filters.unsupervised.attribute.Remove-R1-3,5
Instances: 783
Attributes: 1
genero
Test mode: evaluate on training data
=== Clustering model (full training set) ===
kMeans
======
Number of iterations: 2
Within cluster sum of squared errors: 0.0
Missing values globally replaced with mean/mode
Cluster centroids:
Cluster#
Attribute Full Data
0
1
(783)
(513) (270)
==========================================
genero
FEMENINO FEMENINO MASCULINO

DISCUSIÓN

En este artículo se planteó un tema muy interesante,
generador de discusiones en pasillos y hogares como que
carrera es más difícil, y que aquellos que siguen carreras
técnicas son más capaces y estas son más fuertes. No
podremos determinar si es así o no, sin embargo la
información reflejada en el transcurso de esta investigación
producto de datos reales adquiridos de la PUCE SD muestra
que la carrera técnica ofertada, es decir, la escuela de
Ingeniería de Sistemas es la que ocupa el primer lugar en
porcentaje de deserciones en los periodos estudiados, seguida
por la Escuela de Enfermería, se podrá acotar al número de
estudiantes que ingresan a cada escuela, a la exigencia de
estas, o simplemente a las razones enumeradas al inicio de esta
investigación.
Lo que podemos concluir de esto es que nuestra hipótesis
pudo ser comprobada de forma afirmativa de igual forma las
preguntas de investigación.

APÉNDICE
Los apéndices, si son necesarios, aparecen antes del
reconocimiento.
Pontificia Universidad Católica del Ecuador Sede Santo Domingo-Escuela de Ingeniería de Sistemas. Vega Daniel, Bonilla
Patricio, González Luis. DUCT.

REFERENCIAS

[1] P. Reutemann; B. Pfahringer and E. Frank (2004).
«Proper: A Toolbox for Learning from Relational Data with
Propositional and Multi-Instance Learners». 17th
Australian Joint Conference on Artificial Intelligence
(AI2004). Springer-Verlag. Consultado el 25-06-2007.W.-

Autores
Daniel Vega
Estudiante de Escuela de Sistemas
Pontificia Universidad Católica del Ecuador Sede Santo
Domingo
Patricio Bonilla
Estudiante de Escuela de Sistemas
Pontificia Universidad Católica del Ecuador Sede Santo
Domingo
Luis González
Estudiante de Escuela de Sistemas
Pontificia Universidad Católica del Ecuador Sede Santo
Domingo

5
Pontificia Universidad Católica del Ecuador Sede Santo Domingo-Escuela de Ingeniería de Sistemas. Vega Daniel, Bonilla
Patricio, González Luis. DUCT.

REFERENCIAS

[1] P. Reutemann; B. Pfahringer and E. Frank (2004).
«Proper: A Toolbox for Learning from Relational Data with
Propositional and Multi-Instance Learners». 17th
Australian Joint Conference on Artificial Intelligence
(AI2004). Springer-Verlag. Consultado el 25-06-2007.W.-

Autores
Daniel Vega
Estudiante de Escuela de Sistemas
Pontificia Universidad Católica del Ecuador Sede Santo
Domingo
Patricio Bonilla
Estudiante de Escuela de Sistemas
Pontificia Universidad Católica del Ecuador Sede Santo
Domingo
Luis González
Estudiante de Escuela de Sistemas
Pontificia Universidad Católica del Ecuador Sede Santo
Domingo

5

Más contenido relacionado

Similar a La deserción estudiantil y la mineria de datos

Proyecto sistema matriculas
Proyecto sistema matriculasProyecto sistema matriculas
Proyecto sistema matriculas
Wildo Huillca Moyna
 
Proyecto matricula
Proyecto matriculaProyecto matricula
Proyecto matricula
Adriana Córdova Ramos
 
Proyecto RNA ainvestigación1
Proyecto RNA ainvestigación1Proyecto RNA ainvestigación1
Proyecto RNA ainvestigación1
Levy GT
 
G7 evaluacion final_articulo
G7 evaluacion final_articuloG7 evaluacion final_articulo
G7 evaluacion final_articulo
signacolombia
 
Sitema de control de matricula
Sitema de control de matriculaSitema de control de matricula
Sitema de control de matricula
Taty Mi Sun Huayra Huanhuayo
 
Escuela Superior de Cd Sahagun plantilla2.pptx
Escuela Superior de Cd Sahagun plantilla2.pptxEscuela Superior de Cd Sahagun plantilla2.pptx
Escuela Superior de Cd Sahagun plantilla2.pptx
josevillaltadso
 
Tarea silabo2
Tarea silabo2Tarea silabo2
Tarea silabo2
henryw79
 
Proyecto final de Ntics
Proyecto final de Ntics Proyecto final de Ntics
Proyecto final de Ntics
AbdulAmin9
 
Proyecto
ProyectoProyecto
Proyecto
Javier Trujillo
 
Análisis proyecto STEM
Análisis proyecto STEMAnálisis proyecto STEM
Análisis proyecto STEM
AlbertJaimejuanPanad
 
software educativo
software educativosoftware educativo
software educativo
tejada11
 
Presentacion
PresentacionPresentacion
Presentacion
LuisanaMercedesPirel
 
INSTALACION DE UNA RED LAN EN LA ESCUEA EJERCITO ECUATORIANO
INSTALACION DE UNA RED LAN EN LA ESCUEA EJERCITO ECUATORIANOINSTALACION DE UNA RED LAN EN LA ESCUEA EJERCITO ECUATORIANO
INSTALACION DE UNA RED LAN EN LA ESCUEA EJERCITO ECUATORIANO
tvcceccy17
 
Deber2
Deber2Deber2
Deber2
Deber2Deber2
Deber2
arbolita
 
Nuevas Herramientas Informáticas para La Educación Superior a Distancia.
Nuevas Herramientas Informáticas para La Educación Superior a Distancia.Nuevas Herramientas Informáticas para La Educación Superior a Distancia.
Nuevas Herramientas Informáticas para La Educación Superior a Distancia.
Cristhian Flores Urgilés
 
Bmfcie.87i
Bmfcie.87iBmfcie.87i
Bmfcie.87i
Jorge Castillo
 
GESTION DE PROYECTOS "IMPLEMENTACION DE LA RED LAN DEL INSTITURO MARIO GUITIE...
GESTION DE PROYECTOS "IMPLEMENTACION DE LA RED LAN DEL INSTITURO MARIO GUITIE...GESTION DE PROYECTOS "IMPLEMENTACION DE LA RED LAN DEL INSTITURO MARIO GUITIE...
GESTION DE PROYECTOS "IMPLEMENTACION DE LA RED LAN DEL INSTITURO MARIO GUITIE...
alexander jeanpaul salazar marquez
 
Perfil de tesis Corregido
Perfil de tesis CorregidoPerfil de tesis Corregido
Perfil de tesis Corregido
Jorge Villamar Gastesi
 
tesis.pdf
tesis.pdftesis.pdf

Similar a La deserción estudiantil y la mineria de datos (20)

Proyecto sistema matriculas
Proyecto sistema matriculasProyecto sistema matriculas
Proyecto sistema matriculas
 
Proyecto matricula
Proyecto matriculaProyecto matricula
Proyecto matricula
 
Proyecto RNA ainvestigación1
Proyecto RNA ainvestigación1Proyecto RNA ainvestigación1
Proyecto RNA ainvestigación1
 
G7 evaluacion final_articulo
G7 evaluacion final_articuloG7 evaluacion final_articulo
G7 evaluacion final_articulo
 
Sitema de control de matricula
Sitema de control de matriculaSitema de control de matricula
Sitema de control de matricula
 
Escuela Superior de Cd Sahagun plantilla2.pptx
Escuela Superior de Cd Sahagun plantilla2.pptxEscuela Superior de Cd Sahagun plantilla2.pptx
Escuela Superior de Cd Sahagun plantilla2.pptx
 
Tarea silabo2
Tarea silabo2Tarea silabo2
Tarea silabo2
 
Proyecto final de Ntics
Proyecto final de Ntics Proyecto final de Ntics
Proyecto final de Ntics
 
Proyecto
ProyectoProyecto
Proyecto
 
Análisis proyecto STEM
Análisis proyecto STEMAnálisis proyecto STEM
Análisis proyecto STEM
 
software educativo
software educativosoftware educativo
software educativo
 
Presentacion
PresentacionPresentacion
Presentacion
 
INSTALACION DE UNA RED LAN EN LA ESCUEA EJERCITO ECUATORIANO
INSTALACION DE UNA RED LAN EN LA ESCUEA EJERCITO ECUATORIANOINSTALACION DE UNA RED LAN EN LA ESCUEA EJERCITO ECUATORIANO
INSTALACION DE UNA RED LAN EN LA ESCUEA EJERCITO ECUATORIANO
 
Deber2
Deber2Deber2
Deber2
 
Deber2
Deber2Deber2
Deber2
 
Nuevas Herramientas Informáticas para La Educación Superior a Distancia.
Nuevas Herramientas Informáticas para La Educación Superior a Distancia.Nuevas Herramientas Informáticas para La Educación Superior a Distancia.
Nuevas Herramientas Informáticas para La Educación Superior a Distancia.
 
Bmfcie.87i
Bmfcie.87iBmfcie.87i
Bmfcie.87i
 
GESTION DE PROYECTOS "IMPLEMENTACION DE LA RED LAN DEL INSTITURO MARIO GUITIE...
GESTION DE PROYECTOS "IMPLEMENTACION DE LA RED LAN DEL INSTITURO MARIO GUITIE...GESTION DE PROYECTOS "IMPLEMENTACION DE LA RED LAN DEL INSTITURO MARIO GUITIE...
GESTION DE PROYECTOS "IMPLEMENTACION DE LA RED LAN DEL INSTITURO MARIO GUITIE...
 
Perfil de tesis Corregido
Perfil de tesis CorregidoPerfil de tesis Corregido
Perfil de tesis Corregido
 
tesis.pdf
tesis.pdftesis.pdf
tesis.pdf
 

Más de MARCO POLO SILVA SEGOVIA

Autoevaluación portafolio profesor compiladores
Autoevaluación portafolio profesor compiladoresAutoevaluación portafolio profesor compiladores
Autoevaluación portafolio profesor compiladores
MARCO POLO SILVA SEGOVIA
 
Tutorial compiladores
Tutorial compiladoresTutorial compiladores
Tutorial compiladores
MARCO POLO SILVA SEGOVIA
 
Jlex y cup en java
Jlex y cup en javaJlex y cup en java
Jlex y cup en java
MARCO POLO SILVA SEGOVIA
 
Lex yacc
Lex yaccLex yacc
Resumencap1 carmen vargas_jeremycamacho
Resumencap1 carmen vargas_jeremycamachoResumencap1 carmen vargas_jeremycamacho
Resumencap1 carmen vargas_jeremycamacho
MARCO POLO SILVA SEGOVIA
 
Capitulo 3 paul carrera,dego balcazar
Capitulo 3 paul carrera,dego balcazarCapitulo 3 paul carrera,dego balcazar
Capitulo 3 paul carrera,dego balcazar
MARCO POLO SILVA SEGOVIA
 
Capítulo 2 compiladores (willian gallo -------boris chungandro)
Capítulo 2 compiladores (willian gallo -------boris chungandro)Capítulo 2 compiladores (willian gallo -------boris chungandro)
Capítulo 2 compiladores (willian gallo -------boris chungandro)
MARCO POLO SILVA SEGOVIA
 
Decompilador y metacompilador
Decompilador y metacompiladorDecompilador y metacompilador
Decompilador y metacompilador
MARCO POLO SILVA SEGOVIA
 
Compiladores
CompiladoresCompiladores
Tarea de compiladores carmen vargas_metacompiladordescompilador
Tarea de compiladores carmen vargas_metacompiladordescompiladorTarea de compiladores carmen vargas_metacompiladordescompilador
Tarea de compiladores carmen vargas_metacompiladordescompilador
MARCO POLO SILVA SEGOVIA
 
Compiladores
CompiladoresCompiladores
Registro anecdótico procesos y calidad
Registro anecdótico procesos y calidadRegistro anecdótico procesos y calidad
Registro anecdótico procesos y calidad
MARCO POLO SILVA SEGOVIA
 
Autoevaluación portafolio profesor procesos y calidad
Autoevaluación portafolio profesor procesos y calidadAutoevaluación portafolio profesor procesos y calidad
Autoevaluación portafolio profesor procesos y calidad
MARCO POLO SILVA SEGOVIA
 
Procesos y calidad i parcial
Procesos y calidad i parcialProcesos y calidad i parcial
Procesos y calidad i parcial
MARCO POLO SILVA SEGOVIA
 
Prueba de aplicaciones
Prueba de aplicacionesPrueba de aplicaciones
Prueba de aplicaciones
MARCO POLO SILVA SEGOVIA
 
Procesos itil! aviles maruri
Procesos itil! aviles maruriProcesos itil! aviles maruri
Procesos itil! aviles maruri
MARCO POLO SILVA SEGOVIA
 
prueba de aplicaciones convencionales
prueba de aplicaciones convencionalesprueba de aplicaciones convencionales
prueba de aplicaciones convencionales
MARCO POLO SILVA SEGOVIA
 
aseguramiento de la calidad de software acs
aseguramiento de la calidad de software acsaseguramiento de la calidad de software acs
aseguramiento de la calidad de software acs
MARCO POLO SILVA SEGOVIA
 
tecnicas de revisión del software
tecnicas de revisión del softwaretecnicas de revisión del software
tecnicas de revisión del software
MARCO POLO SILVA SEGOVIA
 
conceptos de calidad
conceptos de calidadconceptos de calidad
conceptos de calidad
MARCO POLO SILVA SEGOVIA
 

Más de MARCO POLO SILVA SEGOVIA (20)

Autoevaluación portafolio profesor compiladores
Autoevaluación portafolio profesor compiladoresAutoevaluación portafolio profesor compiladores
Autoevaluación portafolio profesor compiladores
 
Tutorial compiladores
Tutorial compiladoresTutorial compiladores
Tutorial compiladores
 
Jlex y cup en java
Jlex y cup en javaJlex y cup en java
Jlex y cup en java
 
Lex yacc
Lex yaccLex yacc
Lex yacc
 
Resumencap1 carmen vargas_jeremycamacho
Resumencap1 carmen vargas_jeremycamachoResumencap1 carmen vargas_jeremycamacho
Resumencap1 carmen vargas_jeremycamacho
 
Capitulo 3 paul carrera,dego balcazar
Capitulo 3 paul carrera,dego balcazarCapitulo 3 paul carrera,dego balcazar
Capitulo 3 paul carrera,dego balcazar
 
Capítulo 2 compiladores (willian gallo -------boris chungandro)
Capítulo 2 compiladores (willian gallo -------boris chungandro)Capítulo 2 compiladores (willian gallo -------boris chungandro)
Capítulo 2 compiladores (willian gallo -------boris chungandro)
 
Decompilador y metacompilador
Decompilador y metacompiladorDecompilador y metacompilador
Decompilador y metacompilador
 
Compiladores
CompiladoresCompiladores
Compiladores
 
Tarea de compiladores carmen vargas_metacompiladordescompilador
Tarea de compiladores carmen vargas_metacompiladordescompiladorTarea de compiladores carmen vargas_metacompiladordescompilador
Tarea de compiladores carmen vargas_metacompiladordescompilador
 
Compiladores
CompiladoresCompiladores
Compiladores
 
Registro anecdótico procesos y calidad
Registro anecdótico procesos y calidadRegistro anecdótico procesos y calidad
Registro anecdótico procesos y calidad
 
Autoevaluación portafolio profesor procesos y calidad
Autoevaluación portafolio profesor procesos y calidadAutoevaluación portafolio profesor procesos y calidad
Autoevaluación portafolio profesor procesos y calidad
 
Procesos y calidad i parcial
Procesos y calidad i parcialProcesos y calidad i parcial
Procesos y calidad i parcial
 
Prueba de aplicaciones
Prueba de aplicacionesPrueba de aplicaciones
Prueba de aplicaciones
 
Procesos itil! aviles maruri
Procesos itil! aviles maruriProcesos itil! aviles maruri
Procesos itil! aviles maruri
 
prueba de aplicaciones convencionales
prueba de aplicaciones convencionalesprueba de aplicaciones convencionales
prueba de aplicaciones convencionales
 
aseguramiento de la calidad de software acs
aseguramiento de la calidad de software acsaseguramiento de la calidad de software acs
aseguramiento de la calidad de software acs
 
tecnicas de revisión del software
tecnicas de revisión del softwaretecnicas de revisión del software
tecnicas de revisión del software
 
conceptos de calidad
conceptos de calidadconceptos de calidad
conceptos de calidad
 

La deserción estudiantil y la mineria de datos

  • 1. Pontificia Universidad Católica del Ecuador Sede Santo Domingo-Escuela de Ingeniería de Sistemas. Vega Daniel, Bonilla Patricio, González Luis. DUCT. 1 Deserciones Universitarias: Caso de estudio: Carreras técnicas más difíciles o menos atractivas. Vega, Daniel., Bonilla, Patricio y González, Luis. Estudiantes PUCE SD Resumen— Este artículo aborda el tema sobre las deserciones universitarias, con la finalidad de elaborar un modelo que permita identificar el porcentaje de estudiantes que abandonan la carrera semestre a semestre tomando como referencia información obtenida de la Pontificia Universidad Católica del Ecuador Sede Santo Domingo. El análisis de este tema permitirá obtener información que pueda ayudar a prevenir las deserciones. El objetivo de este trabajo es investigar el porcentaje de deserciones por carrera existente en la PUCE SD, conocer el grado de aceptación que ha obtenido la institución periodo a periodo debido al incremento de exigencia como consecuencia de la acreditación de universidades realizada a nivel nacional. La técnica que se ha implementado para obtener los resultados de las deserciones ha sido minería de datos o data mining a través de la herramienta open source denominada Weka, esta herramienta utiliza diferentes algoritmos para la ejecución, el algoritmo utilizado ha sido el de agrupamiento SimpleKMeans. Índice de Términos— deserción, modelo, educación superior, acreditación de universidades, weka. Abstract- This paper addresses the issue of university dropouts, in order to develop a model to identify the percentage of students who drop out of race semester to semester by reference information from the Catholic University of Santo Domingo Ecuador Headquarters. The analysis of this issue will provide information that can help prevent defections. The aim of this paper is to investigate the percentage of desertions by existing career in PUCE SD, determine the degree of acceptance that has earned the institution period to period due to increased demand as a result of the accreditation of universities on a national level. The technique has been implemented to obtain the results of defections has been data mining or data mining through open source tool called weka , this tool using different algorithm to implement the algorithm used was the grouping SimplekMeans.  Index Terms-dropout model, higher education, accreditation of universities, weka. I. INTRODUCCIÓN La deserción es uno de los principales problemas que afrontan las instituciones de Educación Superior. Es un problema que preocupa debido a sus consecuencias sociales, institucionales y personales que trae como repercusión este tema. Los estudios revisados de investigación sobre el tema de deserciones universitarias muestran que existen diferentes causas como: escasa información previa, reiterados fracasos en los exámenes finales, origen social, la elección inadecuada de la carrera, características familiares, circunstancias de la vida, entre otras. En este artículo no trataremos a fondo sobre estas causas debido a que es muy complicado tener información real estadística sobre las causas antes mencionadas. Las universidades en el país se encuentran cursando un periodo de acreditaciones, el cual ha sido ejecutado por parte del gobierno poniendo a estas en grandes apuros provocando un incremento necesario en sus exigencias administrativas y educativas, dando a ciertas universidades créditos como también a otras provocando pérdidas económicas y de estudiantes. Este artículo es un grado de avance de investigación sobre la temática de deserciones universitarias en las carreras que existen en la PUCE SD, Ingeniería Comercial, Contabilidad y Auditoría, Comunicación Social, Diseño, Enfermería, Ingeniería de Sistemas, Hotelería y Turismo, Licenciatura en Docencia y Gestión de Educación Básica. El objetivo general de este trabajo de investigación es determinar el porcentaje de deserciones por cada una de las carreras de la PUCE SD. La técnica que se ha implementado para obtener los resultados de las deserciones ha sido minería de datos o data mining a través de la herramienta open source denominada weka, esta herramienta utilizas diferentes algoritmos para el análisis de datos, el algoritmo utilizado ha sido el de agrupamiento SimpleKMeans, este algoritmo permite agrupar la información como conjuntos, haciendo mas fácil su interpretación. Esta herramienta contiene una colección de modelos de visualización y algoritmos para el análisis de datos y
  • 2. Pontificia Universidad Católica del Ecuador Sede Santo Domingo-Escuela de Ingeniería de Sistemas. Vega Daniel, Bonilla Patricio, González Luis. DUCT. modelado predictivo, unido a una interfaz gráfica de usuario para acceder fácilmente a sus funcionalidades. Los puntos fuertes de weka son: • Está disponible libremente bajo licencia pública GNU. • Es muy portable porque está completamente implementado en java y puede correr en casi cualquier plataforma. • Contiene una extensa colección de técnicas para pre procesamiento de datos y modelado. • Fácil de utilizar. Las redes neuronales son un paradigma de aprendizaje automático inspirado en la forma en que funciona el sistema nervioso de animales. Es un sistema de interconexión de neuronas que interactúan entre sí para producir una salida a través de estímulos. En inteligencia artificial se los denomina redes neuronales. El porcentaje de deserciones es mayor en las carreras técnicas que en las demás carreras, es la hipótesis que se plantea en este trabajo. A la PUCE SD le interesa conocer el porcentaje de deserciones por carrera, manejando a través de un proyecto con sus estudiantes esta investigación, justificando de esta manera la elaboración y ejecución de este artículo, mediante las siguientes preguntas de investigación. ¿Este artículo permitirá tener una visión clara para la toma de decisiones? ¿El porcentaje de deserciones por carrera presentado en este trabajo determinara si las carreras técnicas son más complejas o no? II. MÉTODOS Y MATERIALES La herramienta weka soporta varias tareas estándar de minería de datos, especialmente, pre procesamiento de datos, clustering, clasificación, regresión, visualización, y selección. Todas las técnicas de Weka se fundamentan en la asunción de que los datos están disponibles en un fichero plano (flat file) o una relación, en la que cada registro de datos está descrito por un número fijo de atributos (normalmente numéricos o nominales, aunque también se soportan otros tipos). Weka también proporciona acceso a bases de datos vía SQL gracias a la conexión JDBC (Java Database Connectivity) y puede procesar el resultado devuelto por una consulta hecha a la base de datos. No puede realizar minería de datos multi-relacional, pero existen aplicaciones que pueden convertir una colección de tablas relacionadas de una base de datos en una única tabla que ya puede ser procesada con Weka.1 El algoritmo utilizado fue redes neuronales debido a que en minería de datos se manejan dos tipos de técnicas las predictivas y las descriptivas, en nuestro artículos se trata sobre un tema de investigación cuyo estudio necesita ser realizado a través de variables y resultados predictivos, las redes neuronales está dentro del grupo de estas técnicas por ese motivo se escogió esta técnica. Al basarse en el sistema 2 nervioso y principalmente el en cerebro tiene varias ventajas como: • Aprendizaje: Las RNA tienen la habilidad de • aprender mediante una etapa que se llama etapa de aprendizaje. Esta consiste en proporcionar a la RNA datos como entrada a su vez que se le indica cuál es la salida (respuesta) esperada. Auto organización: Una RNA crea su propia • representación de la información en su interior, descargando al usuario de esto. Tolerancia a fallos: Debido a que una RNA • almacena la información de forma redundante, ésta puede seguir respondiendo de manera aceptable aun si se daña parcialmente. Flexibilidad: Una RNA puede manejar cambios no • importantes en la información de entrada, como señales con ruido u otros cambios en la entrada (por ejemplo si la información de entrada es la imagen de un objeto, la respuesta correspondiente no sufre cambios si la imagen cambia un poco su brillo o el objeto cambia ligeramente). Tiempo real: La estructura de una RNA es paralela, por lo cual si esto es implementado con computadoras o en dispositivos electrónicos especiales, se pueden obtener respuestas en tiempo real. III. RESULTADOS El total de estudiantes matriculados por carrera en cada uno de los periodos investigados son:
  • 3. Pontificia Universidad Católica del Ecuador Sede Santo Domingo-Escuela de Ingeniería de Sistemas. Vega Daniel, Bonilla Patricio, González Luis. DUCT. Test mode: 3 evaluate on training data === Clustering model (full training set) === kMeans ====== Number of iterations: 2 Within cluster sum of squared errors: 0.0 Missing values globally replaced with mean/mode Cluster centroids: De acuerdo a los datos recopilados en la investigación y después de haber utilizado la herramienta y aplicado el algoritmo de agrupación se ha obtenido la información y gráficos que se muestran a continuación separados en diferentes grupos según el indicador deseado. Desertores por Escuelas Título: Gráfico 1 Autores: Los Investigadores El número de deserciones en los periodos estudiado es relativo al número de estudiantes que ingresan a la carrera o escuela. Teniendo en mayor número a la Escuela de Ciencias Administrativas y Contables seguida de la Escuela de Sistemas. La herramienta utilizada refleja las siguientes líneas y porcentajes según los datos ingresados. === Run information === Scheme: weka.clusterers.SimpleKMeans -N 8 -A "weka.core.EuclideanDistance -R first-last" -I 500 -num-slots 1 -S 10 Relation: desercionesweka.filters.unsupervised.attribute.Remove-R2-5 Instances: 783 Attributes: 1 escuela Cluster# Attribute Data 1 3 5 Full 0 2 4 6 (783) (129) (325) (49) (123) (57) (58) (42) ============================================ ============================================ ============================================ ============================================ ============================================ ============================================ ============================================ =========================== escuela CIENCIAS_ADMINISTRATIVAS_Y_CONTABLES ENFERMERIA CIENCIAS_ADMINISTRATIVAS_Y_CONTABLES DISEÑO SISTEMAS HOTELERIA_Y_TURISMO COMUNICACION_SOCIAL CIENCIAS_DE_LA_EDUCACION Time taken to build model (full training data) : 0.01 seconds === Model and evaluation on training set === Clustered Instances 0 1 2 3 4 129 ( 16%) 325 ( 4%)2 49 ( 6%) 123 ( 16%) 57 ( 7%) ESCUELAS
  • 4. Pontificia Universidad Católica del Ecuador Sede Santo Domingo-Escuela de Ingeniería de Sistemas. Vega Daniel, Bonilla Patricio, González Luis. DUCT. 5 6 4 58 ( 7%) 42 ( 5%) Desertores según Género Time taken to build model (full training data) : 0.01 seconds === Model and evaluation on training set === Clustered Instances 0 1 513 ( 66%) 270 ( 34%) GÉNEROS Resultados finales Estudio realizado durante los periodos: 201001, 201002, 201101, 201102, 201201, 201202, 201301. Total Matriculados Carreras Titulo: Grafico 2 Autores: Los Investigadores CIENCIAS ADMINISTRATIVAS Y CONTABLES Total Desertores % Deserciones Extrañamente la sumatoria entre las carreras, los estudiantes que desertan en mayor cantidad son de sexo femenino, en la escuela que más mujeres desertan es en la de Ciencias Administrativas y Contables, seguido de Enfermería. En este caso la herramienta mostró los siguientes datos: 3.815 325 8,5 % CIENCIAS DE LA EDUCACION 637 42 6,6 % COMUNICACION SOCIAL 807 58 7,2 % DISEÑO 864 49 5,7 % 1.314 129 9,8 % 949 57 6,0 % 1.104 123 11,1 % ENFERMERIA HOTELERIA Y TURISMO SISTEMAS === Run information === IV. Scheme: weka.clusterers.SimpleKMeans -N 8 -A "weka.core.EuclideanDistance -R first-last" -I 500 -num-slots 1 -S 10 Relation: desercionesweka.filters.unsupervised.attribute.Remove-R1-3,5 Instances: 783 Attributes: 1 genero Test mode: evaluate on training data === Clustering model (full training set) === kMeans ====== Number of iterations: 2 Within cluster sum of squared errors: 0.0 Missing values globally replaced with mean/mode Cluster centroids: Cluster# Attribute Full Data 0 1 (783) (513) (270) ========================================== genero FEMENINO FEMENINO MASCULINO DISCUSIÓN En este artículo se planteó un tema muy interesante, generador de discusiones en pasillos y hogares como que carrera es más difícil, y que aquellos que siguen carreras técnicas son más capaces y estas son más fuertes. No podremos determinar si es así o no, sin embargo la información reflejada en el transcurso de esta investigación producto de datos reales adquiridos de la PUCE SD muestra que la carrera técnica ofertada, es decir, la escuela de Ingeniería de Sistemas es la que ocupa el primer lugar en porcentaje de deserciones en los periodos estudiados, seguida por la Escuela de Enfermería, se podrá acotar al número de estudiantes que ingresan a cada escuela, a la exigencia de estas, o simplemente a las razones enumeradas al inicio de esta investigación. Lo que podemos concluir de esto es que nuestra hipótesis pudo ser comprobada de forma afirmativa de igual forma las preguntas de investigación. APÉNDICE Los apéndices, si son necesarios, aparecen antes del reconocimiento.
  • 5. Pontificia Universidad Católica del Ecuador Sede Santo Domingo-Escuela de Ingeniería de Sistemas. Vega Daniel, Bonilla Patricio, González Luis. DUCT. REFERENCIAS [1] P. Reutemann; B. Pfahringer and E. Frank (2004). «Proper: A Toolbox for Learning from Relational Data with Propositional and Multi-Instance Learners». 17th Australian Joint Conference on Artificial Intelligence (AI2004). Springer-Verlag. Consultado el 25-06-2007.W.- Autores Daniel Vega Estudiante de Escuela de Sistemas Pontificia Universidad Católica del Ecuador Sede Santo Domingo Patricio Bonilla Estudiante de Escuela de Sistemas Pontificia Universidad Católica del Ecuador Sede Santo Domingo Luis González Estudiante de Escuela de Sistemas Pontificia Universidad Católica del Ecuador Sede Santo Domingo 5
  • 6. Pontificia Universidad Católica del Ecuador Sede Santo Domingo-Escuela de Ingeniería de Sistemas. Vega Daniel, Bonilla Patricio, González Luis. DUCT. REFERENCIAS [1] P. Reutemann; B. Pfahringer and E. Frank (2004). «Proper: A Toolbox for Learning from Relational Data with Propositional and Multi-Instance Learners». 17th Australian Joint Conference on Artificial Intelligence (AI2004). Springer-Verlag. Consultado el 25-06-2007.W.- Autores Daniel Vega Estudiante de Escuela de Sistemas Pontificia Universidad Católica del Ecuador Sede Santo Domingo Patricio Bonilla Estudiante de Escuela de Sistemas Pontificia Universidad Católica del Ecuador Sede Santo Domingo Luis González Estudiante de Escuela de Sistemas Pontificia Universidad Católica del Ecuador Sede Santo Domingo 5