SlideShare una empresa de Scribd logo
1 de 9
Descargar para leer sin conexión
1
REDES BAYESIANAS PARA DETERMINAR LA
PROBABILIDAD DE CULMINAR UN
PROYECTO DE FIN DE CARRERA
1. J. Banda, 2. R. Rojas, Tutor: Ing. Henry Paz
Resumen—En el presente Paper se abordara temas como
Teorema de Bayes, Redes Bayesianas, Elvira, openmarkov, ex-
plicación de red bayesiana.
Index Terms—Red Bayesiana, Teorema de Bayes.
I. INTRODUCCIÓN
Una Red Bayesiana es un modelo probabilístico que
relaciona un conjunto de variables aleatorias mediante
un grafo dirigido, son redes gráficas sin ciclos en el que
se representan variables aleatorias y las relaciones de
probabilidad que existan entre ellas que permiten conseguir
soluciones a problemas de decisión en casos de incertidumbre.
Para que un estudiante universitario culmine su proyecto
de fin de carrera será necesario que cumpla con algunas
condiciones o parámetros indispensables para el desarrollo
y cumplimiento de su proyecto. Es de esta manera que para
determinar que tan probable es de que el estudiante culmine
su proyecto se utilizara redes bayesianas con el apoyo de
herramientas como Elvira, openmarkov, JAVA.
Se tendrá presente que los resultados ayudaran a distinguir
las probabilidades de culminar el proyecto de fin de carrera.
II. ESTADO DEL ARTE
II-A. Redes Bayesianas
Una Red Bayesiana es un modelo probabilístico que
relaciona un conjunto de variables aleatorias mediante
un grafo dirigido, son redes graficas sin ciclos en el que
se representan variables aleatorias y las relaciones de
probabilidad que existan entre ellas que permiten conseguir
soluciones a problemas de decisión en casos de incertidumbre.
Una red bayesiana es una representación ilustrada de
dependencias para razonamiento probabilístico, en la cual los
nodos representan variables aleatorias y los arcos simbolizan
relaciones de dependencia directa entre las variables [1]
1. J. Banda, Universidad Nacional de Loja, Loja, Ecuador, e-mail: jiban-
dab@unl.edu.ec
2. R. Rojas, Universidad Nacional de Loja, Loja, Ecuador, e-mail: rfro-
jasl@unl.edu.ec
Manuscrito recibido el 09 de Junio, 2014; revisado el 09 de Junio, 2014.
Un ejemplo muy simple puede ayudarnos a describir el fun-
cionamiento de una red bayesiana. Consideremos simplemente
una variable aleatoria Z dependiente de otras dos (factores F1
y F2). El grafo expresivo de esta relación será, obviamente, el
siguiente (figura1)
Fig.1 Grafo expresivo
Una red Bayesiana es una herramienta informática a la
que puede crearse diferentes modelos dependiendo del caso
de estudio según la concepción que tenga el diseñador y
de las condiciones del comportamiento de las variables. En
esta herramienta sobresale debido a que no solo permite
un proceso hacia atrás (backward), por ejemplo como una
operación financiera que ha sido realizada en términos de
riesgos operacionales; sino también hacia adelante (forward)
donde la red puede calcular las probabilidades de pérdida o
de beneficio usando la regla de Bayes.
La estructura del modelo bayesiano permite capturar las
relaciones de dependencia que existe entre los atributos
de los datos que se estudien, describiendo la distribución
de probabilidad que administra un conjunto de variables
especificando los cálculos de independencia condicional junto
con probabilidades condicionales. Así, las redes permiten
especificar relaciones de independencia entre conjuntos
de variables, lo que las convierte en una solución de
independencia.
II-B. Dimensión Cualitativa
El soporte teórico de la dimensión cualitativa en las redes
bayesianas lo aporta la teoría de grafos. La teoría de grafos
trata de crear modelos gráficos (grafos) que representen
los elementos del problema en un sentido holista y fue
introducida por Euler para dar solución al problema de los
puentes de Königsberg (Harary, 1969; Ríos, 1995).
Una red bayesiana es un grafo, podemos definirla como un
par G = (V, E), donde V es un conjunto finito de vértices,
2
nodos o variables y E es un subconjunto del conjunto V
x V de pares ordenados de vértices llamados enlaces o
aristas. Además, una red bayesiana es un tipo particular de
gráfico que se denomina grafo dirigido acíclico. Dirigido
hace referencia a que los enlaces entre los vértices del grafo
están orientados.
En una red bayesiana pueden existir tres tipos de conexiones
básicas (seriales, convergentes y divergentes), cada una con
propiedades cualitativas diferentes y que favorecen la
propagación de probabilidades ante una nueva evidencia
sobre el modelo [2]
Desde el punto de vista del análisis de datos, las redes
bayesianas son una potente herramienta por varios motivos [3]:
No suponen un determinado modelo subyacente.
Son fácilmente interpretables.
Son adaptables y permiten la incorporación de conoci-
miento a prioridad de forma cualitativa.
II-C. Dimensión Cuantitativa
Hay tres elementos esenciales que caracterizan la dimensión
cuantitativa de una red bayesiana: el concepto de probabilidad
como un grado de creencia subjetiva relativa a la ocurrencia de
un evento, el teorema de Bayes como heurístico actualizador
de creencias y un conjunto de funciones de probabilidad
condicionada.
Existen, al menos, cuatro formas de entender la
probabilidad: la clásica, empírica, axiomática y la subjetiva.
Desde la concepción clásica, introducida por Laplace, la
probabilidad de que ocurra un evento de un espacio muestral
viene dado por la razón que se establece entre el número de
casos favorables asociados al suceso y el número de casos
posibles [?, 3]
III. MODELOS BASADOS EN REDES BAYESIANAS
Una red bayesiana representa una distribución de probabi-
lidad multivariante, de manera que las relaciones de indepen-
dencia entre las variables que la forman quedan identificadas
de forma gráfica mediante el concepto de d-separación [3].
Dos variables A y B en una red bayesiana se dice que estan
d-separadas si todos los caminos entre A y B son como los
que aparecen en la fígura 1. Se dice además que C d-separa
a A y B.
El concepto de d-separación se corresponde con el de
independencia condicional, de manera que dos variables (o
conjuntos de variables) X e Y serán condicionalmente inde-
pendientes dada una tercera variable (o conjunto de variables
) Z si y sólo si Z d-separa a X e Y [3].
Fig.2 Caracterización gráfica del concepto de d-separación
IV. INFERENCIA BAYESIANA
Dentro de los métodos de razonamiento se encuentran los
Modelos Bayesianos, que simulan diferentes condiciones de
incertidumbre cuando no se conoce si es verdadera o falsa la
hipótesis enunciada en un rango de variación [3].
Todos los modelos bayesianos tienen en común la asig-
nación de la probabilidad como medida de creencia de una
hipótesis, así es que, la inferencia es un proceso de reajuste
de medidas de creencia al conocerse nuevos axiomas.
Cuando se utilizan evidencias y observaciones para esta-
blecer que una suposición sea cierta, es lo que se denomina
como Inferencia Bayesiana. La inferencia bayesiana observa
la evidencia y calcula un valor estimado según el grado
de creencia planteado en la hipótesis. Esto implica que al
tener mayor cantidad de datos disponibles se podrá obtener
resultados más satisfactorios.
La ventaja fundamental del uso de la inferencia bayesiana
radica en la utilidad que se le da para la toma de decisiones,
actualmente su uso es frecuente porque se obtienen resultados
más acertados en el contexto de parámetros desconocidos [5].
Aplicando la inferencia Bayesiana es posible identificar
distintos tipos de patrones de transición como estados de
ganancias discretas en un gran conjunto de datos administra-
tivos. Además, se puede investigar acerca de los efectos y las
condiciones del mercado por medio de la estimación de un
modelo probabilístico.
El mecanismo de inferencia sobre redes bayesianas per-
mite utilizarlas para construir clasificadores. Para que esto
se debe crear una red bayesiana en la que las variables
se interrelacionen en el grafo. La clase pertenecerá a la
variable desconocida, objetivo de la inferencia. Proporcionada
una instancia cualquiera para la que se conozcan todos sus
atributos, la clasificación se verificará infiriendo sobre el grafo
la probabilidad posterior de cada uno de los valores de la clase,
y eligiendo aquél valor que maximize dicha probabilidad.
V. TIPOS DE REDES BAYESIANAS
El problema Principal en el momento de construir una red
Bayesiana consiste en el tratamiento de variables discretas y
3
continuas de forma simultánea en la práctica, debido a las
restricciones del modelo condicional que conlleva al proceso
de discretización. Las redes bayesianas se pueden clasificar
según en función del tipo de variables utilizadas.
V-A. Redes Bayesianas Continuas
Las redes bayesianas continuas son aquellas que tienen un
número infinito de posibles valores. En este tipo de redes
resulta complicado determinar explícitamente las probabilida-
des condicionadas para cada valor de las variables, así que
las probabilidades condicionadas se representan mediante una
función de probabilidad.
La mayoría de las variables reales son de carácter continuo
como por ejemplo la variación de la temperatura. Una red
Bayesiana cuyas variables sean todas continuas y están todas
representadas mediante funciones normales lineales, tiene una
distribución normal multivariada. Este tipo de variables debe
ser manejada mediante el proceso de discretización debido a
la gran cantidad de datos que deben ser modelados por medio
de selección de rangos y de este modo hacer más sencillo el
proceso de discretización [4].
V-B. Redes Bayesianas Dinámicas
Las redes Bayesianas dinámicas consienten en la exposición
de procesos que contienen una variable aleatoria en cada
intervalo de tiempo. El proceso que se está estudiando puede
entenderse como una serie de procesos en un instante de
tiempo.
El estado de las variables se representa en un lapso de tiem-
po para poder representar los procesos dinámicos conocidos
dentro de la red bayesiana. Las probabilidades condicionales
de este modelo no cambian con el tiempo. Es decir, se repite
las etapas temporales y las relaciones entre dichas etapas.
La inferencia en una red bayesiana dinámica es la misma
que para una red bayesiana, y por esto se emplean los mismos
métodos. Esta inferencia resulta mediante la reproducción de
los intervalos de tiempo, hasta que la red sea lo suficiente larga
para captar todas las observaciones [6].
V-C. Teorema de Bayes.
Las redes bayecias se basan en el teorema de bayes
el cuál dice que P(A|B) no es igual a P(B|A),y esto se
demuestra ya que poseen elementos comunes pero cuentan
con denominadores diferentes. Fue observado desde hace
años atrás por el matemático Thomas Bayes (1763).
Para entender en que consiste partimos de la definición de
cada una de las dos probabilidades P(A|B) Y P(B|A).
Fig.3 Condicionalidad por definición.
A partir de estas definiciones ya con los respectivos despe-
jes, se procede a igualar las dos probabilidades y notamos que
existe diferencia en las mismas.
Fig.4 P(A|B) Y P(B|A), diferentes.
V-D. Elvira
Este programa permite el ingreso de las redes Bayesianas
de dos formas: (a) por un lado el ingreso manual, donde el
usuario dibuja la red bayesiana en la pantalla y carga los
valores de probabilidad asociados a cada nodo, (b) mediante
la importación de archivos de casos.
El programa Elvira es fruto de un proyecto de investigación
financiado por la CICYT y el Ministerio de Ciencia y
Tecnología, en el que participan investigadores de varias
universidades españolas y de otros centros. El programa
Elvira está destinado a la edición y evaluación de modelos
gráficos probabilistas, concretamente redes bayesianas y
diagramas de influencia. Elvira cuenta con un formato propio
para la codificación de los modelos, un lector interprete
para los modelos codificados, una interfaz gráfica para la
construcción de redes, con opciones específicas para modelos
canónicos (puertas OR, AND, MAX, etc.), algoritmos exactos
y aproximados (estocásticos) de razonamiento tanto para
variables discretas como continuas, métodos de explicación
del razonamiento, algoritmos de toma de decisiones,
aprendizaje de modelos a partir de bases de datos, fusión de
redes, etc.
Elvira está escrito y compilado en Java, lo cual permite
que funcione en diferentes plataformas y sistemas operativos
(MS-DOS/Windows, linux, Solaris, etc.).
V-D1. Instalación de Elvira: Para la instalación se di-
rige al siguiente link: http://www.ia.uned.es/7Eelvira/instalar/
Elvira.zip
Para poder ejecutar Elvira necesita tener instalada la versión
de Java correspondiente a su sistema operativo. Elvira funciona
con las versiones 5.0 y posteriores de Java, que se encuentran
disponibles para Windows, linux y Solaris. Cada una de ellas
tiene a su vez dos versiones, la de desarrollo, SDK (Software
Development Kit), y la de ejecución, JRE (Java Runtime
Environment). La primera incluye la segunda. Para usar Elvira
es suficiente la de ejecució, JRE.
V-D2. Descompresión de Elvira: Una vez instalado
Java, debe descomprimir el archivo Elvira.zip, que es común
para todas las plataformas (Windows, linux, Solaris...). La
versión 0.162 ocupa 3’2 MB. Se debe seleccionar la opción
"Descomprimir archivos2
escoger el directorio donde desee
4
descomprimirlos; por ejemplo, c:elvira.
Otra forma más fiable de descomprimir este archivo es
utilizar un programa específico, como 7-zip (que es gratuito),
WinZip, etc.
Si ha seguido las indicaciones anteriores, en el directorio
c:elvira encontrará el archivo Elvira.jar y varias subcarpetas.
También encontrará un pequeño manual de Elvira en
c:elviramanualmanual.html, muy útil en cuanto al
funcionamiento de la herramienta y con ejemplos.
V-D3. Ejecutar Elvira: La forma más fácil de ejecutar
Elvira en Windows es hacer doble-clic en el icono Elvira.jar,
que se encuentra en el directorio c:elvira.
En linux, debe situarse en el directorio donde ha insta-
lado Elvira y ejecutar la orden "java -jar Elvira.jar". Elvira
detecta automáticamente el idioma de su sistema operativo;
también puede seleccionar el idioma de forma manual median-
te"java -jar Elvira.jar -l sp"(español) o "java -jar Elvira.jar -l
ae"(American English).
V-E. OpenMarkov
OpenMarkov es una herramienta informática para modelos
gráficos probabilistas (MGPs) desarrollada por el Centro de
Investigación sobre Sistemas Inteligentes de la UNED en
Madrid.
Está diseñada para:
Editar y evaluar varios tipos de MPGs, tales como redes
bayesianas, diagramas de influencia, modelos de Markov
factorizados, etc.
Aprender redes bayesianas a partir de bases de datos de
forma interactiva
Análisis de coste-efectividad
V-E1. Descarga e inicio de OpenMarkov: Comprobar la
versión de Java. Actualmente OpenMarkov necesita Java 7.
Descarga este archivo org.openmarkov.full-0.1.4.jar (12
MB) en tu disco duro (o en un "pen-drive.o en un CD...)
y ejecuta OpenMarkov haciendo doble-clic sobre él. No
necesita instalación.
En su lugar, puedes descargar la versión más reciente
(puede ser inestable). Hay un truco para abrir las redes más
fácilmente con OpenMarkov, haciendo doble-clic sobre ellas.
VI. EJEMPLO PRÁCTICO DE REDES BAYESIANAS PARA
DETERMINAR LA PROBABILIDAD DE QUE UN
ESTUDIANTE PUEDA FINALIZAR SU PROYECTO DE FIN DE
CARRERA
El proyecto de fin de carrera o tesis es muy importante
para que el estudiante obtenga el título de Ing. El proyecto
puede presentarse solo si el estudiante tiene aprobado en
80 % de la carrera. Este deberá tener una duración de 2 años
como máximo. El estudiante deberá presentar primeramente
el anteproyecto definiendo un tema, problema, objetivos,
presupuesto y cronograma, dependiendo de la factibilidad
del mismo el proyecto puede ser pertinente (aprobado) o no
pertinente (reprobado).
En caso de ser pertinente el proyecto el estudiante deberá
solicitar Director para el proyecto, podrá ser Director de un
Proyecto, un profesor a fin a la línea de investigación, y que
no tenga exceso de proyectos a su cargo, pero no podrá ser
parte como Jurado en caso de disertación del Proyecto.
Una vez que se haya designado el Director al proyecto, el
estudiante deberá empezar con el desarrollo del mismo, el
cual se lo irá ejecutando en fases las cuales están detalladas
en el cronograma.
Si ya se cumplió en plazo de los 2 años y aún no se
ha terminado de desarrollo del proyecto, el estudiante tiene
derecho a pedir prórroga cuyo requisito es tener avanzado el
80 % del proyecto.
Si el estudiante terminó de desarrollar el proyecto en su
tiempo estimado, deberá realizar los trámites correspondientes
para obtener la aptitud legal, para ello necesitan varios
requisitos como: certificados de ingles, certificados de
educación física, certificado de pasantias o practicas pre-
profesionales aprobadas, récord académico. Dicha aptitud
legal servirá para que el estudiante haga la petición de la
fecha para la defensa privada.
En la defensa privada el estudiante expondrá ante un
tribunal, dicho tribunal analizará y evaluará el proyecto
especialmente el cumplimiento de los objetivos. En esta fase
el tribunal pedirá que se haga correcciones al proyecto y
la aprobación de la defensa privada. El estudiante deberá
realizar las correcciones respectivas y presentarlas al tribunal.
Finalmente el estudiante deberá hacer el trámite solicitando
la fecha para la defensa pública, posteriormente tendrá que
solicitar fecha para la defensa pública par que finalmente se
pueda graduar.
La probabilidad de que el estudiante termine la tesis es
que cumpla a cabalidad todos los parámetros anteriormente
mencionados
VI-2. Red Bayesiana para determinar la probabilidad de
culminar el PFC.:
5
Fig.5 Red Bayesiana
Su obtuvo como resultado las siguiente red baysiana la
cual consta de los siguientes nodos:
Anteproyecto: Módulos aprobados, tema, director, perti-
nencia.
Cronograma: Avances.
Proyecto de Fin de Carrera: Cronograma.
Aptitud Legal: Proyecto de Fin de Carrera, Ingles, Edu-
cación Física, Récord Académico, Pasantias.
Fecha Privada: Aptitud Legal.
Defensa Privada: Fecha Privada, Docente Tribunal 1,
Docente Tribunal 2, Docente Tribunal 3.
Fecha Publica: Defensa Privada.
Defensa Publica: Fecha Publica, Docente Tribunal 1,
Docente Tribunal 2, Docente Tribunal 3.
Grado: Defensa Publica.
VII. RESULTADO DE LAS TABLAS
Descripción Anteproyecto: Para la tabla de Anteproyecto se
ha tomado en cuenta las variables Tema, Director, Pertinencia,
Módulos Aprobados con un valor de Positivo o Negativo.
Al Valor de Positivo y Negativo se le asignado 1 ó 0 con
la finalidad de describir si se ha cumplido o no con ese
parámetro.
Si todos los parámetros se han cumplido ó tienen la asigna-
ción de SI se pude decir que hay una probabilidad del 100 %,
en caso contrario no se obtendrá la pertinencia.
Fig.6 Anteproyecto
Fig.7 Anteproyecto
Descripción Aptitud Legal: Para la tabla de Aptitud Le-
gal se ha tomado en cuenta los siguientes variables: Inglés,
Educación Física, Récord Académico, Pasantías. A todos las
variables se les asignado un valor de 1 ó 0 el cual denotara
si se ha aprobado o reprobado en ese parámetro. En cuanto al
Proyecto de Fin de Carrera se ha denotado como terminado o
no terminado, solamente cuando este terminado el Proyecto de
Fin de Carrera y el resto de parámetros indiquen aprobado se
obtendrá la Aptitud legal requisito fundamental para solicitar
la Fecha de la Defensa Privada.
Fig.8 Aptitud Legal
Fig.9 Aptitud Legal
Fig.10 Aptitud Legal
Fig.11 Aptitud Legal
Fig.12 Aptitud Legal
6
Fig.13 Aptitud Legal
Fig.14 Aptitud Legal
Descripción Cronograma: Para la tabla Cronograma se ha
tomado en cuenta los valores: Alto, Medio y Bajo y tendrán
una valoración cada uno de los estados.
Fig.15 Cronograma
Descripción Defensa Privada: Para las tablas de Defensa
Privada se ha tomado en cuenta el Docente Tribunal 1,2,3,
respectivamente quienes serán los que den el veredicto de
Aprobado o Reprobado, y Fecha Privada tomara los valores
de Asignada o No Asignada.
Si hay Fecha Asignada para la Defensa Privada y todos
los Docente Aprueban la Defensa Privada, tendrá una
probabilidad de 1 de aprobar la Defensa Privada.
Si hay Fecha Asignada para la Defensa Privada y
un Docente que repruebe la Defensa Privada habrá una
probabilidad de aprobar del 0.75 y un 0.25 de reprobar la
Defensa Privada.
Si hay mas de un Docente que repruebe la Defensa Privada
automáticamente se reprueba la Defensa Privada.
Fig.16 Defensa Privada
Fig.17 Defensa Privada
Fig.18 Defensa Privada
Fig.19 Defensa Privada
Descripción Defensa Pública: Para las tablas de Defensa
Pública se ha tomado en cuenta el Docente Tribunal 1,2,3,
respectivamente quienes serán los que den el veredicto de
Aprobado o Reprobado, y Fecha Pública tomara los valores
de Asignada o No Asignada.
Si hay Fecha Asignada para la Defensa Pública y todos
los Docente Aprueban la Defensa Pública, tendrá una
probabilidad de 1 de aprobar la Defensa Pública.
Si hay Fecha Asignada para la Defensa Pública y
un Docente que repruebe la Defensa Pública habrá una
probabilidad de aprobar del 0.75 y un 0.25 de reprobar la
Defensa Pública.
Si hay mas de un Docente que repruebe la Defensa Pública
automáticamente se reprueba la Defensa Pública.
Fig.20 Defensa Pública
Fig.21 Defensa Pública
7
Fig.22 Defensa Pública
Fig.23 Defensa Pública
Descripción Director: Para la tabla Director tendrá un valor
de 1 ó 0, si ha sido asignada o no.
Fig.24 Director
Descripción Docente Tribunal 1: El Docente Tribunal 1
calificara en caso de que apruebe con un 0,75 y en caso de
reprobar un 0,25.
Fig.25 Docente Tribunal 1
Descripción Docente Tribunal 2: El Docente Tribunal 2
calificara en caso de que apruebe con un 0,75 y en caso de
reprobar un 0,25.
Fig.26 Docente Tribunal 2
Descripción Docente Tribunal 3: El Docente Tribunal 3
calificara en caso de que apruebe con un 0,75 y en caso de
reprobar un 0,25.
Fig.27 Docente Tribunal 3
Descripción Educación Física: Para la Tabla Educación
Física tendrá un valor de 1 ó 0 en caso de que haya aprobado el
Taller de Educación Física o no haya cumplido con el mismo.
Fig.28 Educación Física
Descripción Fecha Privada: Para la tabla de Fecha Privada
se ha considerado de que tiene que tener Aprobada la Aptitud
Legal para que se le pueda asignar Fecha para la Privada.
Si no tiene Aprobada la Aptitud Legal no se le puede
asignar Fecha para la Privada.
Fig.29 Fecha Privada
Descripción Fecha Privada: Para la tabla de Fecha Privada
se ha considerado de que tiene que si se le asigna tendrá un
valor de 1 y si no se le asigna tendrá un valor de 0.
Fig.30 Fecha Publica
Descripción Grado: Para la tabla de Fecha Pública se ha
considerado de que tiene que si se le asigna tendrá un valor
de 1 y si no se le asigna tendrá un valor de 0.
Fig.31 Grado
Descripción Inglés: Para la Tabla Inglés tendrá un valor de
1 ó 0 en caso de que haya aprobado el Taller de Inglés o no
haya cumplido con el mismo.
Fig.32 Inglés
Descripción Módulos Aprobados: Para la tabla Módulos
Aprobados se ha tomado en cuenta un valor de 0.8 si están
aprobados y un 0.2 en caso de que no se encuentre aprobados
los módulos.
Ya que el tener aprobador el 0.8 de los módulos es requisito
para poder desarrollar el proyecto de fin de carrera.
8
Fig.33 Módulos Aprobados
Descripción Pasantias: Para la Tabla Pasantias tendrá un
valor de 1 ó 0 en caso de que tenga hechas las Pasantias o no
haya cumplido con la ejecución de las mismas.
Fig.34 Pasantias
Descripción Pertinencia: Para la Tabla Pertinencia tendrá un
valor de 1 ó 0 en caso de que sea Pertinente o no Pertinente
la ejecución del Proyecto de Fin de Carrera.
Fig.35 Pertinencia
Descripción Proyecto Fin de Carrera: Para la culminación
del Proyecto de Fin de Carrera se toma en cuenta las
siguientes variables el Anteproyecto, Cronograma.
Si el Anteproyecto es positivo, el Cronograma esta termindo
tendrá un valor de 1 para que pueda culminar su PFC.
Si el Anteproyecto es positivo, el Cronograma no esta
terminado y tendrá un valor de 0 y no podrá culminar su PFC.
Si el Anteproyecto es negativo, el Cronograma no esta
terminado no podrá culminar su PFC
Si el Anteproyecto no ha sido aprobado y es negativo no
podrá terminar el proyecto porque aun no tiene Anteproyecto.
Fig.36 Proyecto fin de carrera
Descripción Record Académico: Para la tabla Récord
Académico tendrá un valor de 1 ó 0 en el caso de que tenga
el Récord Académico o no lo tenga.
Fig.37 Récord Académico
Descripción Tema: Para la tabla Tema tendrá un valor de 1
ó 0 en el caso de que tenga Tema o no lo tenga.
Fig.38 Tema
VII-3. Red Bayesiana en Java:
Fig.39 Red Bayesiana en JAVA
La información de la Red Bayesiana la cargamos en Java y
para poder leerla es necesario ayudarse con la librería Elvira,
es de esta manera que se ha logrado la lectura de la red
bayesiana desde Java.
Fig.40 Método Obtener Datos
9
El método obtener datos permite leer el archivo grado.pgmx
que contiene el diseño de la red bayesiana y todos los valores
asociados a cada nodo.
Fig.41 Método Imprimir Resultado
El metodo printResult recibe como parámetros la evidencia
una lista de variables y las probabilidades. Es aquí donde
se define la probabilidad de que el estudiante se gradué de
acuerdo a los valores establecidos en la red.
Fig.42 Método Obtener Resultado Utility
El metodo obtener Resultados Utility permite leer el archivo
grado.pgmx y obtener los valores de la funcion de utilidad de
la red bayesiana correspondeintes a cada nodo.
VIII. CONCLUSIONES
La red bayesiana que se construyo esta basada en las
variables que se considero para que un estudiante se
pueda graduar, y al final se obtuvo como resultado una
red que pudo ser interpretada en JAVA la cual por si
sola proporciona la información de la red.
La librería Elvira ha simplificado el esfuerzo brindando
todo lo necesario para implementar la red bayesiana en
JAVA, sirviéndonos de métodos que nos ayudan para
que java pueda realizar el procesamiento de información
Los nodos en el programa Elvira muestran una
explicación de cada nodo, lo que permite comprender
de mejor manera la relación entre los nodos.
El modo de inferencia en Elvira nos permite hacer
pruebas de funcionamiento de la red bayesiana.
La relación entre los nodos ha sido posible, por las
opciones que permiten ir de un nodo a otro con y los
distintos valores que puede tomar un nodo de acuerdo
al análisis previo a la Red.
REFERENCIAS
[1] P. P. Cruz,Inteligencia Artificial Con Aplicaciones A La Ingenieria,
México: Alfaomega Grupo Editor, S.A. de C.V., 2010.
[2] López Puga, 1859, Las redes bayesianas como herra-
mientas de modelado en psicología, [En línea]. Available:
http://digitum.um.es/xmlui/handle/10201/8128
[3] Céspedes, Antonio J Análisis del sector agrario del poniente
almeriense mediante redes bayesianas(España), 2003,[En linea].
Available http://repositorio.ual.es:8080/jspui/handle/10835/15417#
.U454C l5O3s
[4] [Beasley et al., 1993] Beasley, D., Bull, D. R., and Martin,
R. R. (1993) An overview of genetic algorithms: Part 1,
fundamentals.,University Computing.
[5] Rivera L, Miller El papel de las redes bayesianas en la toma de
decisiones. (Colombia),2011,[En línea]. Available:
http://www.urosario.edu.co/Administracion/documentos/investigacion/laboratorio/miller
[6] Zellner, A, Introducción a la inferencia bayesiana en Econometría,
1987.
[7] Banda J, Rojas R, Ejemplo práctico para la determinar si un estudiante
puede culminar su proyecto de fin de carrera, [En linea]. Available
https://github.com/ronaldino/RedBayesiana.
Jairo Banda
Estudiante de la Carrera de Ingeniería en Sistemas de la
Universidad Nacional de Loja, Experto en Mantenimiento Preventivo
y Correctivo, Analista de Sistemas, Provincia de Loja, Ciudad Loja,
Ecuador, 2014.
Ronald Rojas
Estudiante de la Carrera de Ingeniería en Sistemas de la
Universidad Nacional de Loja, Programador Junior en Matlab, Pro-
gramador Senior en Java, Provincia de Zamora Chinchipe, Ciudad
Yanzatza, Ecuador, 2014.

Más contenido relacionado

Similar a Red Bayesiana PFM

Similar a Red Bayesiana PFM (20)

Redes Bayesianas aplicadas a la Aprobación de un Módulo Universitario
Redes Bayesianas aplicadas a la Aprobación de un Módulo UniversitarioRedes Bayesianas aplicadas a la Aprobación de un Módulo Universitario
Redes Bayesianas aplicadas a la Aprobación de un Módulo Universitario
 
Redes bayesianas
Redes bayesianasRedes bayesianas
Redes bayesianas
 
Redes Bayesianas
Redes BayesianasRedes Bayesianas
Redes Bayesianas
 
Redes Bayesianas
Redes BayesianasRedes Bayesianas
Redes Bayesianas
 
Redes Bayesianas
Redes BayesianasRedes Bayesianas
Redes Bayesianas
 
T moralesm
T moralesmT moralesm
T moralesm
 
Redes Bayesianas Post
Redes Bayesianas PostRedes Bayesianas Post
Redes Bayesianas Post
 
ALGEBRA LINEAL (II Bimestre Abril Agosto 2011)
ALGEBRA LINEAL (II Bimestre Abril Agosto 2011)ALGEBRA LINEAL (II Bimestre Abril Agosto 2011)
ALGEBRA LINEAL (II Bimestre Abril Agosto 2011)
 
REPASO MODELOS ECONOMETRICOS.pdf
REPASO MODELOS ECONOMETRICOS.pdfREPASO MODELOS ECONOMETRICOS.pdf
REPASO MODELOS ECONOMETRICOS.pdf
 
REPASO MODELOS ECONOMETRICOS.pdf
REPASO MODELOS ECONOMETRICOS.pdfREPASO MODELOS ECONOMETRICOS.pdf
REPASO MODELOS ECONOMETRICOS.pdf
 
Aprendizaje bayesiano
Aprendizaje bayesianoAprendizaje bayesiano
Aprendizaje bayesiano
 
Post Del 1 Bibimestre
Post Del 1 BibimestrePost Del 1 Bibimestre
Post Del 1 Bibimestre
 
Post Del 1 Bibimestre
Post Del 1 BibimestrePost Del 1 Bibimestre
Post Del 1 Bibimestre
 
Vinculaciones autosimilares
Vinculaciones autosimilaresVinculaciones autosimilares
Vinculaciones autosimilares
 
PRESENTACIN
PRESENTACINPRESENTACIN
PRESENTACIN
 
PresentacióN Bayes09
PresentacióN Bayes09PresentacióN Bayes09
PresentacióN Bayes09
 
Analisis multivariado
Analisis multivariadoAnalisis multivariado
Analisis multivariado
 
Regresion simple 1 estadistica
Regresion simple 1   estadisticaRegresion simple 1   estadistica
Regresion simple 1 estadistica
 
Inteligencia Artificial Redes bayesianas
Inteligencia Artificial  Redes bayesianasInteligencia Artificial  Redes bayesianas
Inteligencia Artificial Redes bayesianas
 
Modelo de señal de entrada
Modelo de señal de entradaModelo de señal de entrada
Modelo de señal de entrada
 

Último

Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024GiovanniJavierHidalg
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...FacuMeza2
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxJOSEMANUELHERNANDEZH11
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersSalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersIván López Martín
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafiosFundación YOD YOD
 
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...AlanCedillo9
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfSergioMendoza354770
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxpabonheidy28
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 

Último (19)

Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptx
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersSalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafios
 
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docx
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 

Red Bayesiana PFM

  • 1. 1 REDES BAYESIANAS PARA DETERMINAR LA PROBABILIDAD DE CULMINAR UN PROYECTO DE FIN DE CARRERA 1. J. Banda, 2. R. Rojas, Tutor: Ing. Henry Paz Resumen—En el presente Paper se abordara temas como Teorema de Bayes, Redes Bayesianas, Elvira, openmarkov, ex- plicación de red bayesiana. Index Terms—Red Bayesiana, Teorema de Bayes. I. INTRODUCCIÓN Una Red Bayesiana es un modelo probabilístico que relaciona un conjunto de variables aleatorias mediante un grafo dirigido, son redes gráficas sin ciclos en el que se representan variables aleatorias y las relaciones de probabilidad que existan entre ellas que permiten conseguir soluciones a problemas de decisión en casos de incertidumbre. Para que un estudiante universitario culmine su proyecto de fin de carrera será necesario que cumpla con algunas condiciones o parámetros indispensables para el desarrollo y cumplimiento de su proyecto. Es de esta manera que para determinar que tan probable es de que el estudiante culmine su proyecto se utilizara redes bayesianas con el apoyo de herramientas como Elvira, openmarkov, JAVA. Se tendrá presente que los resultados ayudaran a distinguir las probabilidades de culminar el proyecto de fin de carrera. II. ESTADO DEL ARTE II-A. Redes Bayesianas Una Red Bayesiana es un modelo probabilístico que relaciona un conjunto de variables aleatorias mediante un grafo dirigido, son redes graficas sin ciclos en el que se representan variables aleatorias y las relaciones de probabilidad que existan entre ellas que permiten conseguir soluciones a problemas de decisión en casos de incertidumbre. Una red bayesiana es una representación ilustrada de dependencias para razonamiento probabilístico, en la cual los nodos representan variables aleatorias y los arcos simbolizan relaciones de dependencia directa entre las variables [1] 1. J. Banda, Universidad Nacional de Loja, Loja, Ecuador, e-mail: jiban- dab@unl.edu.ec 2. R. Rojas, Universidad Nacional de Loja, Loja, Ecuador, e-mail: rfro- jasl@unl.edu.ec Manuscrito recibido el 09 de Junio, 2014; revisado el 09 de Junio, 2014. Un ejemplo muy simple puede ayudarnos a describir el fun- cionamiento de una red bayesiana. Consideremos simplemente una variable aleatoria Z dependiente de otras dos (factores F1 y F2). El grafo expresivo de esta relación será, obviamente, el siguiente (figura1) Fig.1 Grafo expresivo Una red Bayesiana es una herramienta informática a la que puede crearse diferentes modelos dependiendo del caso de estudio según la concepción que tenga el diseñador y de las condiciones del comportamiento de las variables. En esta herramienta sobresale debido a que no solo permite un proceso hacia atrás (backward), por ejemplo como una operación financiera que ha sido realizada en términos de riesgos operacionales; sino también hacia adelante (forward) donde la red puede calcular las probabilidades de pérdida o de beneficio usando la regla de Bayes. La estructura del modelo bayesiano permite capturar las relaciones de dependencia que existe entre los atributos de los datos que se estudien, describiendo la distribución de probabilidad que administra un conjunto de variables especificando los cálculos de independencia condicional junto con probabilidades condicionales. Así, las redes permiten especificar relaciones de independencia entre conjuntos de variables, lo que las convierte en una solución de independencia. II-B. Dimensión Cualitativa El soporte teórico de la dimensión cualitativa en las redes bayesianas lo aporta la teoría de grafos. La teoría de grafos trata de crear modelos gráficos (grafos) que representen los elementos del problema en un sentido holista y fue introducida por Euler para dar solución al problema de los puentes de Königsberg (Harary, 1969; Ríos, 1995). Una red bayesiana es un grafo, podemos definirla como un par G = (V, E), donde V es un conjunto finito de vértices,
  • 2. 2 nodos o variables y E es un subconjunto del conjunto V x V de pares ordenados de vértices llamados enlaces o aristas. Además, una red bayesiana es un tipo particular de gráfico que se denomina grafo dirigido acíclico. Dirigido hace referencia a que los enlaces entre los vértices del grafo están orientados. En una red bayesiana pueden existir tres tipos de conexiones básicas (seriales, convergentes y divergentes), cada una con propiedades cualitativas diferentes y que favorecen la propagación de probabilidades ante una nueva evidencia sobre el modelo [2] Desde el punto de vista del análisis de datos, las redes bayesianas son una potente herramienta por varios motivos [3]: No suponen un determinado modelo subyacente. Son fácilmente interpretables. Son adaptables y permiten la incorporación de conoci- miento a prioridad de forma cualitativa. II-C. Dimensión Cuantitativa Hay tres elementos esenciales que caracterizan la dimensión cuantitativa de una red bayesiana: el concepto de probabilidad como un grado de creencia subjetiva relativa a la ocurrencia de un evento, el teorema de Bayes como heurístico actualizador de creencias y un conjunto de funciones de probabilidad condicionada. Existen, al menos, cuatro formas de entender la probabilidad: la clásica, empírica, axiomática y la subjetiva. Desde la concepción clásica, introducida por Laplace, la probabilidad de que ocurra un evento de un espacio muestral viene dado por la razón que se establece entre el número de casos favorables asociados al suceso y el número de casos posibles [?, 3] III. MODELOS BASADOS EN REDES BAYESIANAS Una red bayesiana representa una distribución de probabi- lidad multivariante, de manera que las relaciones de indepen- dencia entre las variables que la forman quedan identificadas de forma gráfica mediante el concepto de d-separación [3]. Dos variables A y B en una red bayesiana se dice que estan d-separadas si todos los caminos entre A y B son como los que aparecen en la fígura 1. Se dice además que C d-separa a A y B. El concepto de d-separación se corresponde con el de independencia condicional, de manera que dos variables (o conjuntos de variables) X e Y serán condicionalmente inde- pendientes dada una tercera variable (o conjunto de variables ) Z si y sólo si Z d-separa a X e Y [3]. Fig.2 Caracterización gráfica del concepto de d-separación IV. INFERENCIA BAYESIANA Dentro de los métodos de razonamiento se encuentran los Modelos Bayesianos, que simulan diferentes condiciones de incertidumbre cuando no se conoce si es verdadera o falsa la hipótesis enunciada en un rango de variación [3]. Todos los modelos bayesianos tienen en común la asig- nación de la probabilidad como medida de creencia de una hipótesis, así es que, la inferencia es un proceso de reajuste de medidas de creencia al conocerse nuevos axiomas. Cuando se utilizan evidencias y observaciones para esta- blecer que una suposición sea cierta, es lo que se denomina como Inferencia Bayesiana. La inferencia bayesiana observa la evidencia y calcula un valor estimado según el grado de creencia planteado en la hipótesis. Esto implica que al tener mayor cantidad de datos disponibles se podrá obtener resultados más satisfactorios. La ventaja fundamental del uso de la inferencia bayesiana radica en la utilidad que se le da para la toma de decisiones, actualmente su uso es frecuente porque se obtienen resultados más acertados en el contexto de parámetros desconocidos [5]. Aplicando la inferencia Bayesiana es posible identificar distintos tipos de patrones de transición como estados de ganancias discretas en un gran conjunto de datos administra- tivos. Además, se puede investigar acerca de los efectos y las condiciones del mercado por medio de la estimación de un modelo probabilístico. El mecanismo de inferencia sobre redes bayesianas per- mite utilizarlas para construir clasificadores. Para que esto se debe crear una red bayesiana en la que las variables se interrelacionen en el grafo. La clase pertenecerá a la variable desconocida, objetivo de la inferencia. Proporcionada una instancia cualquiera para la que se conozcan todos sus atributos, la clasificación se verificará infiriendo sobre el grafo la probabilidad posterior de cada uno de los valores de la clase, y eligiendo aquél valor que maximize dicha probabilidad. V. TIPOS DE REDES BAYESIANAS El problema Principal en el momento de construir una red Bayesiana consiste en el tratamiento de variables discretas y
  • 3. 3 continuas de forma simultánea en la práctica, debido a las restricciones del modelo condicional que conlleva al proceso de discretización. Las redes bayesianas se pueden clasificar según en función del tipo de variables utilizadas. V-A. Redes Bayesianas Continuas Las redes bayesianas continuas son aquellas que tienen un número infinito de posibles valores. En este tipo de redes resulta complicado determinar explícitamente las probabilida- des condicionadas para cada valor de las variables, así que las probabilidades condicionadas se representan mediante una función de probabilidad. La mayoría de las variables reales son de carácter continuo como por ejemplo la variación de la temperatura. Una red Bayesiana cuyas variables sean todas continuas y están todas representadas mediante funciones normales lineales, tiene una distribución normal multivariada. Este tipo de variables debe ser manejada mediante el proceso de discretización debido a la gran cantidad de datos que deben ser modelados por medio de selección de rangos y de este modo hacer más sencillo el proceso de discretización [4]. V-B. Redes Bayesianas Dinámicas Las redes Bayesianas dinámicas consienten en la exposición de procesos que contienen una variable aleatoria en cada intervalo de tiempo. El proceso que se está estudiando puede entenderse como una serie de procesos en un instante de tiempo. El estado de las variables se representa en un lapso de tiem- po para poder representar los procesos dinámicos conocidos dentro de la red bayesiana. Las probabilidades condicionales de este modelo no cambian con el tiempo. Es decir, se repite las etapas temporales y las relaciones entre dichas etapas. La inferencia en una red bayesiana dinámica es la misma que para una red bayesiana, y por esto se emplean los mismos métodos. Esta inferencia resulta mediante la reproducción de los intervalos de tiempo, hasta que la red sea lo suficiente larga para captar todas las observaciones [6]. V-C. Teorema de Bayes. Las redes bayecias se basan en el teorema de bayes el cuál dice que P(A|B) no es igual a P(B|A),y esto se demuestra ya que poseen elementos comunes pero cuentan con denominadores diferentes. Fue observado desde hace años atrás por el matemático Thomas Bayes (1763). Para entender en que consiste partimos de la definición de cada una de las dos probabilidades P(A|B) Y P(B|A). Fig.3 Condicionalidad por definición. A partir de estas definiciones ya con los respectivos despe- jes, se procede a igualar las dos probabilidades y notamos que existe diferencia en las mismas. Fig.4 P(A|B) Y P(B|A), diferentes. V-D. Elvira Este programa permite el ingreso de las redes Bayesianas de dos formas: (a) por un lado el ingreso manual, donde el usuario dibuja la red bayesiana en la pantalla y carga los valores de probabilidad asociados a cada nodo, (b) mediante la importación de archivos de casos. El programa Elvira es fruto de un proyecto de investigación financiado por la CICYT y el Ministerio de Ciencia y Tecnología, en el que participan investigadores de varias universidades españolas y de otros centros. El programa Elvira está destinado a la edición y evaluación de modelos gráficos probabilistas, concretamente redes bayesianas y diagramas de influencia. Elvira cuenta con un formato propio para la codificación de los modelos, un lector interprete para los modelos codificados, una interfaz gráfica para la construcción de redes, con opciones específicas para modelos canónicos (puertas OR, AND, MAX, etc.), algoritmos exactos y aproximados (estocásticos) de razonamiento tanto para variables discretas como continuas, métodos de explicación del razonamiento, algoritmos de toma de decisiones, aprendizaje de modelos a partir de bases de datos, fusión de redes, etc. Elvira está escrito y compilado en Java, lo cual permite que funcione en diferentes plataformas y sistemas operativos (MS-DOS/Windows, linux, Solaris, etc.). V-D1. Instalación de Elvira: Para la instalación se di- rige al siguiente link: http://www.ia.uned.es/7Eelvira/instalar/ Elvira.zip Para poder ejecutar Elvira necesita tener instalada la versión de Java correspondiente a su sistema operativo. Elvira funciona con las versiones 5.0 y posteriores de Java, que se encuentran disponibles para Windows, linux y Solaris. Cada una de ellas tiene a su vez dos versiones, la de desarrollo, SDK (Software Development Kit), y la de ejecución, JRE (Java Runtime Environment). La primera incluye la segunda. Para usar Elvira es suficiente la de ejecució, JRE. V-D2. Descompresión de Elvira: Una vez instalado Java, debe descomprimir el archivo Elvira.zip, que es común para todas las plataformas (Windows, linux, Solaris...). La versión 0.162 ocupa 3’2 MB. Se debe seleccionar la opción "Descomprimir archivos2 escoger el directorio donde desee
  • 4. 4 descomprimirlos; por ejemplo, c:elvira. Otra forma más fiable de descomprimir este archivo es utilizar un programa específico, como 7-zip (que es gratuito), WinZip, etc. Si ha seguido las indicaciones anteriores, en el directorio c:elvira encontrará el archivo Elvira.jar y varias subcarpetas. También encontrará un pequeño manual de Elvira en c:elviramanualmanual.html, muy útil en cuanto al funcionamiento de la herramienta y con ejemplos. V-D3. Ejecutar Elvira: La forma más fácil de ejecutar Elvira en Windows es hacer doble-clic en el icono Elvira.jar, que se encuentra en el directorio c:elvira. En linux, debe situarse en el directorio donde ha insta- lado Elvira y ejecutar la orden "java -jar Elvira.jar". Elvira detecta automáticamente el idioma de su sistema operativo; también puede seleccionar el idioma de forma manual median- te"java -jar Elvira.jar -l sp"(español) o "java -jar Elvira.jar -l ae"(American English). V-E. OpenMarkov OpenMarkov es una herramienta informática para modelos gráficos probabilistas (MGPs) desarrollada por el Centro de Investigación sobre Sistemas Inteligentes de la UNED en Madrid. Está diseñada para: Editar y evaluar varios tipos de MPGs, tales como redes bayesianas, diagramas de influencia, modelos de Markov factorizados, etc. Aprender redes bayesianas a partir de bases de datos de forma interactiva Análisis de coste-efectividad V-E1. Descarga e inicio de OpenMarkov: Comprobar la versión de Java. Actualmente OpenMarkov necesita Java 7. Descarga este archivo org.openmarkov.full-0.1.4.jar (12 MB) en tu disco duro (o en un "pen-drive.o en un CD...) y ejecuta OpenMarkov haciendo doble-clic sobre él. No necesita instalación. En su lugar, puedes descargar la versión más reciente (puede ser inestable). Hay un truco para abrir las redes más fácilmente con OpenMarkov, haciendo doble-clic sobre ellas. VI. EJEMPLO PRÁCTICO DE REDES BAYESIANAS PARA DETERMINAR LA PROBABILIDAD DE QUE UN ESTUDIANTE PUEDA FINALIZAR SU PROYECTO DE FIN DE CARRERA El proyecto de fin de carrera o tesis es muy importante para que el estudiante obtenga el título de Ing. El proyecto puede presentarse solo si el estudiante tiene aprobado en 80 % de la carrera. Este deberá tener una duración de 2 años como máximo. El estudiante deberá presentar primeramente el anteproyecto definiendo un tema, problema, objetivos, presupuesto y cronograma, dependiendo de la factibilidad del mismo el proyecto puede ser pertinente (aprobado) o no pertinente (reprobado). En caso de ser pertinente el proyecto el estudiante deberá solicitar Director para el proyecto, podrá ser Director de un Proyecto, un profesor a fin a la línea de investigación, y que no tenga exceso de proyectos a su cargo, pero no podrá ser parte como Jurado en caso de disertación del Proyecto. Una vez que se haya designado el Director al proyecto, el estudiante deberá empezar con el desarrollo del mismo, el cual se lo irá ejecutando en fases las cuales están detalladas en el cronograma. Si ya se cumplió en plazo de los 2 años y aún no se ha terminado de desarrollo del proyecto, el estudiante tiene derecho a pedir prórroga cuyo requisito es tener avanzado el 80 % del proyecto. Si el estudiante terminó de desarrollar el proyecto en su tiempo estimado, deberá realizar los trámites correspondientes para obtener la aptitud legal, para ello necesitan varios requisitos como: certificados de ingles, certificados de educación física, certificado de pasantias o practicas pre- profesionales aprobadas, récord académico. Dicha aptitud legal servirá para que el estudiante haga la petición de la fecha para la defensa privada. En la defensa privada el estudiante expondrá ante un tribunal, dicho tribunal analizará y evaluará el proyecto especialmente el cumplimiento de los objetivos. En esta fase el tribunal pedirá que se haga correcciones al proyecto y la aprobación de la defensa privada. El estudiante deberá realizar las correcciones respectivas y presentarlas al tribunal. Finalmente el estudiante deberá hacer el trámite solicitando la fecha para la defensa pública, posteriormente tendrá que solicitar fecha para la defensa pública par que finalmente se pueda graduar. La probabilidad de que el estudiante termine la tesis es que cumpla a cabalidad todos los parámetros anteriormente mencionados VI-2. Red Bayesiana para determinar la probabilidad de culminar el PFC.:
  • 5. 5 Fig.5 Red Bayesiana Su obtuvo como resultado las siguiente red baysiana la cual consta de los siguientes nodos: Anteproyecto: Módulos aprobados, tema, director, perti- nencia. Cronograma: Avances. Proyecto de Fin de Carrera: Cronograma. Aptitud Legal: Proyecto de Fin de Carrera, Ingles, Edu- cación Física, Récord Académico, Pasantias. Fecha Privada: Aptitud Legal. Defensa Privada: Fecha Privada, Docente Tribunal 1, Docente Tribunal 2, Docente Tribunal 3. Fecha Publica: Defensa Privada. Defensa Publica: Fecha Publica, Docente Tribunal 1, Docente Tribunal 2, Docente Tribunal 3. Grado: Defensa Publica. VII. RESULTADO DE LAS TABLAS Descripción Anteproyecto: Para la tabla de Anteproyecto se ha tomado en cuenta las variables Tema, Director, Pertinencia, Módulos Aprobados con un valor de Positivo o Negativo. Al Valor de Positivo y Negativo se le asignado 1 ó 0 con la finalidad de describir si se ha cumplido o no con ese parámetro. Si todos los parámetros se han cumplido ó tienen la asigna- ción de SI se pude decir que hay una probabilidad del 100 %, en caso contrario no se obtendrá la pertinencia. Fig.6 Anteproyecto Fig.7 Anteproyecto Descripción Aptitud Legal: Para la tabla de Aptitud Le- gal se ha tomado en cuenta los siguientes variables: Inglés, Educación Física, Récord Académico, Pasantías. A todos las variables se les asignado un valor de 1 ó 0 el cual denotara si se ha aprobado o reprobado en ese parámetro. En cuanto al Proyecto de Fin de Carrera se ha denotado como terminado o no terminado, solamente cuando este terminado el Proyecto de Fin de Carrera y el resto de parámetros indiquen aprobado se obtendrá la Aptitud legal requisito fundamental para solicitar la Fecha de la Defensa Privada. Fig.8 Aptitud Legal Fig.9 Aptitud Legal Fig.10 Aptitud Legal Fig.11 Aptitud Legal Fig.12 Aptitud Legal
  • 6. 6 Fig.13 Aptitud Legal Fig.14 Aptitud Legal Descripción Cronograma: Para la tabla Cronograma se ha tomado en cuenta los valores: Alto, Medio y Bajo y tendrán una valoración cada uno de los estados. Fig.15 Cronograma Descripción Defensa Privada: Para las tablas de Defensa Privada se ha tomado en cuenta el Docente Tribunal 1,2,3, respectivamente quienes serán los que den el veredicto de Aprobado o Reprobado, y Fecha Privada tomara los valores de Asignada o No Asignada. Si hay Fecha Asignada para la Defensa Privada y todos los Docente Aprueban la Defensa Privada, tendrá una probabilidad de 1 de aprobar la Defensa Privada. Si hay Fecha Asignada para la Defensa Privada y un Docente que repruebe la Defensa Privada habrá una probabilidad de aprobar del 0.75 y un 0.25 de reprobar la Defensa Privada. Si hay mas de un Docente que repruebe la Defensa Privada automáticamente se reprueba la Defensa Privada. Fig.16 Defensa Privada Fig.17 Defensa Privada Fig.18 Defensa Privada Fig.19 Defensa Privada Descripción Defensa Pública: Para las tablas de Defensa Pública se ha tomado en cuenta el Docente Tribunal 1,2,3, respectivamente quienes serán los que den el veredicto de Aprobado o Reprobado, y Fecha Pública tomara los valores de Asignada o No Asignada. Si hay Fecha Asignada para la Defensa Pública y todos los Docente Aprueban la Defensa Pública, tendrá una probabilidad de 1 de aprobar la Defensa Pública. Si hay Fecha Asignada para la Defensa Pública y un Docente que repruebe la Defensa Pública habrá una probabilidad de aprobar del 0.75 y un 0.25 de reprobar la Defensa Pública. Si hay mas de un Docente que repruebe la Defensa Pública automáticamente se reprueba la Defensa Pública. Fig.20 Defensa Pública Fig.21 Defensa Pública
  • 7. 7 Fig.22 Defensa Pública Fig.23 Defensa Pública Descripción Director: Para la tabla Director tendrá un valor de 1 ó 0, si ha sido asignada o no. Fig.24 Director Descripción Docente Tribunal 1: El Docente Tribunal 1 calificara en caso de que apruebe con un 0,75 y en caso de reprobar un 0,25. Fig.25 Docente Tribunal 1 Descripción Docente Tribunal 2: El Docente Tribunal 2 calificara en caso de que apruebe con un 0,75 y en caso de reprobar un 0,25. Fig.26 Docente Tribunal 2 Descripción Docente Tribunal 3: El Docente Tribunal 3 calificara en caso de que apruebe con un 0,75 y en caso de reprobar un 0,25. Fig.27 Docente Tribunal 3 Descripción Educación Física: Para la Tabla Educación Física tendrá un valor de 1 ó 0 en caso de que haya aprobado el Taller de Educación Física o no haya cumplido con el mismo. Fig.28 Educación Física Descripción Fecha Privada: Para la tabla de Fecha Privada se ha considerado de que tiene que tener Aprobada la Aptitud Legal para que se le pueda asignar Fecha para la Privada. Si no tiene Aprobada la Aptitud Legal no se le puede asignar Fecha para la Privada. Fig.29 Fecha Privada Descripción Fecha Privada: Para la tabla de Fecha Privada se ha considerado de que tiene que si se le asigna tendrá un valor de 1 y si no se le asigna tendrá un valor de 0. Fig.30 Fecha Publica Descripción Grado: Para la tabla de Fecha Pública se ha considerado de que tiene que si se le asigna tendrá un valor de 1 y si no se le asigna tendrá un valor de 0. Fig.31 Grado Descripción Inglés: Para la Tabla Inglés tendrá un valor de 1 ó 0 en caso de que haya aprobado el Taller de Inglés o no haya cumplido con el mismo. Fig.32 Inglés Descripción Módulos Aprobados: Para la tabla Módulos Aprobados se ha tomado en cuenta un valor de 0.8 si están aprobados y un 0.2 en caso de que no se encuentre aprobados los módulos. Ya que el tener aprobador el 0.8 de los módulos es requisito para poder desarrollar el proyecto de fin de carrera.
  • 8. 8 Fig.33 Módulos Aprobados Descripción Pasantias: Para la Tabla Pasantias tendrá un valor de 1 ó 0 en caso de que tenga hechas las Pasantias o no haya cumplido con la ejecución de las mismas. Fig.34 Pasantias Descripción Pertinencia: Para la Tabla Pertinencia tendrá un valor de 1 ó 0 en caso de que sea Pertinente o no Pertinente la ejecución del Proyecto de Fin de Carrera. Fig.35 Pertinencia Descripción Proyecto Fin de Carrera: Para la culminación del Proyecto de Fin de Carrera se toma en cuenta las siguientes variables el Anteproyecto, Cronograma. Si el Anteproyecto es positivo, el Cronograma esta termindo tendrá un valor de 1 para que pueda culminar su PFC. Si el Anteproyecto es positivo, el Cronograma no esta terminado y tendrá un valor de 0 y no podrá culminar su PFC. Si el Anteproyecto es negativo, el Cronograma no esta terminado no podrá culminar su PFC Si el Anteproyecto no ha sido aprobado y es negativo no podrá terminar el proyecto porque aun no tiene Anteproyecto. Fig.36 Proyecto fin de carrera Descripción Record Académico: Para la tabla Récord Académico tendrá un valor de 1 ó 0 en el caso de que tenga el Récord Académico o no lo tenga. Fig.37 Récord Académico Descripción Tema: Para la tabla Tema tendrá un valor de 1 ó 0 en el caso de que tenga Tema o no lo tenga. Fig.38 Tema VII-3. Red Bayesiana en Java: Fig.39 Red Bayesiana en JAVA La información de la Red Bayesiana la cargamos en Java y para poder leerla es necesario ayudarse con la librería Elvira, es de esta manera que se ha logrado la lectura de la red bayesiana desde Java. Fig.40 Método Obtener Datos
  • 9. 9 El método obtener datos permite leer el archivo grado.pgmx que contiene el diseño de la red bayesiana y todos los valores asociados a cada nodo. Fig.41 Método Imprimir Resultado El metodo printResult recibe como parámetros la evidencia una lista de variables y las probabilidades. Es aquí donde se define la probabilidad de que el estudiante se gradué de acuerdo a los valores establecidos en la red. Fig.42 Método Obtener Resultado Utility El metodo obtener Resultados Utility permite leer el archivo grado.pgmx y obtener los valores de la funcion de utilidad de la red bayesiana correspondeintes a cada nodo. VIII. CONCLUSIONES La red bayesiana que se construyo esta basada en las variables que se considero para que un estudiante se pueda graduar, y al final se obtuvo como resultado una red que pudo ser interpretada en JAVA la cual por si sola proporciona la información de la red. La librería Elvira ha simplificado el esfuerzo brindando todo lo necesario para implementar la red bayesiana en JAVA, sirviéndonos de métodos que nos ayudan para que java pueda realizar el procesamiento de información Los nodos en el programa Elvira muestran una explicación de cada nodo, lo que permite comprender de mejor manera la relación entre los nodos. El modo de inferencia en Elvira nos permite hacer pruebas de funcionamiento de la red bayesiana. La relación entre los nodos ha sido posible, por las opciones que permiten ir de un nodo a otro con y los distintos valores que puede tomar un nodo de acuerdo al análisis previo a la Red. REFERENCIAS [1] P. P. Cruz,Inteligencia Artificial Con Aplicaciones A La Ingenieria, México: Alfaomega Grupo Editor, S.A. de C.V., 2010. [2] López Puga, 1859, Las redes bayesianas como herra- mientas de modelado en psicología, [En línea]. Available: http://digitum.um.es/xmlui/handle/10201/8128 [3] Céspedes, Antonio J Análisis del sector agrario del poniente almeriense mediante redes bayesianas(España), 2003,[En linea]. Available http://repositorio.ual.es:8080/jspui/handle/10835/15417# .U454C l5O3s [4] [Beasley et al., 1993] Beasley, D., Bull, D. R., and Martin, R. R. (1993) An overview of genetic algorithms: Part 1, fundamentals.,University Computing. [5] Rivera L, Miller El papel de las redes bayesianas en la toma de decisiones. (Colombia),2011,[En línea]. Available: http://www.urosario.edu.co/Administracion/documentos/investigacion/laboratorio/miller [6] Zellner, A, Introducción a la inferencia bayesiana en Econometría, 1987. [7] Banda J, Rojas R, Ejemplo práctico para la determinar si un estudiante puede culminar su proyecto de fin de carrera, [En linea]. Available https://github.com/ronaldino/RedBayesiana. Jairo Banda Estudiante de la Carrera de Ingeniería en Sistemas de la Universidad Nacional de Loja, Experto en Mantenimiento Preventivo y Correctivo, Analista de Sistemas, Provincia de Loja, Ciudad Loja, Ecuador, 2014. Ronald Rojas Estudiante de la Carrera de Ingeniería en Sistemas de la Universidad Nacional de Loja, Programador Junior en Matlab, Pro- gramador Senior en Java, Provincia de Zamora Chinchipe, Ciudad Yanzatza, Ecuador, 2014.