SlideShare una empresa de Scribd logo
1 de 12
Descargar para leer sin conexión
CLASIFICACION DE PERSONAS ACUSADAS DE ASESINATO QUE HAYAN
         ACTUADO BAJO EL EFECTO DE LAS DROGAS UTILIZANDO REDES BAYESIANAS
                              Marcela T. Gómez González
                                mtgomez@utpl.edu.ec

                          UNIVERSIDAD TECNICA PARTICULAR DE LOJA
                       Ingeniería en Sistemas Informáticos y Computación
                              INTELIGENCIA ARTIFICIAL AVANZADA


ABSTRACT                                          personas acusadas por asesinato y que hayan
                                                  actuado bajo efectos de drogas.
Drugs consumption is a relevant social
                                                  En la actualidad se cuenta con gran cantidad
problem because of this addiction causes big
                                                  de estrategias para realizar diagnostico y
familiarly, couple, school, work and legal
                                                  clasificación    de    objetos,    personas,
problems that deteriorate people’s social
                                                  enfermedades, etc; procesos que se realizan
environment. This research make a
                                                  con el fin de asignar uno o más objetos a
classification of people accused of murder
                                                  una clase o grupo definidos. La presente
under the influence of drugs.
                                                  investigación trata el estudio de redes
Actually, there are many strategies for           bayesianas, siendo éstas un método que
objects, people and diseases diagnosis and        basa su estudio en teorías de probabilidad y
classification, processes carried out in order    permiten realizar una inferencia al integrar
to assign one or more objects to a defined        el juicio de un experto con las bases de
class or group. This research is the study of     datos de las que se dispone, éste método
Bayesian networks, which is a method based        presenta algunas ventajas sobre otros
in probability theories and let us to make        cuando los datos son imprecisos y sobre todo
inferences by integrating an expert opinion       cuando las relaciones entre variables son no
with available databases. This method has         lineales.
some advantages over others when the data
are imprecise and especially when
                                                  PALABRAS CLAVE:
relationships     between     variables    are
nonlinear.
                                                  Redes         bayesianas,    aprendizaje,
RESUMEN:                                          clasificación, Weka, Elvira, NaiveBayes,
                                                  BayesNet

 El consumo de drogas constituye           un
problema social de gran relevancia, ya que        1. PLANTEAMIENTO DEL PROBLEMA
ésa adicción origina graves conflictos
familiares, de pareja, escolares, laborales e,    Realizar una clasificación de personas de
incluso, problemas legales que deterioran el      una manera manual sin la utilización de
entorno social de la persona. En éste             algún sistema computacional es un gran
artículo se realiza la clasificación de           problema para la sociedad en general, por lo
                                                  que éste proyecto se realiza con la finalidad
de construir un clasificador inteligente, que
mediante la especificación de una serie de      3. INTRODUCCION
características    permita      realizar   la
clasificación de dependiendo de ciertos         Con frecuencia se encuentran situaciones o
criterios, en éste caso la clasificación de     fenómenos que contienen algunos eventos
personas asesinas que hayan cometido un         aleatorios asociados con este. Existen
delito por consecuencia de las drogas.          Modelos Probabilísticos que pueden ser
                                                aprovechados cuando existan relaciones
Se plantea una solución ante éste problema      probabilísticas    entre un conjunto de
mediante la utilización de un clasificador      variables aleatorias afectadas y Modelos
que responda de manera eficaz y eficiente       Gráficos, los cuales han llegado a ser
mediante la utilización de software que sea     populares entre comunidades estadísticas y
accesible tanto de manera económica y           de inteligencia artificial debido a su
física.                                         facilidad de simplificar la comunicación
                                                entre el dominio experto y el modelador.
OBJETIVOS                                       Las redes Bayesianas son una clase de
                                                modelos gráficos que modelan relaciones
2.1. OBJETIVOS GENERAL                          probabilísticas a través de un grafico
                                                acíclico dirigido , en el cuál cada nodo
-   Construir un clasificador de personas       corresponde a una variable aleatoria y cada
(asesinos) que hayan actuado bajo efectos       flecha corresponde        una relación de
de estupefacientes mediante la aplicación       dependencia     probabilística entre    dos
de     Redes Bayesianas y utilizando los        variables afectadas[2]
algoritmos BayesNet y NaiveBayes.
                                                Existen muchas tareas prácticas que pueden
2.2. OBJETIVOS ESPECIFICOS                      reducirse a problemas de clasificación como
                                                diagnósticos        de         enfermedades,
- Investigar diferentes herramientas que        reconocimiento de patrones y en caso de
permitan realizar un clasificador que           éste proyecto diagnostico o probabilidad de
permita emitir información clasificada de       consumo de drogas de una persona; éste
una manera eficiente y un mínimo                tipo de tareas tienen la finalidad de asignar
porcentaje de error.                            objetos a categorías o clases determinadas
                                                según sus propiedades. Clasificación que se
- Investigar técnicas utilizadas en redes       realizará mediante los programas Weka y
bayesianas para la clasificación de objetos.    Elvira

- Investigar trabajos relacionados en el área   4. MARCO TEORICO
de clasificación mediante Redes Bayesianas
                                                4.1. REDES BAYESIANAS Y CLASIFICACION
-   Implementar el modelo en Weka
                                                Una red Bayesiana es un grafo acíclico que
-   Implementar el modelo en Elvira             representa relaciones probabilísticas entre
                                                variables aleatorias [7]. El razonamiento
                                                probabilístico en éste tipo de redes consiste
                                                en propagar los efectos de la evidencia a
                                                través de la red para conocer la
                                                probabilidad a posteriori de las variables. Se
asignan valores a ciertas variables de la base   capaces de generalizar, adaptar señales de
de datos y se obtiene la probabilidad            ruido y distorsión sin perder su robustez [1],
posterior de las demás variables dadas las       son entrenadas y no requieren de una
variables conocidas [22]                         descripción precisa de patrones a ser
                                                 clasificados
Las redes bayesianas pueden realizar a
cabalidad la tarea de clasificación, ya que      - Los métodos bayesianos permiten tener en
es un caso particular de la tarea de             cuenta en la predicción de la hipótesis el
predicción, se caracteriza por tener una sola    conocimiento a priori en forma de
de las variables de la base de datos             probabilidades. El problema puede surgir al
(clasificador) que se desea predecir, en éste    tener que estimar ese conocimiento
proyecto ésta variable es “consumedrogas”        estadístico    sin   disponer  de    datos
mientras que todas las otras son los datos       suficientes.[12].
propios del caso que se desea clasificar, es
decir las características de las personas, se    - Las redes bayesianas permiten definir
pueden      citar   por    ejemplo:    fatiga,   modelos y utilizarlos tanto para hacer
somnolencia, alucinaciones, etc. Pueden          razonamiento de diagnóstico (pues obtienen
existir una gran cantidad de variables en la     las causas más probables dado un conjunto
base de datos, algunas de las cuales estarán     de     síntomas),   como     para      hacer
directamente relacionadas con la variable        razonamiento predictivo (obteniendo la
clasificadora que se quiere predecir pero        probabilidad de presentar un cierto síntoma
también pueden existir otras variables que       suponiendo     que   existe    una     causa
no lo estén.[21]                                 conocida)[21].

La idea de utilizar redes Bayesianas en éste     - Una de las características de las redes
proyecto es que se puede estimar                 bayesianas es que un mismo nodo puede ser
probabilidades a posteriori de cualquier         fuente de información u objeto de
hipótesis con el conjunto de datos de            predicción dependiendo de cuál sea la
entrenamiento, para así escoger la hipótesis     evidencia disponible.
más probable.

Los métodos bayesianos en tareas de              4.2. APRENDIZAJE DE UNA RED BAYESIANA
aprendizaje poseen ciertas características,
entre las cuáles se pueden citar las             El aprendizaje en la redes bayesianas
siguientes:                                      consiste en definir una estructura grafica a
                                                 partir de datos almacenados en bases de
- La hipótesis perteneciente a un ejemplo        datos. El aprendizaje en éste tipo de redes
aumenta o disminuye la probabilidad. Al          consiste en definir la red probabilística a
momento que no concuerde con un conjunto         partir de datos almacenados en bases de
de ejemplos más o menos grande ésta              datos en lugar de obtener el conocimiento
probabilidad no es desechada por completo        del experto. Este tipo de aprendizaje ofrece
sino que se disminuirá esa probabilidad          la posibilidad de inducir la estructura grafica
estimada para la hipótesis.                      de la red a partir de los datos observados y
                                                 de definir las relaciones entre los nodos
                                                 basándose también en dichos casos. Se
- Entre las principales ventajas de las redes    definen en aprendizaje estructural y
bayesianas se puede citar que ellas son          paramétrico
5.1.1. ELVIRA 0.162
En el aprendizaje estructural se debe          El programa Elvira está destinado a la
obtener la estructura de la Red Bayesiana      edición y evaluación de modelos gráficos
con sus respectivas relaciones. Tomando en     probabilistas,     concretamente       redes
cuenta que éste tipo de aprendizaje            bayesianas y diagramas de influencia. [17]
depende del tipo de estructura de la red.
[15]
                                               Cuenta con un formato propio de
                                               codificación de los modelos, un lector
A diferencia del aprendizaje estructural, el   intérprete para los modelos codificados, una
                                               interfaz gráfica para la construcción de
aprendizaje paramétrico consiste en
                                               redes, con opciones específicas para
encontrar parámetros asociados a una           modelos canónicos (Noisy OR, Noisy AND,
estructura de una red bayesiana dada [14],     etc...), algoritmos exactos y aproximados
es decir, parámetros conformados por las       (estocásticos) de razonamiento tanto para
probabilidades del nodo raíz y de las demás    variables discretas como continuas, métodos
variables.                                     de explicación del razonamiento, algoritmos
                                               de toma de decisiones, aprendizaje de
                                               modelos a partir de base de datos, fusión de
En general, una red bayesiana en sus
                                               redes, etc [24]
primeros estados, puede ser constituida
según la opinión de los expertos o bien        Elvira puede operar en tres modos:
según la información de la que se parta o
teniendo en cuenta ambas cosas. Conforme
se añade información a la misma, se va         • Modo Editar, éste modo se utiliza para
modificando tanto su estructura como los       crear y modificar Redes bayesianas e
                                               influenciar diagramas
parámetros mediante un proceso de
                                               cuyas variables son solamente discretas.
aprendizaje [5].
                                               • Modo Inferencia, para hacer propagación
5.    DISENO E       IMPLEMENTACION     DEL    de evidencia
CLASIFICADOR
                                               • Modo aprendizaje.- permite construir
5.1. HERRAMIENTAS UTILIZADAS                   redes Bayesianas desde bases de datos. [16]

                                               Su mayor ventaja es que éste software
En el presente proyecto se utilizara las       permite representar de una manera gráfica
herramientas: Weka y Elvira para realizar el   los resultados de los análisis de sensibilidad,
clasificador.                                  además      mostrar     los     caminos      de
 Figura1. Herramienta Elvira                   razonamiento y de clasificar los hallazgos en
                                               función del tipo de impacto que ejercen
                                               sobre una variable.


                                               5.1.2. WEKA 3.6
                                               Figura 2. Herramienta Weka

                                               Es un entorno para experimentación de
                                               análisis de datos que permite aplicar,
                                               analizar y evaluar las técnicas más
relevantes    de    análisis    de    datos,    Bayes Net (Pearl 1988) es un método basado
                                                en “score” y búsqueda, en los cuales la
                                                medida de bondad (verosimilitud, entropía,
                                                porcentaje de bien clasificados) de una
                                                estructura particular es definida, y se lleva a
                                                cabo un procedimiento de búsqueda a lo
                                                largo del espacio de todas posibles
                                                estructuras de redes bayesianas [27]



                                                5.3. MODELO
principalmente     las   provenientes   del
aprendizaje automático, sobre cualquier
                                                Las drogas actúan sobre el sistema nervioso
conjunto de datos del usuario. [19].
                                                central produciendo varios efectos como
Se utiliza ésta herramienta debido a que
                                                efectos depresores que disminuyen o inhiben
está disponible de una manera libre bajo la
                                                los mecanismos de funcionamiento normal
licencia pública general de GNU y es un
                                                del sistema nervioso central y efectos
software muy portable que puede correr
                                                alucinógenos o perturbadores, que alteran la
bajo cualquier plataforma.
                                                percepción         de       la      realidad
                                                y alteraciones psicológicas    van    desde
5.2. ALGORITMOS UTILIZADOS
                                                cambios en el estado de ánimo a crisis de
                                                ansiedad.
5.2.1. ALGORITMO NaiveBayes

La implementación de éste algoritmo se          Se evalúan en el modelo variables que
encuentra        en      el      clasificador   representan factores de Riesgo y variables
weka.classifiers.bayes.NaiveBayes. Se ha        que representan los síntomas que son
ejecutado con sus parámetros por defecto:       causados por ingerir alguna clase de droga.
sin desratización supervisada y con             Los factores de riesgo que influyan a una
distribución normal aplicada a los atributos    persona para ser consumidor de drogas son
numéricos. [24]                                 los siguientes:
                                                       Edad: se ha tomado „esta variable
Naive Bayes es un método de clasificación       como un factor de riesgo, asignándole una
probabilístico. Se utiliza una distribución     mayor probabilidad a las personas adultas y
normal para clasificar una nueva instancia      adultas mayores más que a los adolescentes
de un conjunto D dentro de un conjunto
finito C de clases predeterminadas. [27]             Sexo: El género de mayor riesgo en el
                                                modelo es el género masculino
5.2.2. ALGORITMO BayesNet
                                                Los síntomas que permiten identificar si una
El algoritmo de clasificación BayesNet se       persona está bajo efectos de droga son los
aprovecha para desarrollar la red de            siguientes:
creencia bayesiana. Las opciones que deben
                                                      ojos irritados
ser abordadas en Weka incluyen el
                                                      Efecto depresor
estimador que calcula las tablas de
probabilidad condicional de las redes de              Efecto perturbador
Bayes. [25]                                           Relajación
   Sedación                                        Efecto perturbador (TRUE, FALSE)
      Somnolencia                                     Relajación (TRUE, FALSE)
      Hipnosis                                        Sedación (TRUE, FALSE)
      Fatiga                                          Somnolencia (TRUE, FALSE)
      Alteración de sueno                             Hipnosis (TRUE, FALSE)
      Alteración de apetito                           Fatiga (TRUE, FALSE)
      Alucinaciones                                   Alteración de sueno (TRUE, FALSE)
      Cambios de animo                                Alteración de apetito (TRUE, FALSE)
      Pánico                                          Alucinaciones (TRUE, FALSE)
      Ansiedad                                        Cambios de ánimo(TRUE, FALSE)
                                                       Pánico(TRUE, FALSE)
Estos efectos en su totalidad dan un 100%,
                                                       Ansiedad(TRUE, FALSE)
pero a la hora de simularos en la
herramienta Elvira, todos dan un porcentaje      5.4. DATOS
del 10%, ya que es el porcentaje equivalente
al 100%.                                         La base de datos consta de información
                                                 recolectada      de     ciertas     personas,
5.3.1. ANALISIS                                  información que corresponde a los valores
                                                 asignados a las variables anteriormente
                                                 citadas.
Para    la    modelización    del    proyecto
                                                 Para realizar la simulación se utilizo la
probabilístico    se    necesita     de     la
                                                 siguiente base de datos, la cual se encuentra
especificación de variables que permitan
                                                 en formato .arff
determinar el nivel de riesgo o probabilidad
de que una persona haya estado bajo
efectos de estupefacientes y se debe contar      @relation DROGAS
con una base de datos que contienen
factores de riesgo, en este caso 2 y atributos   @attribute EDAD numeric
de clase las cuales se las especifican con       @attribute OIRRITADOS {TRUE,FALSE}
detalle a continuación:                          @attribute DEPRESION {TRUE,FALSE}
                                                 @attribute PERTURBACION {TRUE,FALSE}
5.3.1.1 VARIABLES A EVALUAR
                                                 @attribute RELAJACION {FALSE,TRUE,'TRUE
                                                 '}
Para determinar la probabilidad de que un        @attribute SEDACION {TRUE,FALSE,'TRUE '}
asesino haya estado bajo efectos de drogas       @attribute SOMNOLENCIA {'TRUE ',FALSE}
se lo determinara en base a ciertos atributos    @attribute HIMNOSIS {FALSE,TRUE}
que a la hora de clasificar vienen a ser los     @attribute FATIGA {FALSE,TRUE}
síntomas a evaluar ,éstos atributos o            @attribute ALTERAAPETITO {TRUE,FALSE}
características en su mayoría contienen          @attribute CAMBIOANIMO {TRUE,FALSE}
información de tipo booleano , es decir          @attribute PANICO {FALSE,TRUE}
verdadero y falso. Los atributas a evaluar       @attribute ANSIEDAD {FALSE,TRUE,'TRUE '}
son los siguientes:                              @attribute CONSUMIDOR {'TRUE ',FALSE}

      Edad INTEGER                              @data
      Sexo (0:HOMBRE, 1:MUJER)                  18,TRUE,TRUE,TRUE,FALSE,TRUE,'TRUE
      Ojos irritados (TRUE, FALSE)              ',FALSE,FALSE,TRUE,TRUE,FALSE,FALSE,'TRU
      Efecto depresor (TRUE, FALSE)             E'
20,FALSE,FALSE,TRUE,FALSE,TRUE,FALSE,FA
LSE,FALSE,TRUE,TRUE,FALSE,FALSE,FALSE
                                                Una vez realizada la red, se procede a
22,TRUE,TRUE,TRUE,FALSE,TRUE,'TRUE
                                                asignar valores probabilísticos a cada una de
',FALSE,FALSE,TRUE,TRUE,FALSE,FALSE,'TRU
                                                las variables dependiendo su influencia o
E'
                                                importancia como se muestra en la figura 4.
24,FALSE,FALSE,TRUE,FALSE,TRUE,FALSE,FA
LSE,FALSE,TRUE,TRUE,FALSE,FALSE,FALSE           5.5.1.1. RESULTADOS
42,FALSE,FALSE,TRUE,FALSE,TRUE,FALSE,TR
UE,TRUE,FALSE,FALSE,TRUE,FALSE,FALSE            Una vez especificados los grados de
5.5. EXPERIMENTACION                            probabilidad de cada uno de los atributos
                                                correspondientes al modelo, se procede a
5.5.1. EXPERIMENTACION CON ELVIRA               realizar la inferencia de casos al modelo
                                                para así obtener resultados para cada uno
En base a la investigación de los efectos
                                                de los casos.
causados por las drogas en una persona se
procedió a diseñar la red. En la figura 3. se   Al realizar la inferencia de datos al modelo
muestra la clase principal que viene a ser la   asignando valores a cada atributo se obtiene
enfermedad o anomalía , los atributos edad,     las estadísticas y probabilidad de que si una
sexo que son los factores de riesgo y los       persona ingirió estupefacientes como se
demás atributos que son los síntomas a          muestra en la figura 5.
evaluar.
                                                En el caso 1 , el cual se muestra en la figura
                                                6. , se realiza la inferencia de los atributos:
                                                alucinaciones, somnolencia, pánico            y
                                                ansiedad asignado un valor negativo, dando
                                                como resultado Un valor negativo en la clase
                                                principal “Consume drogas”. En la figura . se
                                                muestra el caso contrario




       Figura 3. Red Bayesiana del Modelo




                                                Figura 5 . Resultado de la Inferencia utilizando Elvira
                                                     para el caso de una persona que no utiliza
                                                                   estupefacientes




Figura 4 . Valores asignados a los atributos
Figura 9. Estadísticas del atributo seleccionado

                                                         RESULTADOS CON WEKA


Figura 6. Resultado de la Inferencia utilizando Elvira
                                                         La clasificación se realiza mediante la
       para el caso de una persona que utilizó
                   estupefacientes                       utilización de dos algoritmos: algoritmo
                                                         NaiveBayes y algoritmo
5.5.3 CLASIFICACION CON WEKA
                                                         5.5.3. ALGORITMO NaiveBayes
       Las siguientes figuran muestran los
atributos del modelo, la frecuencia y                    La primera clasificación realizada es
categorías para el atributo seleccionado y               mediante     el     algoritmo     NaiveBayes
las estadísticas del atributo seleccionado               obteniendo los siguientes resultados:
respectivamente.




                                                         Figura 10. Número y porcentajes de las instancias
                                                         clasificadas correcta e incorrectamente.




           Figura 7. Atributos del modelo                Figura 11. Matriz de confusión




                                                            Figura 12. Detalle de la exactitud de las clases




 Figura 8 . Frecuencia y categorías para el atributo
Figura 17. Ejecución de la aplicación

                                                      5.5.5. MINIMIZACION DEL MARGEN DE
5.5.4. ALGORITMO BayesNet                             ERROR DE LOS ALGORITMOS BAYESNET Y
                                                      NAIVEBAYES

La segunda clasificación realizada es                 Mediante la simulación realizada en el
mediante el algoritmo BayesNet obteniendo             programa Weka se pueden resumir los
los siguientes resultados:                            siguientes resultados en cuanto a las
                                                      instancias clasificadas.

                                                                    BayesNet Vs NaiveBayes

                                                       Algortimo         Instancias            Instancias
                                                                       correctamente       Incorrectamente
Figura 13. Número y porcentajes de las instancias
                                                                        clasificadas          clasificadas
clasificadas correcta e incorrectamente.
                                                       BayesNet           34 (79%)              9 (21%)
                                                      NaiveBayes          29 (67%)             14 (32%)
                                                            Tabla 1. Porcentaje de instancias correctamente
                                                      clasificados por los algoritmos de clasificación en el set de
                                                                          datos experimentales

                                                      Se puede observar además que el algoritmo
                                                      BayesNet presenta un mejor desempeño que
                                                      el algoritmo NaiveBayes; aunque aún así no
          Figura 14. Matriz de confusión
                                                      son los resultados deseados en el presente
                                                      proyecto.

                                                      Para resolver el problema propuesto en éste
                                                      artículo es de gran relevancia que el
                                                      clasificador construido clasifique de una
                                                      manera eficiente y eficaz a las personas
  Figura 15 . Detalle de la exactitud de las clases   para así obtener el diagnostico ideal.

                                                      Como solución al problema se agregaron más
                                                      instancias al conjunto de entrenamiento, ,
                                                      una vez modificado éste modelo , ya se
                                                      puede realizar la inferencia bayesiana sobre
                                                      las variables del modelo, obteniendo los
                                                      siguientes resultados:




              Figura16. Atributos
La tabla 2. Muestra un resumen                            de
                                                                   resultados     obtenidos  mediante                        la
                                                                   experimentación       del  modelo                         de
                                                                   clasificación:

                                                                                           Instancias            Instancias
                                                                                         correctamente       Incorrectamente
                                                                      Instancias          clasificadas          clasificadas
                                                                   BayesNet              44(98%)             1(2%)
                                                                   NavieBayes            41 (91%)            4 (8%)
                                                                   NavieBayes            44(98%)             1(2%)
                                                                   (userSupervised
                                                                   Discretization)
Figura 17. Resultados del algoritmo BayesNet con menor tasa de           Tabla 2. Porcentaje de instancias correctamente
                              error                                clasificados por los algoritmos de clasificación en el set de
                                                                                datos experimentales modificados
 La clasificación utilizando el algoritmo
NavieBayes,     presenta   los  siguientes                         Se puede observar que el algoritmo
resultados:                                                        BayesNet al igual que en la experimentación
                                                                   anterior obtuvo mejores resultados, aunque
                                                                   mediante la utilización de un estimador de
                                                                   clases “userSupervisedDiscretization”, se llegó a
                                                                   obtener los mismos resultados, es decir se
                                                                   minimizó a cabalidad el margen de error en
                                                                   el modelo propuesto. Obteniendo así un
                                                                   clasificador con un margen de error del 1%.
                                                                   Con un gran margen de credibilidad.

                                                                   6. TRABAJOS RELACIONADOS

Figura 17. Resultados del algoritmo Naviebayes con menor tasa de
                               error
                                                                   Entre los trabajos relacionados con la
                                                                   clasificación mediante el uso de redes
Aun mas, mediante la utilización del                               bayesianas se pueden citar los siguientes:
estimador               de              clases
“userSupervisedDiscretization”      en      el
algoritmo NavieBayes, se puede minimizar                           - CLASIFICACION DE LEUCOCITOS MEDIANTE
más la tasa de error, ésta clase convierte los                     REDES BAYESIANAS.- este es un proyecto de
atributos numéricos a atributos nominales.                         tesis realizado por Lucio Jiménez Díaz en
Se obtienen los siguientes resultados:                             [4]. Fue realizado con la finalidad de
                                                                   desarrollar un clasificador de leucocitos ya
                                                                   que la clasificación manual es una tarea
                                                                   engorrosa que sigue existiendo en algunos
                                                                   laboratorios clínicos. Este clasificador
                                                                   comprende las etapas: obtención de
                                                                   imágenes, segmentación, extracción de
                                                                   características y clasificación. En este
                                                                   proyecto el autor concluye que es posible
                                                                   adaptar redes bayesianas de tal forma que
                                                                   permitan obtener resultados satisfactorios
Figura 17. Resultados del algoritmo Naviebayes con menor tasa de
      error utilizando la clase userSupervisedDiscretization       incluso cuando los datos con que se cuenta
para su aprendizaje estén lejos de ser los         incorrectamente   que con el algortimo
ideales.                                           BayesNet.

- En [28] los autores realizan el ensamblaje   -   La implementación de modelo en WEKA
de los algoritmos NeiveBayes y BayesNet
                                                   es sencilla y fácil de interpretar y se
utilizando      el      método       Stacked
Generalization, conocido también como              realiza a partir de una base de datos ,
Stacking. Este método combina múltiples            además brinda mayor información que el
modelos que han sido entrenados para una           modelo Elvira ya que éste se realiza a
tarea de clasificación, es decir, combina          partir de la construcción de una red para
varios clasificadores para inducir un              obtener valores de probabilidad.
clasificador de nivel más alto con un mejor
rendimiento.
                                               -   La exactitud de predicción en la
                                                   experimentación mediante la utilización
-En la Universidad de TALCA, FRANCISCO             de los algoritmos bayesianos puede ser
GABRIEL REYES MATUS se ha realizado un             mejorada mediante la utilización de un
sistema de PREDICCION DE RIESGOS EN                set de evidencia bastante representativo
PROYECTOS      DE     SOFTWARE      USANDO         del problema
MODELOS EN REDES BAYESIANAS.- En este
proyecto se ha construido un software que      -   Las redes bayesianas han aparecido como
toma los modelos en redes bayesianas,              una herramienta muy importante en el
permite el ingreso de evidencias que               campo de la clasificación ya que permite
representan un proyecto nuevo y entrega la         manipular la información de manera
probabilidad de éxito de éste. [23]                flexible debido a que se fomenta en
                                                   bases rigurosamente matemáticas.

- CADECEUS Diagnóstico de enfermedades
                                               8. REFERENCIAS
reumáticas. En el área de medicina ha
realizado aplicado también clasificación
mediante este método. Jonh Myres y Harry        [1] Guoqiang Peter Zhang.- Neural Networks
Pople en la Universidad de Pittsburgh, puede   for Classification: A Survey
diagnosticar enfermedades que no están
relacionadas apelando a la heurística con      [2]  Priyantha     Wijayatunga.-    Bayesian
objeto de limitar el campo y extraer           networks for classification
información de su gran banco de memoria.
                                               [3] Minoo Aminian, Amina Shabbeer, Kristin
                                               P Bennett.- A conformal Bayesian network
7. CONCLUSIONES                                for    classification   of    Mycobacterium
                                               tuberculosis complex lineages

-   Mediante la implementación de los          [4] Lucio Jimenez Diaz.-CLASIFICACI_ON DE
    algoritmos Naivebayes y BayesNet en la     LEUCOCITOS MEDIANTE REDES BAYESIANAS"
    clasificación  del   modelos    se   ha
    comprobado que el algoritmo BayesNet       [5] Mar Abad Grau, María Visitación Hurtado
    ha dado menos errores, es decir que en     Torres, Rosana Montes Soldado, Miguel J.
    la    implementación   de    NaiveBayes    Hornos Barranco.- LAS REDES BAYESIANAS
    existieron más instancias clasificadas     COMO SISTEMAS DE SOPORTE A LA DECISIÓN
EN LA EMPRESA
                                               [17] Javier Díez .- ELVIRA
[6] Paul Helman,1 Robert Veroff,1 Susan R.
Atlas,2 and Cheryl Willman3.- Paul Helman,1    [18] G. Holmes; A. Donkin and I.H. Witten
Robert Veroff,1 Susan R. Atlas,2 and Cheryl    (1994). «Weka: A machine learning
Willman3                                       workbench».Proc Second Australia and New
                                               Zealand    Conference     on    Intelligent
[7] Jie Cheng1, Russell Greiner2.- Jie         Information Systems, Brisbane, Australia.
Cheng1,    Russell   Greiner2.-   Learning     Consultado el 25-06-2007.
Bayesian    Belief   Network    Classifiers:
Algorithms and System                          [19]                              Weka,
                                               http://www.cs.waikato.ac.nz/ml/weka/

                                               [20] Angel Kuri, Martha Ortiz, Lucía
[8] Nir Friedman, Moises Goldszmidt- - .-
                                               Castellanos, Carlos Ponce, Christopher
Building Classifiers using Bayesian Networks
                                               Gasca, Oscar Herrera.- Clasificación No
                                               Sesgada de Proteínas con Redes Neuronales
[9] Carlos López de Castilla Vásquez.-
                                               y Computación Evolutiva
CLASIFICADORES POR REDES BAYESIANAS
                                               [21]Pablo Ezequiel FELGAER.- OPTIMIZACIÓN
[10] David A. Velasco Villanueva.- RREDES      DE REDES BAYESIANAS BASADO EN TÉCNICAS
BAYESIANAS                                     DE APRENDIZAJE POR INDUCCIÓN

[11] Robin hanson, John Stutz, Peter           [22] Fausto Andrés Monreal, WEKA
Cheeseman .- Bayesian Classification Theory
                                               [23] FRANCISCO GABRIEL REYES MATUS.- “
                                               UNA HERRAMIENTA PARA LA PREDICCION DE
[12]    Constantino     Malagón     Luque.-    RIESGOS EN PROYECTOS DE SOFTWARE
Clasicadores bayesianos. El algoritmo Naïve    USANDO MODELOS EN REDES BAYESIANAS”
Bayes
                                               [24] David A. Velasco Villanueva.- Redes
[13]    Bayesian Networks en diagnóstico       Bayesianas
psiquiátrico o psicopatológico. Lic. Mariano
                                               [25] Jiakai Li, Gursel Serpen, Steven Selman,
Acciardi.      http://www.marianoacciardi.     Matt Franchetti, Mike Riesen and Cynthia
com.ar/textos_ia/BN1.pdf                       Schneider .- Bayes Net Classifiers for
                                               Prediction of
14] Redes Bayesianas en Minería de Datos.      Renal Graft Status and Survival Period
http://ccc.inaoep.mx/~emorales/Cursos/Nv
oAprend/node68.html                            [26] Remco R. Bouckaert.- Bayesian Network
                                               Classfiers in Weka
[15] Álvaro Marín Illera, Sistemas Expertos,
Redes Bayesianas y sus aplicaciones.           [27] Ramírez López, Leonardo.- Modelo de
http://www.e-                                  clasificación de arritmias mediante técnicas
ghost.deusto.es/docs/2005/conferencias/Ba      de aprendizaje de máquina.
yes05.pdf
                                               [28] Roberto Portugal & Miguel A. Carrasco
                                               .- ENSAMBLE DE ALGORITMOS BAYESIANOS
[16] Carmen Lacave – UCLM, Fco. Javier Díez    CON ÁRBOLES DE DECISIÓN, UNA
– UNED.- Elvira 0.11. Graphical User           ALTERNATIVA DE CLASIFICACIÓN.
Interface

Más contenido relacionado

Similar a Final

Técnicas mineria de datos
Técnicas mineria de datosTécnicas mineria de datos
Técnicas mineria de datoslalopg
 
Cómo construir y validar redes bayesianas con netica
Cómo construir y validar redes bayesianas con neticaCómo construir y validar redes bayesianas con netica
Cómo construir y validar redes bayesianas con neticaBeat Winehouse
 
Cuadro comparativo sobre las diferentes metodologías para el análisis y desar...
Cuadro comparativo sobre las diferentes metodologías para el análisis y desar...Cuadro comparativo sobre las diferentes metodologías para el análisis y desar...
Cuadro comparativo sobre las diferentes metodologías para el análisis y desar...Carlos Aguirre
 
Mineria de datos en salud - Introducción -
Mineria de datos en salud   - Introducción -Mineria de datos en salud   - Introducción -
Mineria de datos en salud - Introducción -jairo cesar
 
Trabajo de tecnoogia
Trabajo de tecnoogiaTrabajo de tecnoogia
Trabajo de tecnoogiaskafer
 
Clasificacion Supervisada Y Algoritmos Evolutivos
Clasificacion Supervisada Y Algoritmos EvolutivosClasificacion Supervisada Y Algoritmos Evolutivos
Clasificacion Supervisada Y Algoritmos EvolutivosALONSO UCHIHA
 
Técnicas de minería de datos
Técnicas de minería de datosTécnicas de minería de datos
Técnicas de minería de datosDavidAcurio2
 
Mecanismos de conocimiento en I.A
Mecanismos de conocimiento en I.AMecanismos de conocimiento en I.A
Mecanismos de conocimiento en I.Abetzabethperez2
 
ACTIVIDAD1.2.VALORACIÓN DEL INSTRUMENTO.PEREZ-LINA.pptx
ACTIVIDAD1.2.VALORACIÓN DEL INSTRUMENTO.PEREZ-LINA.pptxACTIVIDAD1.2.VALORACIÓN DEL INSTRUMENTO.PEREZ-LINA.pptx
ACTIVIDAD1.2.VALORACIÓN DEL INSTRUMENTO.PEREZ-LINA.pptxLinaLuzPerezMedrano
 
Presentacion mineria
Presentacion mineriaPresentacion mineria
Presentacion mineriaviktor93
 
Minería de datos con WEKA para el diagnóstico preventivo de cáncer
Minería de datos con WEKA para el diagnóstico preventivo de cáncerMinería de datos con WEKA para el diagnóstico preventivo de cáncer
Minería de datos con WEKA para el diagnóstico preventivo de cáncerPablo Antonio Alvarado Ruiz
 
Técnicas de minería de datos
Técnicas de minería de datosTécnicas de minería de datos
Técnicas de minería de datosBryan Barragan
 
Cuadro comparativo de_herramientas_estadisticas_de_control_de_calidad_ricardo...
Cuadro comparativo de_herramientas_estadisticas_de_control_de_calidad_ricardo...Cuadro comparativo de_herramientas_estadisticas_de_control_de_calidad_ricardo...
Cuadro comparativo de_herramientas_estadisticas_de_control_de_calidad_ricardo...Ricardo Ciccotti Castro
 
Valores, Actitudes y Comportamiento Ecologico Modelado con una Red Bayesiana
Valores, Actitudes y Comportamiento Ecologico Modelado con una Red Bayesiana Valores, Actitudes y Comportamiento Ecologico Modelado con una Red Bayesiana
Valores, Actitudes y Comportamiento Ecologico Modelado con una Red Bayesiana GabyNarvaez
 
Problemas De Validez
Problemas De ValidezProblemas De Validez
Problemas De ValidezLaura Colo
 

Similar a Final (20)

Técnicas mineria de datos
Técnicas mineria de datosTécnicas mineria de datos
Técnicas mineria de datos
 
Cómo construir y validar redes bayesianas con netica
Cómo construir y validar redes bayesianas con neticaCómo construir y validar redes bayesianas con netica
Cómo construir y validar redes bayesianas con netica
 
Cuadro comparativo sobre las diferentes metodologías para el análisis y desar...
Cuadro comparativo sobre las diferentes metodologías para el análisis y desar...Cuadro comparativo sobre las diferentes metodologías para el análisis y desar...
Cuadro comparativo sobre las diferentes metodologías para el análisis y desar...
 
Mineria de datos en salud - Introducción -
Mineria de datos en salud   - Introducción -Mineria de datos en salud   - Introducción -
Mineria de datos en salud - Introducción -
 
Trabajo de tecnoogia
Trabajo de tecnoogiaTrabajo de tecnoogia
Trabajo de tecnoogia
 
Clasificacion Supervisada Y Algoritmos Evolutivos
Clasificacion Supervisada Y Algoritmos EvolutivosClasificacion Supervisada Y Algoritmos Evolutivos
Clasificacion Supervisada Y Algoritmos Evolutivos
 
Técnicas de minería de datos
Técnicas de minería de datosTécnicas de minería de datos
Técnicas de minería de datos
 
Mecanismos de conocimiento en I.A
Mecanismos de conocimiento en I.AMecanismos de conocimiento en I.A
Mecanismos de conocimiento en I.A
 
ACTIVIDAD1.2.VALORACIÓN DEL INSTRUMENTO.PEREZ-LINA.pptx
ACTIVIDAD1.2.VALORACIÓN DEL INSTRUMENTO.PEREZ-LINA.pptxACTIVIDAD1.2.VALORACIÓN DEL INSTRUMENTO.PEREZ-LINA.pptx
ACTIVIDAD1.2.VALORACIÓN DEL INSTRUMENTO.PEREZ-LINA.pptx
 
Presentacion mineria
Presentacion mineriaPresentacion mineria
Presentacion mineria
 
Minería de datos con WEKA para el diagnóstico preventivo de cáncer
Minería de datos con WEKA para el diagnóstico preventivo de cáncerMinería de datos con WEKA para el diagnóstico preventivo de cáncer
Minería de datos con WEKA para el diagnóstico preventivo de cáncer
 
Redes neuronales
Redes neuronalesRedes neuronales
Redes neuronales
 
Sub
SubSub
Sub
 
Técnicas de minería de datos
Técnicas de minería de datosTécnicas de minería de datos
Técnicas de minería de datos
 
Presentacion
PresentacionPresentacion
Presentacion
 
Investigacion cuantitativa
Investigacion cuantitativaInvestigacion cuantitativa
Investigacion cuantitativa
 
Cuadro comparativo de_herramientas_estadisticas_de_control_de_calidad_ricardo...
Cuadro comparativo de_herramientas_estadisticas_de_control_de_calidad_ricardo...Cuadro comparativo de_herramientas_estadisticas_de_control_de_calidad_ricardo...
Cuadro comparativo de_herramientas_estadisticas_de_control_de_calidad_ricardo...
 
Valores, Actitudes y Comportamiento Ecologico Modelado con una Red Bayesiana
Valores, Actitudes y Comportamiento Ecologico Modelado con una Red Bayesiana Valores, Actitudes y Comportamiento Ecologico Modelado con una Red Bayesiana
Valores, Actitudes y Comportamiento Ecologico Modelado con una Red Bayesiana
 
Problemas De Validez
Problemas De ValidezProblemas De Validez
Problemas De Validez
 
Presenta investigación cuantitativa
Presenta investigación cuantitativaPresenta investigación cuantitativa
Presenta investigación cuantitativa
 

Final

  • 1. CLASIFICACION DE PERSONAS ACUSADAS DE ASESINATO QUE HAYAN ACTUADO BAJO EL EFECTO DE LAS DROGAS UTILIZANDO REDES BAYESIANAS Marcela T. Gómez González mtgomez@utpl.edu.ec UNIVERSIDAD TECNICA PARTICULAR DE LOJA Ingeniería en Sistemas Informáticos y Computación INTELIGENCIA ARTIFICIAL AVANZADA ABSTRACT personas acusadas por asesinato y que hayan actuado bajo efectos de drogas. Drugs consumption is a relevant social En la actualidad se cuenta con gran cantidad problem because of this addiction causes big de estrategias para realizar diagnostico y familiarly, couple, school, work and legal clasificación de objetos, personas, problems that deteriorate people’s social enfermedades, etc; procesos que se realizan environment. This research make a con el fin de asignar uno o más objetos a classification of people accused of murder una clase o grupo definidos. La presente under the influence of drugs. investigación trata el estudio de redes Actually, there are many strategies for bayesianas, siendo éstas un método que objects, people and diseases diagnosis and basa su estudio en teorías de probabilidad y classification, processes carried out in order permiten realizar una inferencia al integrar to assign one or more objects to a defined el juicio de un experto con las bases de class or group. This research is the study of datos de las que se dispone, éste método Bayesian networks, which is a method based presenta algunas ventajas sobre otros in probability theories and let us to make cuando los datos son imprecisos y sobre todo inferences by integrating an expert opinion cuando las relaciones entre variables son no with available databases. This method has lineales. some advantages over others when the data are imprecise and especially when PALABRAS CLAVE: relationships between variables are nonlinear. Redes bayesianas, aprendizaje, RESUMEN: clasificación, Weka, Elvira, NaiveBayes, BayesNet El consumo de drogas constituye un problema social de gran relevancia, ya que 1. PLANTEAMIENTO DEL PROBLEMA ésa adicción origina graves conflictos familiares, de pareja, escolares, laborales e, Realizar una clasificación de personas de incluso, problemas legales que deterioran el una manera manual sin la utilización de entorno social de la persona. En éste algún sistema computacional es un gran artículo se realiza la clasificación de problema para la sociedad en general, por lo que éste proyecto se realiza con la finalidad
  • 2. de construir un clasificador inteligente, que mediante la especificación de una serie de 3. INTRODUCCION características permita realizar la clasificación de dependiendo de ciertos Con frecuencia se encuentran situaciones o criterios, en éste caso la clasificación de fenómenos que contienen algunos eventos personas asesinas que hayan cometido un aleatorios asociados con este. Existen delito por consecuencia de las drogas. Modelos Probabilísticos que pueden ser aprovechados cuando existan relaciones Se plantea una solución ante éste problema probabilísticas entre un conjunto de mediante la utilización de un clasificador variables aleatorias afectadas y Modelos que responda de manera eficaz y eficiente Gráficos, los cuales han llegado a ser mediante la utilización de software que sea populares entre comunidades estadísticas y accesible tanto de manera económica y de inteligencia artificial debido a su física. facilidad de simplificar la comunicación entre el dominio experto y el modelador. OBJETIVOS Las redes Bayesianas son una clase de modelos gráficos que modelan relaciones 2.1. OBJETIVOS GENERAL probabilísticas a través de un grafico acíclico dirigido , en el cuál cada nodo - Construir un clasificador de personas corresponde a una variable aleatoria y cada (asesinos) que hayan actuado bajo efectos flecha corresponde una relación de de estupefacientes mediante la aplicación dependencia probabilística entre dos de Redes Bayesianas y utilizando los variables afectadas[2] algoritmos BayesNet y NaiveBayes. Existen muchas tareas prácticas que pueden 2.2. OBJETIVOS ESPECIFICOS reducirse a problemas de clasificación como diagnósticos de enfermedades, - Investigar diferentes herramientas que reconocimiento de patrones y en caso de permitan realizar un clasificador que éste proyecto diagnostico o probabilidad de permita emitir información clasificada de consumo de drogas de una persona; éste una manera eficiente y un mínimo tipo de tareas tienen la finalidad de asignar porcentaje de error. objetos a categorías o clases determinadas según sus propiedades. Clasificación que se - Investigar técnicas utilizadas en redes realizará mediante los programas Weka y bayesianas para la clasificación de objetos. Elvira - Investigar trabajos relacionados en el área 4. MARCO TEORICO de clasificación mediante Redes Bayesianas 4.1. REDES BAYESIANAS Y CLASIFICACION - Implementar el modelo en Weka Una red Bayesiana es un grafo acíclico que - Implementar el modelo en Elvira representa relaciones probabilísticas entre variables aleatorias [7]. El razonamiento probabilístico en éste tipo de redes consiste en propagar los efectos de la evidencia a través de la red para conocer la probabilidad a posteriori de las variables. Se
  • 3. asignan valores a ciertas variables de la base capaces de generalizar, adaptar señales de de datos y se obtiene la probabilidad ruido y distorsión sin perder su robustez [1], posterior de las demás variables dadas las son entrenadas y no requieren de una variables conocidas [22] descripción precisa de patrones a ser clasificados Las redes bayesianas pueden realizar a cabalidad la tarea de clasificación, ya que - Los métodos bayesianos permiten tener en es un caso particular de la tarea de cuenta en la predicción de la hipótesis el predicción, se caracteriza por tener una sola conocimiento a priori en forma de de las variables de la base de datos probabilidades. El problema puede surgir al (clasificador) que se desea predecir, en éste tener que estimar ese conocimiento proyecto ésta variable es “consumedrogas” estadístico sin disponer de datos mientras que todas las otras son los datos suficientes.[12]. propios del caso que se desea clasificar, es decir las características de las personas, se - Las redes bayesianas permiten definir pueden citar por ejemplo: fatiga, modelos y utilizarlos tanto para hacer somnolencia, alucinaciones, etc. Pueden razonamiento de diagnóstico (pues obtienen existir una gran cantidad de variables en la las causas más probables dado un conjunto base de datos, algunas de las cuales estarán de síntomas), como para hacer directamente relacionadas con la variable razonamiento predictivo (obteniendo la clasificadora que se quiere predecir pero probabilidad de presentar un cierto síntoma también pueden existir otras variables que suponiendo que existe una causa no lo estén.[21] conocida)[21]. La idea de utilizar redes Bayesianas en éste - Una de las características de las redes proyecto es que se puede estimar bayesianas es que un mismo nodo puede ser probabilidades a posteriori de cualquier fuente de información u objeto de hipótesis con el conjunto de datos de predicción dependiendo de cuál sea la entrenamiento, para así escoger la hipótesis evidencia disponible. más probable. Los métodos bayesianos en tareas de 4.2. APRENDIZAJE DE UNA RED BAYESIANA aprendizaje poseen ciertas características, entre las cuáles se pueden citar las El aprendizaje en la redes bayesianas siguientes: consiste en definir una estructura grafica a partir de datos almacenados en bases de - La hipótesis perteneciente a un ejemplo datos. El aprendizaje en éste tipo de redes aumenta o disminuye la probabilidad. Al consiste en definir la red probabilística a momento que no concuerde con un conjunto partir de datos almacenados en bases de de ejemplos más o menos grande ésta datos en lugar de obtener el conocimiento probabilidad no es desechada por completo del experto. Este tipo de aprendizaje ofrece sino que se disminuirá esa probabilidad la posibilidad de inducir la estructura grafica estimada para la hipótesis. de la red a partir de los datos observados y de definir las relaciones entre los nodos basándose también en dichos casos. Se - Entre las principales ventajas de las redes definen en aprendizaje estructural y bayesianas se puede citar que ellas son paramétrico
  • 4. 5.1.1. ELVIRA 0.162 En el aprendizaje estructural se debe El programa Elvira está destinado a la obtener la estructura de la Red Bayesiana edición y evaluación de modelos gráficos con sus respectivas relaciones. Tomando en probabilistas, concretamente redes cuenta que éste tipo de aprendizaje bayesianas y diagramas de influencia. [17] depende del tipo de estructura de la red. [15] Cuenta con un formato propio de codificación de los modelos, un lector A diferencia del aprendizaje estructural, el intérprete para los modelos codificados, una interfaz gráfica para la construcción de aprendizaje paramétrico consiste en redes, con opciones específicas para encontrar parámetros asociados a una modelos canónicos (Noisy OR, Noisy AND, estructura de una red bayesiana dada [14], etc...), algoritmos exactos y aproximados es decir, parámetros conformados por las (estocásticos) de razonamiento tanto para probabilidades del nodo raíz y de las demás variables discretas como continuas, métodos variables. de explicación del razonamiento, algoritmos de toma de decisiones, aprendizaje de modelos a partir de base de datos, fusión de En general, una red bayesiana en sus redes, etc [24] primeros estados, puede ser constituida según la opinión de los expertos o bien Elvira puede operar en tres modos: según la información de la que se parta o teniendo en cuenta ambas cosas. Conforme se añade información a la misma, se va • Modo Editar, éste modo se utiliza para modificando tanto su estructura como los crear y modificar Redes bayesianas e influenciar diagramas parámetros mediante un proceso de cuyas variables son solamente discretas. aprendizaje [5]. • Modo Inferencia, para hacer propagación 5. DISENO E IMPLEMENTACION DEL de evidencia CLASIFICADOR • Modo aprendizaje.- permite construir 5.1. HERRAMIENTAS UTILIZADAS redes Bayesianas desde bases de datos. [16] Su mayor ventaja es que éste software En el presente proyecto se utilizara las permite representar de una manera gráfica herramientas: Weka y Elvira para realizar el los resultados de los análisis de sensibilidad, clasificador. además mostrar los caminos de Figura1. Herramienta Elvira razonamiento y de clasificar los hallazgos en función del tipo de impacto que ejercen sobre una variable. 5.1.2. WEKA 3.6 Figura 2. Herramienta Weka Es un entorno para experimentación de análisis de datos que permite aplicar, analizar y evaluar las técnicas más
  • 5. relevantes de análisis de datos, Bayes Net (Pearl 1988) es un método basado en “score” y búsqueda, en los cuales la medida de bondad (verosimilitud, entropía, porcentaje de bien clasificados) de una estructura particular es definida, y se lleva a cabo un procedimiento de búsqueda a lo largo del espacio de todas posibles estructuras de redes bayesianas [27] 5.3. MODELO principalmente las provenientes del aprendizaje automático, sobre cualquier Las drogas actúan sobre el sistema nervioso conjunto de datos del usuario. [19]. central produciendo varios efectos como Se utiliza ésta herramienta debido a que efectos depresores que disminuyen o inhiben está disponible de una manera libre bajo la los mecanismos de funcionamiento normal licencia pública general de GNU y es un del sistema nervioso central y efectos software muy portable que puede correr alucinógenos o perturbadores, que alteran la bajo cualquier plataforma. percepción de la realidad y alteraciones psicológicas van desde 5.2. ALGORITMOS UTILIZADOS cambios en el estado de ánimo a crisis de ansiedad. 5.2.1. ALGORITMO NaiveBayes La implementación de éste algoritmo se Se evalúan en el modelo variables que encuentra en el clasificador representan factores de Riesgo y variables weka.classifiers.bayes.NaiveBayes. Se ha que representan los síntomas que son ejecutado con sus parámetros por defecto: causados por ingerir alguna clase de droga. sin desratización supervisada y con Los factores de riesgo que influyan a una distribución normal aplicada a los atributos persona para ser consumidor de drogas son numéricos. [24] los siguientes: Edad: se ha tomado „esta variable Naive Bayes es un método de clasificación como un factor de riesgo, asignándole una probabilístico. Se utiliza una distribución mayor probabilidad a las personas adultas y normal para clasificar una nueva instancia adultas mayores más que a los adolescentes de un conjunto D dentro de un conjunto finito C de clases predeterminadas. [27] Sexo: El género de mayor riesgo en el modelo es el género masculino 5.2.2. ALGORITMO BayesNet Los síntomas que permiten identificar si una El algoritmo de clasificación BayesNet se persona está bajo efectos de droga son los aprovecha para desarrollar la red de siguientes: creencia bayesiana. Las opciones que deben  ojos irritados ser abordadas en Weka incluyen el  Efecto depresor estimador que calcula las tablas de probabilidad condicional de las redes de  Efecto perturbador Bayes. [25]  Relajación
  • 6. Sedación  Efecto perturbador (TRUE, FALSE)  Somnolencia  Relajación (TRUE, FALSE)  Hipnosis  Sedación (TRUE, FALSE)  Fatiga  Somnolencia (TRUE, FALSE)  Alteración de sueno  Hipnosis (TRUE, FALSE)  Alteración de apetito  Fatiga (TRUE, FALSE)  Alucinaciones  Alteración de sueno (TRUE, FALSE)  Cambios de animo  Alteración de apetito (TRUE, FALSE)  Pánico  Alucinaciones (TRUE, FALSE)  Ansiedad  Cambios de ánimo(TRUE, FALSE)  Pánico(TRUE, FALSE) Estos efectos en su totalidad dan un 100%,  Ansiedad(TRUE, FALSE) pero a la hora de simularos en la herramienta Elvira, todos dan un porcentaje 5.4. DATOS del 10%, ya que es el porcentaje equivalente al 100%. La base de datos consta de información recolectada de ciertas personas, 5.3.1. ANALISIS información que corresponde a los valores asignados a las variables anteriormente citadas. Para la modelización del proyecto Para realizar la simulación se utilizo la probabilístico se necesita de la siguiente base de datos, la cual se encuentra especificación de variables que permitan en formato .arff determinar el nivel de riesgo o probabilidad de que una persona haya estado bajo efectos de estupefacientes y se debe contar @relation DROGAS con una base de datos que contienen factores de riesgo, en este caso 2 y atributos @attribute EDAD numeric de clase las cuales se las especifican con @attribute OIRRITADOS {TRUE,FALSE} detalle a continuación: @attribute DEPRESION {TRUE,FALSE} @attribute PERTURBACION {TRUE,FALSE} 5.3.1.1 VARIABLES A EVALUAR @attribute RELAJACION {FALSE,TRUE,'TRUE '} Para determinar la probabilidad de que un @attribute SEDACION {TRUE,FALSE,'TRUE '} asesino haya estado bajo efectos de drogas @attribute SOMNOLENCIA {'TRUE ',FALSE} se lo determinara en base a ciertos atributos @attribute HIMNOSIS {FALSE,TRUE} que a la hora de clasificar vienen a ser los @attribute FATIGA {FALSE,TRUE} síntomas a evaluar ,éstos atributos o @attribute ALTERAAPETITO {TRUE,FALSE} características en su mayoría contienen @attribute CAMBIOANIMO {TRUE,FALSE} información de tipo booleano , es decir @attribute PANICO {FALSE,TRUE} verdadero y falso. Los atributas a evaluar @attribute ANSIEDAD {FALSE,TRUE,'TRUE '} son los siguientes: @attribute CONSUMIDOR {'TRUE ',FALSE}  Edad INTEGER @data  Sexo (0:HOMBRE, 1:MUJER) 18,TRUE,TRUE,TRUE,FALSE,TRUE,'TRUE  Ojos irritados (TRUE, FALSE) ',FALSE,FALSE,TRUE,TRUE,FALSE,FALSE,'TRU  Efecto depresor (TRUE, FALSE) E'
  • 7. 20,FALSE,FALSE,TRUE,FALSE,TRUE,FALSE,FA LSE,FALSE,TRUE,TRUE,FALSE,FALSE,FALSE Una vez realizada la red, se procede a 22,TRUE,TRUE,TRUE,FALSE,TRUE,'TRUE asignar valores probabilísticos a cada una de ',FALSE,FALSE,TRUE,TRUE,FALSE,FALSE,'TRU las variables dependiendo su influencia o E' importancia como se muestra en la figura 4. 24,FALSE,FALSE,TRUE,FALSE,TRUE,FALSE,FA LSE,FALSE,TRUE,TRUE,FALSE,FALSE,FALSE 5.5.1.1. RESULTADOS 42,FALSE,FALSE,TRUE,FALSE,TRUE,FALSE,TR UE,TRUE,FALSE,FALSE,TRUE,FALSE,FALSE Una vez especificados los grados de 5.5. EXPERIMENTACION probabilidad de cada uno de los atributos correspondientes al modelo, se procede a 5.5.1. EXPERIMENTACION CON ELVIRA realizar la inferencia de casos al modelo para así obtener resultados para cada uno En base a la investigación de los efectos de los casos. causados por las drogas en una persona se procedió a diseñar la red. En la figura 3. se Al realizar la inferencia de datos al modelo muestra la clase principal que viene a ser la asignando valores a cada atributo se obtiene enfermedad o anomalía , los atributos edad, las estadísticas y probabilidad de que si una sexo que son los factores de riesgo y los persona ingirió estupefacientes como se demás atributos que son los síntomas a muestra en la figura 5. evaluar. En el caso 1 , el cual se muestra en la figura 6. , se realiza la inferencia de los atributos: alucinaciones, somnolencia, pánico y ansiedad asignado un valor negativo, dando como resultado Un valor negativo en la clase principal “Consume drogas”. En la figura . se muestra el caso contrario Figura 3. Red Bayesiana del Modelo Figura 5 . Resultado de la Inferencia utilizando Elvira para el caso de una persona que no utiliza estupefacientes Figura 4 . Valores asignados a los atributos
  • 8. Figura 9. Estadísticas del atributo seleccionado RESULTADOS CON WEKA Figura 6. Resultado de la Inferencia utilizando Elvira La clasificación se realiza mediante la para el caso de una persona que utilizó estupefacientes utilización de dos algoritmos: algoritmo NaiveBayes y algoritmo 5.5.3 CLASIFICACION CON WEKA 5.5.3. ALGORITMO NaiveBayes Las siguientes figuran muestran los atributos del modelo, la frecuencia y La primera clasificación realizada es categorías para el atributo seleccionado y mediante el algoritmo NaiveBayes las estadísticas del atributo seleccionado obteniendo los siguientes resultados: respectivamente. Figura 10. Número y porcentajes de las instancias clasificadas correcta e incorrectamente. Figura 7. Atributos del modelo Figura 11. Matriz de confusión Figura 12. Detalle de la exactitud de las clases Figura 8 . Frecuencia y categorías para el atributo
  • 9. Figura 17. Ejecución de la aplicación 5.5.5. MINIMIZACION DEL MARGEN DE 5.5.4. ALGORITMO BayesNet ERROR DE LOS ALGORITMOS BAYESNET Y NAIVEBAYES La segunda clasificación realizada es Mediante la simulación realizada en el mediante el algoritmo BayesNet obteniendo programa Weka se pueden resumir los los siguientes resultados: siguientes resultados en cuanto a las instancias clasificadas. BayesNet Vs NaiveBayes Algortimo Instancias Instancias correctamente Incorrectamente Figura 13. Número y porcentajes de las instancias clasificadas clasificadas clasificadas correcta e incorrectamente. BayesNet 34 (79%) 9 (21%) NaiveBayes 29 (67%) 14 (32%) Tabla 1. Porcentaje de instancias correctamente clasificados por los algoritmos de clasificación en el set de datos experimentales Se puede observar además que el algoritmo BayesNet presenta un mejor desempeño que el algoritmo NaiveBayes; aunque aún así no Figura 14. Matriz de confusión son los resultados deseados en el presente proyecto. Para resolver el problema propuesto en éste artículo es de gran relevancia que el clasificador construido clasifique de una manera eficiente y eficaz a las personas Figura 15 . Detalle de la exactitud de las clases para así obtener el diagnostico ideal. Como solución al problema se agregaron más instancias al conjunto de entrenamiento, , una vez modificado éste modelo , ya se puede realizar la inferencia bayesiana sobre las variables del modelo, obteniendo los siguientes resultados: Figura16. Atributos
  • 10. La tabla 2. Muestra un resumen de resultados obtenidos mediante la experimentación del modelo de clasificación: Instancias Instancias correctamente Incorrectamente Instancias clasificadas clasificadas BayesNet 44(98%) 1(2%) NavieBayes 41 (91%) 4 (8%) NavieBayes 44(98%) 1(2%) (userSupervised Discretization) Figura 17. Resultados del algoritmo BayesNet con menor tasa de Tabla 2. Porcentaje de instancias correctamente error clasificados por los algoritmos de clasificación en el set de datos experimentales modificados La clasificación utilizando el algoritmo NavieBayes, presenta los siguientes Se puede observar que el algoritmo resultados: BayesNet al igual que en la experimentación anterior obtuvo mejores resultados, aunque mediante la utilización de un estimador de clases “userSupervisedDiscretization”, se llegó a obtener los mismos resultados, es decir se minimizó a cabalidad el margen de error en el modelo propuesto. Obteniendo así un clasificador con un margen de error del 1%. Con un gran margen de credibilidad. 6. TRABAJOS RELACIONADOS Figura 17. Resultados del algoritmo Naviebayes con menor tasa de error Entre los trabajos relacionados con la clasificación mediante el uso de redes Aun mas, mediante la utilización del bayesianas se pueden citar los siguientes: estimador de clases “userSupervisedDiscretization” en el algoritmo NavieBayes, se puede minimizar - CLASIFICACION DE LEUCOCITOS MEDIANTE más la tasa de error, ésta clase convierte los REDES BAYESIANAS.- este es un proyecto de atributos numéricos a atributos nominales. tesis realizado por Lucio Jiménez Díaz en Se obtienen los siguientes resultados: [4]. Fue realizado con la finalidad de desarrollar un clasificador de leucocitos ya que la clasificación manual es una tarea engorrosa que sigue existiendo en algunos laboratorios clínicos. Este clasificador comprende las etapas: obtención de imágenes, segmentación, extracción de características y clasificación. En este proyecto el autor concluye que es posible adaptar redes bayesianas de tal forma que permitan obtener resultados satisfactorios Figura 17. Resultados del algoritmo Naviebayes con menor tasa de error utilizando la clase userSupervisedDiscretization incluso cuando los datos con que se cuenta
  • 11. para su aprendizaje estén lejos de ser los incorrectamente que con el algortimo ideales. BayesNet. - En [28] los autores realizan el ensamblaje - La implementación de modelo en WEKA de los algoritmos NeiveBayes y BayesNet es sencilla y fácil de interpretar y se utilizando el método Stacked Generalization, conocido también como realiza a partir de una base de datos , Stacking. Este método combina múltiples además brinda mayor información que el modelos que han sido entrenados para una modelo Elvira ya que éste se realiza a tarea de clasificación, es decir, combina partir de la construcción de una red para varios clasificadores para inducir un obtener valores de probabilidad. clasificador de nivel más alto con un mejor rendimiento. - La exactitud de predicción en la experimentación mediante la utilización -En la Universidad de TALCA, FRANCISCO de los algoritmos bayesianos puede ser GABRIEL REYES MATUS se ha realizado un mejorada mediante la utilización de un sistema de PREDICCION DE RIESGOS EN set de evidencia bastante representativo PROYECTOS DE SOFTWARE USANDO del problema MODELOS EN REDES BAYESIANAS.- En este proyecto se ha construido un software que - Las redes bayesianas han aparecido como toma los modelos en redes bayesianas, una herramienta muy importante en el permite el ingreso de evidencias que campo de la clasificación ya que permite representan un proyecto nuevo y entrega la manipular la información de manera probabilidad de éxito de éste. [23] flexible debido a que se fomenta en bases rigurosamente matemáticas. - CADECEUS Diagnóstico de enfermedades 8. REFERENCIAS reumáticas. En el área de medicina ha realizado aplicado también clasificación mediante este método. Jonh Myres y Harry [1] Guoqiang Peter Zhang.- Neural Networks Pople en la Universidad de Pittsburgh, puede for Classification: A Survey diagnosticar enfermedades que no están relacionadas apelando a la heurística con [2] Priyantha Wijayatunga.- Bayesian objeto de limitar el campo y extraer networks for classification información de su gran banco de memoria. [3] Minoo Aminian, Amina Shabbeer, Kristin P Bennett.- A conformal Bayesian network 7. CONCLUSIONES for classification of Mycobacterium tuberculosis complex lineages - Mediante la implementación de los [4] Lucio Jimenez Diaz.-CLASIFICACI_ON DE algoritmos Naivebayes y BayesNet en la LEUCOCITOS MEDIANTE REDES BAYESIANAS" clasificación del modelos se ha comprobado que el algoritmo BayesNet [5] Mar Abad Grau, María Visitación Hurtado ha dado menos errores, es decir que en Torres, Rosana Montes Soldado, Miguel J. la implementación de NaiveBayes Hornos Barranco.- LAS REDES BAYESIANAS existieron más instancias clasificadas COMO SISTEMAS DE SOPORTE A LA DECISIÓN
  • 12. EN LA EMPRESA [17] Javier Díez .- ELVIRA [6] Paul Helman,1 Robert Veroff,1 Susan R. Atlas,2 and Cheryl Willman3.- Paul Helman,1 [18] G. Holmes; A. Donkin and I.H. Witten Robert Veroff,1 Susan R. Atlas,2 and Cheryl (1994). «Weka: A machine learning Willman3 workbench».Proc Second Australia and New Zealand Conference on Intelligent [7] Jie Cheng1, Russell Greiner2.- Jie Information Systems, Brisbane, Australia. Cheng1, Russell Greiner2.- Learning Consultado el 25-06-2007. Bayesian Belief Network Classifiers: Algorithms and System [19] Weka, http://www.cs.waikato.ac.nz/ml/weka/ [20] Angel Kuri, Martha Ortiz, Lucía [8] Nir Friedman, Moises Goldszmidt- - .- Castellanos, Carlos Ponce, Christopher Building Classifiers using Bayesian Networks Gasca, Oscar Herrera.- Clasificación No Sesgada de Proteínas con Redes Neuronales [9] Carlos López de Castilla Vásquez.- y Computación Evolutiva CLASIFICADORES POR REDES BAYESIANAS [21]Pablo Ezequiel FELGAER.- OPTIMIZACIÓN [10] David A. Velasco Villanueva.- RREDES DE REDES BAYESIANAS BASADO EN TÉCNICAS BAYESIANAS DE APRENDIZAJE POR INDUCCIÓN [11] Robin hanson, John Stutz, Peter [22] Fausto Andrés Monreal, WEKA Cheeseman .- Bayesian Classification Theory [23] FRANCISCO GABRIEL REYES MATUS.- “ UNA HERRAMIENTA PARA LA PREDICCION DE [12] Constantino Malagón Luque.- RIESGOS EN PROYECTOS DE SOFTWARE Clasicadores bayesianos. El algoritmo Naïve USANDO MODELOS EN REDES BAYESIANAS” Bayes [24] David A. Velasco Villanueva.- Redes [13] Bayesian Networks en diagnóstico Bayesianas psiquiátrico o psicopatológico. Lic. Mariano [25] Jiakai Li, Gursel Serpen, Steven Selman, Acciardi. http://www.marianoacciardi. Matt Franchetti, Mike Riesen and Cynthia com.ar/textos_ia/BN1.pdf Schneider .- Bayes Net Classifiers for Prediction of 14] Redes Bayesianas en Minería de Datos. Renal Graft Status and Survival Period http://ccc.inaoep.mx/~emorales/Cursos/Nv oAprend/node68.html [26] Remco R. Bouckaert.- Bayesian Network Classfiers in Weka [15] Álvaro Marín Illera, Sistemas Expertos, Redes Bayesianas y sus aplicaciones. [27] Ramírez López, Leonardo.- Modelo de http://www.e- clasificación de arritmias mediante técnicas ghost.deusto.es/docs/2005/conferencias/Ba de aprendizaje de máquina. yes05.pdf [28] Roberto Portugal & Miguel A. Carrasco .- ENSAMBLE DE ALGORITMOS BAYESIANOS [16] Carmen Lacave – UCLM, Fco. Javier Díez CON ÁRBOLES DE DECISIÓN, UNA – UNED.- Elvira 0.11. Graphical User ALTERNATIVA DE CLASIFICACIÓN. Interface