2. Esta herramienta de software libre trabaja
sobre una plataforma Java, por lo cual requiere
el jre para funcionar correctamente.
Principales características o funcionalidades:
Gran aporte a la minería de datos ya que permite
analizar los datos fácilmente, mostrando de una
manera muy gráfica la correlación existente entre
ellos.
Algoritmos y árboles entre otras técnicas utilizadas
en inteligencia artificial para clasificación de datos.
3. En este caso se presenta un ejemplo de la utilidad de
Weka en el tema de árboles de clasificación, donde
dado un conjunto de datos de entrenamiento se podrá
predecir y asignar una clase específica a un nuevo
registro.
El entorno del problema es el siguiente:
Se debe predecir cuál es la medicina o fármaco ideal
para administrar a nuevos pacientes, cuyo historial
clínico presenta las siguientes variables:
4. Edad (Age)
Sexo (Sex)
Tensión Sanguínea (BP)
Nivel de colesterol (Cholesterol)
Nivel de sodio en la sangre (Na)
Nivel de potasio en la sangre (K)
Para los cuales se presentan cinco posibles medicinas: DrugA,
DrugB, DrugC, DrugX, DrugY
Una vez conocido el problema, en la herramienta haremos lo
siguiente:
Se escoge la opción Explorer en la primera ventana que
1.
aparece al abrir el programa.
Bajo la etiqueta Preprocess, hacer clic en el botón Open
2.
File… y escoger un archivo de tipo *.arff
5. Se visualiza una
3.
tabla con las
variables y sus
atributos
respectivos. Se
presenta además la
opción para
eliminar variables
antes de la
clasificación.
6. Nos ubicamos en la pestaña Classify y
4.
escogemos uno de los clasificadores
mostrados, en este caso se utiliza el algoritmo
J48
7. Se muestra un informe como resumen de la
5.
clasificación generada según los datos de
entrenamiento.
8. En la pestaña
Visualize se puede
observar una matriz
de correspondencia
entre variables, lo
cual nos permitirá
analizar la relación
de dependencia
existente entre ellas.
9. En este ejemplo se
observa a detalle la
relación entre la
edad de los
pacientes y la
medicina
administrada a
cada uno de ellos.
10. Finalmente se escoge la opción visualizar el
árbol desde la lista de resultados
11. Según los resultados mostrados gráficamente
en la figura anterior se puede analizar una
secuencia de reglas que permitirán decidir
rápidamente el fármaco a administrar a cada
paciente según el diagnóstico presentado.
La organización jerárquica de las variables
ayudan también a ahorrar tiempo con
preguntas innecesarias al paciente según los
resultados que vaya presentando por cada
variable.
12. UNIVERSIDAD TÉCNICA PARTICULAR
DE LOJA
Escuela de Ciencias de la Computación
Inteligencia Artificial Avanzada
María Gabriela Vivanco V.
mgvivanco@utpl.edu.ec