SlideShare una empresa de Scribd logo
1 de 12
Weka (Pentaho Data
Mining).
Diana Esmeralda Alvarenga Mendoza. USIS014411.
Max Fuentes Paredes. SMIS109610.
Rosa Migdalia Mejía Pineda. USIS010911.
Carlos Mauricio Salgado Reyes. USIS049211
¿Qué es Weka?
 LA Weka (Gallirallus australis) es un ave endémica de Nueva Zelanda. Esta
Gallinácea en peligro de extinción es famosa por su curiosidad y agresividad.
De aspecto pardo y tamaño similar a una gallina las wekas se alimentan
fundamentalmente de insectos y frutos.
 Este ave da nombre a un conjunto de librerías JAVA para la extracción de
conocimientos desde bases de datos. Es un software ha sido desarrollado en la
universidad de Waikato (Nueva Zelanda) bajo licencia GPL lo cual ha
impulsado que sea una de las suites más utilizadas en el área en los últimos
años. Además Weka contiene las herramientas necesarias para realizar
transformaciones sobre los datos, tareas de clasificación, regresión,
clustering, asociación y visualización. Weka está diseñado como una
herramienta orientada a la extensibilidad por lo que una de las propiedades
más interesantes de este software, es su facilidad para añadir extensiones,
modificar métodos etc.
¿Qué significan sus siglas (Weka)?
 Waikato Environment for Knowledge Analysis (Waikato Entorno para el Análisis
del Conocimiento)
 1. Cabecera. Se define el nombre de la relación. Su formato es el siguiente:
@relation <nombre-de-la-relación>
Donde <nombre-de-la-relación> es de tipo String*. Si dicho nombre contiene
algún espacio será necesario expresarlo entrecomillado.
 2. Declaraciones de atributos. En esta sección se declaran los atributos que
compondrán nuestro archivo junto a su tipo. La sintaxis es la siguiente:
@attribute <nombre-del-atributo> <tipo>
Nativamente Weka trabaja con un formato denominado arff, acrónimo de
Atribute Relation File Format. Este formato está compuesto por una estructura
claramente diferenciada en tres partes:
Donde <nombre-del-atributo> es de tipo String teniendo las mismas restricciones que el caso
anterior. Weka acepta diversos tipos, estos son:
a) NUMERIC Expresa números reales*.
b) INTEGER Expresa números enteros.
c) DATE Expresa fechas, para ello este tipo debe ir precedido de una etiqueta de formato
entrecomillada.
 La etiqueta de formato está compuesta por caracteres separadores (guiones y/o espacios) y
unidades de tiempo:
dd Día.
MM Mes.
yyyy Año.
HH Horas.
mm Minutos.
ss Segundos.
 d) STRING Expresa cadenas de texto, con las restricciones del tipo String comentadas
anteriormente.
 e) ENUMERADO El identificador de este tipo consiste en expresar entre llaves y separados por
comas los posibles valores (caracteres o cadenas de caracteres) que puede tomar el atributo.
Por ejemplo, si tenemos un atributo que indica el tiempo podría definirse:
@attribute tiempo {soleado,lluvioso,nublado}
 3. Sección de datos. Declaramos los datos que componen la relación
separando entre comas los atributos y con saltos de línea las relaciones.
@data
4,3.2
Aunque éste es el modo “completo" es posible definir los datos de una forma
abreviada (sparse data). Si tenemos una muestra en la que hay muchos datos
que sean 0 podemos expresar los datos prescindiendo de los elementos que
son nulos, rodeando cada una de las filas entre llaves y situando delante de
cada uno de los datos el número de atributo**.
 Un ejemplo de esto es el siguiente
@data
{1 4, 3 3}
En este caso hemos prescindido de los atributos 0 y 2 (como mínimo) y
asignamos al atributo
1 el valor 4 y al atributo 3 el valor 3.
VENTAJAS.
 Extensa colección de algoritmos de Máquinas de conocimiento.
 Nos permite ubicar patrones de comportamiento de la información a procesar
de tal manera que es de gran ayuda en la toma de decisiones.
 Está disponible libremente bajo la licencia pública general de GNU.
 Es muy portable porque está completamente implementado en Java y puede
correr en casi cualquier plataforma.
 Contiene una extensa colección de técnicas para pre-procesamiento de datos
y modelado.
DESVENTAJAS.
 Existe poca documentación sobre el uso de Weka dirigida al usuario.
 Un área importante que actualmente no cubren los algoritmos incluidos en
Weka es el modelado de secuencia.
Instalación.
 Descargar la versión de Weka; en este caso es la weka-3-7-12jre-x64
Sitio de descarga.
 http://community.pentaho.com/projects/data-mining/
Desarrolladores.
 Por la universidad de Waikato (Nueva Zelanda)

Más contenido relacionado

La actualidad más candente

Tarea de la unidad 7
Tarea de la unidad 7Tarea de la unidad 7
Tarea de la unidad 7Ramon Carenzo
 
Estructura de Datos -Unidad III: Estructuras Lineales
Estructura de Datos -Unidad III: Estructuras LinealesEstructura de Datos -Unidad III: Estructuras Lineales
Estructura de Datos -Unidad III: Estructuras LinealesJosé Antonio Sandoval Acosta
 
Diccionario de datos
Diccionario de datosDiccionario de datos
Diccionario de datosJorge Garcia
 
Manual NeuroSolutions
Manual NeuroSolutionsManual NeuroSolutions
Manual NeuroSolutionsESCOM
 
Trabajo de diapositivas sql
Trabajo de diapositivas sqlTrabajo de diapositivas sql
Trabajo de diapositivas sqlAndreita Beltran
 
Implementacion informatica
Implementacion informaticaImplementacion informatica
Implementacion informaticaLuis Stifler
 
1.3 uso de tipos de datos abstractos
1.3 uso de tipos de datos abstractos1.3 uso de tipos de datos abstractos
1.3 uso de tipos de datos abstractoserwin_alexander
 
Base de datos dinamicas
Base de datos dinamicasBase de datos dinamicas
Base de datos dinamicasel_rosales
 
Desarrollo android almacenamiento de datos
Desarrollo android    almacenamiento de datosDesarrollo android    almacenamiento de datos
Desarrollo android almacenamiento de datosFernando Cejas
 
Unidad DidáCtica Iv DiseñO De Bases De Datos Relacionales
Unidad DidáCtica Iv DiseñO De Bases De Datos RelacionalesUnidad DidáCtica Iv DiseñO De Bases De Datos Relacionales
Unidad DidáCtica Iv DiseñO De Bases De Datos RelacionalesConfesorAD
 
Arquitectura N-Capas y ADo.NET
Arquitectura N-Capas y ADo.NETArquitectura N-Capas y ADo.NET
Arquitectura N-Capas y ADo.NETRoberto Taborda
 
Estructura de datos power point
Estructura de datos power pointEstructura de datos power point
Estructura de datos power pointunachi
 

La actualidad más candente (20)

S0intro
S0introS0intro
S0intro
 
JAVA CON BASE DE DATOS
JAVA CON BASE DE DATOSJAVA CON BASE DE DATOS
JAVA CON BASE DE DATOS
 
Tarea de la unidad 7
Tarea de la unidad 7Tarea de la unidad 7
Tarea de la unidad 7
 
Estructura de Datos -Unidad III: Estructuras Lineales
Estructura de Datos -Unidad III: Estructuras LinealesEstructura de Datos -Unidad III: Estructuras Lineales
Estructura de Datos -Unidad III: Estructuras Lineales
 
Diccionario de datos
Diccionario de datosDiccionario de datos
Diccionario de datos
 
Base de Datos Orientada a Objetos
Base de Datos Orientada a ObjetosBase de Datos Orientada a Objetos
Base de Datos Orientada a Objetos
 
Manual NeuroSolutions
Manual NeuroSolutionsManual NeuroSolutions
Manual NeuroSolutions
 
Trabajo de diapositivas sql
Trabajo de diapositivas sqlTrabajo de diapositivas sql
Trabajo de diapositivas sql
 
Implementacion informatica
Implementacion informaticaImplementacion informatica
Implementacion informatica
 
Estructura de Datos
Estructura de DatosEstructura de Datos
Estructura de Datos
 
Resulset
Resulset Resulset
Resulset
 
1.3 uso de tipos de datos abstractos
1.3 uso de tipos de datos abstractos1.3 uso de tipos de datos abstractos
1.3 uso de tipos de datos abstractos
 
Base de datos dinamicas
Base de datos dinamicasBase de datos dinamicas
Base de datos dinamicas
 
Ado.net
Ado.netAdo.net
Ado.net
 
Java con base de datos
Java con base de datosJava con base de datos
Java con base de datos
 
Modelo Dinamico
Modelo DinamicoModelo Dinamico
Modelo Dinamico
 
Desarrollo android almacenamiento de datos
Desarrollo android    almacenamiento de datosDesarrollo android    almacenamiento de datos
Desarrollo android almacenamiento de datos
 
Unidad DidáCtica Iv DiseñO De Bases De Datos Relacionales
Unidad DidáCtica Iv DiseñO De Bases De Datos RelacionalesUnidad DidáCtica Iv DiseñO De Bases De Datos Relacionales
Unidad DidáCtica Iv DiseñO De Bases De Datos Relacionales
 
Arquitectura N-Capas y ADo.NET
Arquitectura N-Capas y ADo.NETArquitectura N-Capas y ADo.NET
Arquitectura N-Capas y ADo.NET
 
Estructura de datos power point
Estructura de datos power pointEstructura de datos power point
Estructura de datos power point
 

Destacado

Ejemplo de Aplicaciones en Weka
Ejemplo de Aplicaciones en WekaEjemplo de Aplicaciones en Weka
Ejemplo de Aplicaciones en WekaRaquel Solano
 
Minería de datos con WEKA para el diagnóstico preventivo de cáncer
Minería de datos con WEKA para el diagnóstico preventivo de cáncerMinería de datos con WEKA para el diagnóstico preventivo de cáncer
Minería de datos con WEKA para el diagnóstico preventivo de cáncerPablo Antonio Alvarado Ruiz
 
Palermo Digital DC - Tip Nº 0
Palermo Digital DC - Tip Nº 0Palermo Digital DC - Tip Nº 0
Palermo Digital DC - Tip Nº 0Nicolás UP
 
Pinaristas,constructores de paz
Pinaristas,constructores de pazPinaristas,constructores de paz
Pinaristas,constructores de pazkellylaurens
 
Mendoza miery teran_presentacionfinal
Mendoza miery teran_presentacionfinalMendoza miery teran_presentacionfinal
Mendoza miery teran_presentacionfinalgabymyt
 
Computadoras
ComputadorasComputadoras
ComputadorasMerTello
 
Jornada Bibarnabloc 2012
Jornada Bibarnabloc 2012Jornada Bibarnabloc 2012
Jornada Bibarnabloc 2012bibarnabloc
 
Segunda novela la caida de la noche parsial2
Segunda novela la caida de la noche parsial2Segunda novela la caida de la noche parsial2
Segunda novela la caida de la noche parsial2Alan Misael Tovar Romero
 
Capsula 13 oct
Capsula 13 octCapsula 13 oct
Capsula 13 octCUCEA
 
Universidad nacional2003
Universidad nacional2003Universidad nacional2003
Universidad nacional2003patria_mia
 
Cta1 programacion anual
Cta1 programacion anualCta1 programacion anual
Cta1 programacion anualEdgar Sanchez
 

Destacado (20)

Tutorial weka
Tutorial wekaTutorial weka
Tutorial weka
 
Ejemplo de Aplicaciones en Weka
Ejemplo de Aplicaciones en WekaEjemplo de Aplicaciones en Weka
Ejemplo de Aplicaciones en Weka
 
Minería de datos con WEKA para el diagnóstico preventivo de cáncer
Minería de datos con WEKA para el diagnóstico preventivo de cáncerMinería de datos con WEKA para el diagnóstico preventivo de cáncer
Minería de datos con WEKA para el diagnóstico preventivo de cáncer
 
Actividad N 08
Actividad N 08Actividad N 08
Actividad N 08
 
Dichosos los tolerantes
Dichosos los tolerantesDichosos los tolerantes
Dichosos los tolerantes
 
Palermo Digital DC - Tip Nº 0
Palermo Digital DC - Tip Nº 0Palermo Digital DC - Tip Nº 0
Palermo Digital DC - Tip Nº 0
 
Loe
LoeLoe
Loe
 
CARTA A MIS COMPAÑEROS Y COMPAÑERAS
CARTA A MIS COMPAÑEROS Y COMPAÑERASCARTA A MIS COMPAÑEROS Y COMPAÑERAS
CARTA A MIS COMPAÑEROS Y COMPAÑERAS
 
Pinaristas,constructores de paz
Pinaristas,constructores de pazPinaristas,constructores de paz
Pinaristas,constructores de paz
 
Mendoza miery teran_presentacionfinal
Mendoza miery teran_presentacionfinalMendoza miery teran_presentacionfinal
Mendoza miery teran_presentacionfinal
 
Computadoras
ComputadorasComputadoras
Computadoras
 
Revista escolar santillana
Revista escolar santillanaRevista escolar santillana
Revista escolar santillana
 
Manual word 2003
Manual word 2003Manual word 2003
Manual word 2003
 
Jornada Bibarnabloc 2012
Jornada Bibarnabloc 2012Jornada Bibarnabloc 2012
Jornada Bibarnabloc 2012
 
Segunda novela la caida de la noche parsial2
Segunda novela la caida de la noche parsial2Segunda novela la caida de la noche parsial2
Segunda novela la caida de la noche parsial2
 
Capsula 13 oct
Capsula 13 octCapsula 13 oct
Capsula 13 oct
 
Universidad nacional2003
Universidad nacional2003Universidad nacional2003
Universidad nacional2003
 
Cta1 programacion anual
Cta1 programacion anualCta1 programacion anual
Cta1 programacion anual
 
Emprendimiento y liderazgo_martin_mejia (1)
Emprendimiento y liderazgo_martin_mejia (1)Emprendimiento y liderazgo_martin_mejia (1)
Emprendimiento y liderazgo_martin_mejia (1)
 
Reportaje
ReportajeReportaje
Reportaje
 

Similar a Weka (pentaho data mining)

Similar a Weka (pentaho data mining) (20)

Weka
WekaWeka
Weka
 
Weka
WekaWeka
Weka
 
Capitulo 27 (XML: Lenguaje de mercado extendible) y Capítulo 28 (Conceptos de...
Capitulo 27 (XML: Lenguaje de mercado extendible) y Capítulo 28 (Conceptos de...Capitulo 27 (XML: Lenguaje de mercado extendible) y Capítulo 28 (Conceptos de...
Capitulo 27 (XML: Lenguaje de mercado extendible) y Capítulo 28 (Conceptos de...
 
Base de datos objeto
Base de datos objetoBase de datos objeto
Base de datos objeto
 
Trabajo base de datos
Trabajo base de datosTrabajo base de datos
Trabajo base de datos
 
Informatica
InformaticaInformatica
Informatica
 
Omar unidad 07 base de datos
Omar unidad 07 base de datosOmar unidad 07 base de datos
Omar unidad 07 base de datos
 
Trabajo de famas 2011
Trabajo de famas 2011Trabajo de famas 2011
Trabajo de famas 2011
 
Trabajo de famas 2011
Trabajo de famas 2011Trabajo de famas 2011
Trabajo de famas 2011
 
Base de datos
Base de datosBase de datos
Base de datos
 
Informe Poo
Informe PooInforme Poo
Informe Poo
 
Base De Datos
Base De DatosBase De Datos
Base De Datos
 
Ado net
Ado netAdo net
Ado net
 
Componentes y Librerías - Tópicos avanzados de programación.
Componentes y Librerías - Tópicos avanzados de programación.Componentes y Librerías - Tópicos avanzados de programación.
Componentes y Librerías - Tópicos avanzados de programación.
 
Diapositiva estructura de datos unidad 1
Diapositiva estructura de datos unidad 1Diapositiva estructura de datos unidad 1
Diapositiva estructura de datos unidad 1
 
Diccionario de datos Unefa
Diccionario de datos UnefaDiccionario de datos Unefa
Diccionario de datos Unefa
 
Oracle database
Oracle databaseOracle database
Oracle database
 
ESTRUCTURA DE DATOS.ppt
ESTRUCTURA DE DATOS.pptESTRUCTURA DE DATOS.ppt
ESTRUCTURA DE DATOS.ppt
 
ESTRUCTURA DE DATOS.ppt
ESTRUCTURA DE DATOS.pptESTRUCTURA DE DATOS.ppt
ESTRUCTURA DE DATOS.ppt
 
Diccionario de base de datos.
Diccionario de base de datos.Diccionario de base de datos.
Diccionario de base de datos.
 

Último

GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdfGUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdfPaolaRopero2
 
plande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdfplande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdfenelcielosiempre
 
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSTEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSjlorentemartos
 
Éteres. Química Orgánica. Propiedades y reacciones
Éteres. Química Orgánica. Propiedades y reaccionesÉteres. Química Orgánica. Propiedades y reacciones
Éteres. Química Orgánica. Propiedades y reaccionesLauraColom3
 
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptxTECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptxKarlaMassielMartinez
 
Ley 21.545 - Circular Nº 586.pdf circular
Ley 21.545 - Circular Nº 586.pdf circularLey 21.545 - Circular Nº 586.pdf circular
Ley 21.545 - Circular Nº 586.pdf circularMooPandrea
 
CLASE - La visión y misión organizacionales.pdf
CLASE - La visión y misión organizacionales.pdfCLASE - La visión y misión organizacionales.pdf
CLASE - La visión y misión organizacionales.pdfJonathanCovena1
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...JonathanCovena1
 
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VSOCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VSYadi Campos
 
PLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxPLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxlupitavic
 
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...JAVIER SOLIS NOYOLA
 
Dinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dDinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dstEphaniiie
 
INSTRUCCION PREPARATORIA DE TIRO .pptx
INSTRUCCION PREPARATORIA DE TIRO   .pptxINSTRUCCION PREPARATORIA DE TIRO   .pptx
INSTRUCCION PREPARATORIA DE TIRO .pptxdeimerhdz21
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaDecaunlz
 
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxSEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxYadi Campos
 
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdfCurso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdfFrancisco158360
 
La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.amayarogel
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfAngélica Soledad Vega Ramírez
 
origen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioorigen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioELIASAURELIOCHAVEZCA1
 

Último (20)

GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdfGUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
 
plande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdfplande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdf
 
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSTEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
 
Éteres. Química Orgánica. Propiedades y reacciones
Éteres. Química Orgánica. Propiedades y reaccionesÉteres. Química Orgánica. Propiedades y reacciones
Éteres. Química Orgánica. Propiedades y reacciones
 
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptxTECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
 
Ley 21.545 - Circular Nº 586.pdf circular
Ley 21.545 - Circular Nº 586.pdf circularLey 21.545 - Circular Nº 586.pdf circular
Ley 21.545 - Circular Nº 586.pdf circular
 
CLASE - La visión y misión organizacionales.pdf
CLASE - La visión y misión organizacionales.pdfCLASE - La visión y misión organizacionales.pdf
CLASE - La visión y misión organizacionales.pdf
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...
 
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VSOCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
 
PLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxPLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docx
 
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
 
Dinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dDinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes d
 
INSTRUCCION PREPARATORIA DE TIRO .pptx
INSTRUCCION PREPARATORIA DE TIRO   .pptxINSTRUCCION PREPARATORIA DE TIRO   .pptx
INSTRUCCION PREPARATORIA DE TIRO .pptx
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativa
 
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxSEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
 
Presentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza MultigradoPresentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza Multigrado
 
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdfCurso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
 
La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
 
origen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioorigen y desarrollo del ensayo literario
origen y desarrollo del ensayo literario
 

Weka (pentaho data mining)

  • 1. Weka (Pentaho Data Mining). Diana Esmeralda Alvarenga Mendoza. USIS014411. Max Fuentes Paredes. SMIS109610. Rosa Migdalia Mejía Pineda. USIS010911. Carlos Mauricio Salgado Reyes. USIS049211
  • 2. ¿Qué es Weka?  LA Weka (Gallirallus australis) es un ave endémica de Nueva Zelanda. Esta Gallinácea en peligro de extinción es famosa por su curiosidad y agresividad. De aspecto pardo y tamaño similar a una gallina las wekas se alimentan fundamentalmente de insectos y frutos.  Este ave da nombre a un conjunto de librerías JAVA para la extracción de conocimientos desde bases de datos. Es un software ha sido desarrollado en la universidad de Waikato (Nueva Zelanda) bajo licencia GPL lo cual ha impulsado que sea una de las suites más utilizadas en el área en los últimos años. Además Weka contiene las herramientas necesarias para realizar transformaciones sobre los datos, tareas de clasificación, regresión, clustering, asociación y visualización. Weka está diseñado como una herramienta orientada a la extensibilidad por lo que una de las propiedades más interesantes de este software, es su facilidad para añadir extensiones, modificar métodos etc.
  • 3. ¿Qué significan sus siglas (Weka)?  Waikato Environment for Knowledge Analysis (Waikato Entorno para el Análisis del Conocimiento)
  • 4.  1. Cabecera. Se define el nombre de la relación. Su formato es el siguiente: @relation <nombre-de-la-relación> Donde <nombre-de-la-relación> es de tipo String*. Si dicho nombre contiene algún espacio será necesario expresarlo entrecomillado.  2. Declaraciones de atributos. En esta sección se declaran los atributos que compondrán nuestro archivo junto a su tipo. La sintaxis es la siguiente: @attribute <nombre-del-atributo> <tipo> Nativamente Weka trabaja con un formato denominado arff, acrónimo de Atribute Relation File Format. Este formato está compuesto por una estructura claramente diferenciada en tres partes:
  • 5. Donde <nombre-del-atributo> es de tipo String teniendo las mismas restricciones que el caso anterior. Weka acepta diversos tipos, estos son: a) NUMERIC Expresa números reales*. b) INTEGER Expresa números enteros. c) DATE Expresa fechas, para ello este tipo debe ir precedido de una etiqueta de formato entrecomillada.  La etiqueta de formato está compuesta por caracteres separadores (guiones y/o espacios) y unidades de tiempo: dd Día. MM Mes. yyyy Año. HH Horas. mm Minutos. ss Segundos.  d) STRING Expresa cadenas de texto, con las restricciones del tipo String comentadas anteriormente.  e) ENUMERADO El identificador de este tipo consiste en expresar entre llaves y separados por comas los posibles valores (caracteres o cadenas de caracteres) que puede tomar el atributo. Por ejemplo, si tenemos un atributo que indica el tiempo podría definirse: @attribute tiempo {soleado,lluvioso,nublado}
  • 6.  3. Sección de datos. Declaramos los datos que componen la relación separando entre comas los atributos y con saltos de línea las relaciones. @data 4,3.2 Aunque éste es el modo “completo" es posible definir los datos de una forma abreviada (sparse data). Si tenemos una muestra en la que hay muchos datos que sean 0 podemos expresar los datos prescindiendo de los elementos que son nulos, rodeando cada una de las filas entre llaves y situando delante de cada uno de los datos el número de atributo**.  Un ejemplo de esto es el siguiente @data {1 4, 3 3} En este caso hemos prescindido de los atributos 0 y 2 (como mínimo) y asignamos al atributo 1 el valor 4 y al atributo 3 el valor 3.
  • 7. VENTAJAS.  Extensa colección de algoritmos de Máquinas de conocimiento.  Nos permite ubicar patrones de comportamiento de la información a procesar de tal manera que es de gran ayuda en la toma de decisiones.  Está disponible libremente bajo la licencia pública general de GNU.  Es muy portable porque está completamente implementado en Java y puede correr en casi cualquier plataforma.  Contiene una extensa colección de técnicas para pre-procesamiento de datos y modelado.
  • 8. DESVENTAJAS.  Existe poca documentación sobre el uso de Weka dirigida al usuario.  Un área importante que actualmente no cubren los algoritmos incluidos en Weka es el modelado de secuencia.
  • 9. Instalación.  Descargar la versión de Weka; en este caso es la weka-3-7-12jre-x64
  • 10.
  • 11. Sitio de descarga.  http://community.pentaho.com/projects/data-mining/
  • 12. Desarrolladores.  Por la universidad de Waikato (Nueva Zelanda)