SlideShare una empresa de Scribd logo
1 de 21
Mineração de DadosBase Soybean Large Alunos:  Cassius Busemeyer Cristiane Luquetta
IB1- Histórico As sete pontes de Königsberg: Teoria dos grafos; Vizinho mais próximos entre outros; K-NN (vizinho mais próximo); IB1.
IB1 - Características Instance Based Learning; Pouco esforço computacional no treino; Compara-se ao J.48 (autores do algoritmo); Usa distância euclidiana para calcular similaridade.
Como funciona Compara exemplos do treino com 1 (um) exemplo da base e classifica-o escolhendo a classe da instância com maior grau de similaridade; Hãã: Pega o exemplo mais parecido do conjunto de treino.
IB1 - Algoritmo PARA CADA x pertencente aos dados de treino FAÇA 	1 PARA CADA y pertencente a base FAÇA Sim [y] = similaridade (x,y) 	2 ymax – alguns y pertencem a base com maximo sim[y] 	3 SE class(x) = class (ymax) ENTÃO classificação – correta SENÃO classificação – incorreta 	4 Classe – Classe U {x}
Deriva da Teoria dos Jogos de John Von Neumann (1926);  Albert Tucker cria o dilema do prisioneiro (1950);  John Nash mostra que existe equilíbrio entre jogos não-cooperativos (1951). Minimax - Histórico
Características
[object Object],Como funciona Hãã: cria todas as jogadas possíveis de um jogo até seu fim (ou até onde a máquina ou tempo permitir) e escolhe a melhor.
MiniMax - Algoritmo 	1. VERIFIQUE as próximas jogadas diretamente atingíveis a partir do tabuleiro corrente SE a altura máxima de busca não tiver sido alcançada; SENÃO RETORNE a estimativa (heurística) do tabuleiro corrente; 	2. ENTÃO caso uma se trate de posição de vitória, dê a ela a mais alta estimativa possível e retorne este valor; 	3. SENÃO considere todos os movimentos que o oponente possa fazer em seguida. RETORNE a pior jogada /*do oponente*/ contra a máquina.  ATIVE recursivamente a expansão de estados; 	4. ESCOLHA a jogada com a mais alta estimativa.
Voting Feature Intervals HISTÓRICO É comparado com métodos estatísticos, principalmente NBC (Naive Bayes Classifier); CARACTERÍSTICAS Algoritmo funciona de modos diferentes para valores numéricos e nominais;
Como funciona ,[object Object],Hãã: cada valor de atributo de uma instância vota numa classe e é eleita a mais votada.
Algoritmo LEIA a base de treino INÍCIO PARA CADA característica f PARA CADA classe c End_point = end_points[f] une-se com find_end_points (training Set, f,c); tipo (end_points[f]); SEf é linear  	Cada par de distintos pontos consecutivos em end_points[f] forma escala intervalar SENÃO /* é nominal */ 	Cada ponto distinto em end_points forma um ponto de intervalo   PARA CADA intervalo i na dimensão de atributos f PARA CADA Classe c 		Interval_class_count[f,i,c]= 0 			Count_instances(f,conjunto de treino); PARA CADA intervalo i nos atributos PARA CADA classe c 	Interval_class_vote[f,i,c]=interval_class_count[f,i,c]/class_count[c] 	Normalize interval_class_vote[f,i,c]; /*tal que somatório de intervalo_class_vote[f,i,c]=1 */ FIM.   Contagem de instâncias (f,conjunto de treino); INÍCIO PARA CADA instância no conjunto de treino SEef é conhecido I = encontre intervalos (f,ef) Ec= classe da instância e   SEi é um ponto de intervalo SEef= limite mais baixo de i Interval_class_count[f,i,ec]+=1 SENÃO /* é um range interval*/ SEef= limite mais baixo de i Interval_class_count[f,i-1,ec]+=0.5 						Interval_class_count[f,I,ec]+=0.5 SENÃO /* e entra no i*/ Interval_class_count[f,i,ec]+=1 FIM   Classificação do algoritmo INÍCIO PARA CADA classe c 		Vote[c]=0   PARA CADA atributo f PARA CADA classe c 			Feature_vote[f,c] = 0 SEef é um valor conhecido I= encontre intervalos (f,ef)   SEI é um ponto de intervalo SEef= limite mais baixo de i PARA CADA classe c 					Feature_vote[f,c] = intervals_class_vote[f,I,c] SENÃO /*É uma escala intervalar*/ PARA CADA classe c 		Feature_vote[f,c] = interval_class_vote[f,i-1,c] + interval_class_vote[f,I,c]/2 SENÃO  /*entra no intervalo i*/ PARA CADA classe c 				Feature_vote[f,c] =  interval_class_vote[f,I,c]   PARA CADA classe c Vote[c] = vote[c] + feature_vote[f,c];   RETORNE a classe c com maior vote[c] FIM
Base Soybean Base sobre doenças da soja. Originada de um trabalho Michalski e Chilausky; Repositório disponibiliza duas versões: 340 instâncias e 307 instâncias; Alguns autores dizem que Michalski e Chilausky não disponibilizaram os dados corretamente e não sabem como eles chegaram aos resultados divulgados; Outros autores dizem que a base disponibilizada não é a mesma do trabalho original.
Base- Soybean Large Variação dos tipos de doenças da soja.  Causador: Fungo (mais temidas); Vírus; Nematóides; Fitoplasma; Protozoários; Plantas parasitárias; Agentes variados (poluição, temperatura); Por região geográfica: Existem doenças particulares do Brasil, EUA. Etc...
KDD – Limpeza e transformação dos dados
KDD- Seleção dos algoritmos IB1; Comparado com J.48. MiniMax; V.F.I; Comparado c/ NaiveBayes.
Resultados Todos os resultados passaram de 75% na fase inicial (dito como suficiente – Witten e Frank, 2005).
Resultados
Considerações Finais Dificuldades: Entendimento da base; Pouca literatura ou literatura com informações divergentes sobre os algoritmos; Pesquisadores não responderam/etapa de validação; Próximos trabalhos: Melhor avaliação e comparação de resultados.
Obrigado!

Más contenido relacionado

Destacado (15)

Mic bh - data mining
Mic bh - data miningMic bh - data mining
Mic bh - data mining
 
Análise De Design De Murais
Análise De Design De MuraisAnálise De Design De Murais
Análise De Design De Murais
 
Mineração Livre de Dados
Mineração Livre de DadosMineração Livre de Dados
Mineração Livre de Dados
 
Data Mining
Data MiningData Mining
Data Mining
 
Data mining 1
Data mining 1Data mining 1
Data mining 1
 
Data Mining e Data Warehouse
Data Mining e Data WarehouseData Mining e Data Warehouse
Data Mining e Data Warehouse
 
Business Intelligence & Data Mining - Knowledge Discovery in Databases
Business Intelligence & Data Mining - Knowledge Discovery in DatabasesBusiness Intelligence & Data Mining - Knowledge Discovery in Databases
Business Intelligence & Data Mining - Knowledge Discovery in Databases
 
Mineração de dados
Mineração de dadosMineração de dados
Mineração de dados
 
KDD e Data Mining
KDD e Data MiningKDD e Data Mining
KDD e Data Mining
 
Descoberta de Conhecimento em Bancos de Dados e Mineração de Dados
Descoberta de Conhecimento em Bancos de Dados e Mineração de DadosDescoberta de Conhecimento em Bancos de Dados e Mineração de Dados
Descoberta de Conhecimento em Bancos de Dados e Mineração de Dados
 
Técnicas de data mining
Técnicas de data miningTécnicas de data mining
Técnicas de data mining
 
Apresentação data mining
Apresentação data miningApresentação data mining
Apresentação data mining
 
Data Mining
Data Mining Data Mining
Data Mining
 
Data warehouse & Data mining
Data warehouse & Data miningData warehouse & Data mining
Data warehouse & Data mining
 
Data warehouse & data mining
Data warehouse & data miningData warehouse & data mining
Data warehouse & data mining
 

Similar a Mineração de Dados na Base Soybean Large

Aprendizagem Automática
Aprendizagem AutomáticaAprendizagem Automática
Aprendizagem Automáticabutest
 
Aprendizagem Não-Supervisionada
Aprendizagem Não-SupervisionadaAprendizagem Não-Supervisionada
Aprendizagem Não-SupervisionadaLuís Nunes
 
Algoritmos de ordenação
Algoritmos de ordenaçãoAlgoritmos de ordenação
Algoritmos de ordenaçãoJonas Mendonça
 
Redes Bayesianas para Recuperação de Informação Estruturada
Redes Bayesianas para Recuperação de Informação EstruturadaRedes Bayesianas para Recuperação de Informação Estruturada
Redes Bayesianas para Recuperação de Informação EstruturadaAdolfo Neto
 

Similar a Mineração de Dados na Base Soybean Large (7)

Aprendizagem Automática
Aprendizagem AutomáticaAprendizagem Automática
Aprendizagem Automática
 
Linguagem R
Linguagem RLinguagem R
Linguagem R
 
Aprendizagem Não-Supervisionada
Aprendizagem Não-SupervisionadaAprendizagem Não-Supervisionada
Aprendizagem Não-Supervisionada
 
Algoritmos de ordenação
Algoritmos de ordenaçãoAlgoritmos de ordenação
Algoritmos de ordenação
 
Math
MathMath
Math
 
Aula5
Aula5Aula5
Aula5
 
Redes Bayesianas para Recuperação de Informação Estruturada
Redes Bayesianas para Recuperação de Informação EstruturadaRedes Bayesianas para Recuperação de Informação Estruturada
Redes Bayesianas para Recuperação de Informação Estruturada
 

Último

Aula - 2º Ano - Cultura e Sociedade - Conceitos-chave
Aula - 2º Ano - Cultura e Sociedade - Conceitos-chaveAula - 2º Ano - Cultura e Sociedade - Conceitos-chave
Aula - 2º Ano - Cultura e Sociedade - Conceitos-chaveaulasgege
 
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptxSlides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptxLuizHenriquedeAlmeid6
 
Regência Nominal e Verbal português .pdf
Regência Nominal e Verbal português .pdfRegência Nominal e Verbal português .pdf
Regência Nominal e Verbal português .pdfmirandadudu08
 
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdf
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdfBRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdf
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdfHenrique Pontes
 
Pedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptxPedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptxleandropereira983288
 
Slides Lição 4, CPAD, Como se Conduzir na Caminhada, 2Tr24.pptx
Slides Lição 4, CPAD, Como se Conduzir na Caminhada, 2Tr24.pptxSlides Lição 4, CPAD, Como se Conduzir na Caminhada, 2Tr24.pptx
Slides Lição 4, CPAD, Como se Conduzir na Caminhada, 2Tr24.pptxLuizHenriquedeAlmeid6
 
Guia completo da Previdênci a - Reforma .pdf
Guia completo da Previdênci a - Reforma .pdfGuia completo da Previdênci a - Reforma .pdf
Guia completo da Previdênci a - Reforma .pdfEyshilaKelly1
 
Habilidades Motoras Básicas e Específicas
Habilidades Motoras Básicas e EspecíficasHabilidades Motoras Básicas e Específicas
Habilidades Motoras Básicas e EspecíficasCassio Meira Jr.
 
Apostila da CONQUISTA_ para o 6ANO_LP_UNI1.pptx
Apostila da CONQUISTA_ para o 6ANO_LP_UNI1.pptxApostila da CONQUISTA_ para o 6ANO_LP_UNI1.pptx
Apostila da CONQUISTA_ para o 6ANO_LP_UNI1.pptxIsabelaRafael2
 
“Sobrou pra mim” - Conto de Ruth Rocha.pptx
“Sobrou pra mim” - Conto de Ruth Rocha.pptx“Sobrou pra mim” - Conto de Ruth Rocha.pptx
“Sobrou pra mim” - Conto de Ruth Rocha.pptxthaisamaral9365923
 
Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029Centro Jacques Delors
 
Lírica Camoniana- A mudança na lírica de Camões.pptx
Lírica Camoniana- A mudança na lírica de Camões.pptxLírica Camoniana- A mudança na lírica de Camões.pptx
Lírica Camoniana- A mudança na lírica de Camões.pptxfabiolalopesmartins1
 
A Arte de Escrever Poemas - Dia das Mães
A Arte de Escrever Poemas - Dia das MãesA Arte de Escrever Poemas - Dia das Mães
A Arte de Escrever Poemas - Dia das MãesMary Alvarenga
 
Prova uniasselvi tecnologias da Informação.pdf
Prova uniasselvi tecnologias da Informação.pdfProva uniasselvi tecnologias da Informação.pdf
Prova uniasselvi tecnologias da Informação.pdfArthurRomanof1
 
Bullying - Atividade com caça- palavras
Bullying   - Atividade com  caça- palavrasBullying   - Atividade com  caça- palavras
Bullying - Atividade com caça- palavrasMary Alvarenga
 
ATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptx
ATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptxATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptx
ATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptxOsnilReis1
 
02. Informática - Windows 10 apostila completa.pdf
02. Informática - Windows 10 apostila completa.pdf02. Informática - Windows 10 apostila completa.pdf
02. Informática - Windows 10 apostila completa.pdfJorge Andrade
 
activIDADES CUENTO lobo esta CUENTO CUARTO GRADO
activIDADES CUENTO  lobo esta  CUENTO CUARTO GRADOactivIDADES CUENTO  lobo esta  CUENTO CUARTO GRADO
activIDADES CUENTO lobo esta CUENTO CUARTO GRADOcarolinacespedes23
 

Último (20)

Aula - 2º Ano - Cultura e Sociedade - Conceitos-chave
Aula - 2º Ano - Cultura e Sociedade - Conceitos-chaveAula - 2º Ano - Cultura e Sociedade - Conceitos-chave
Aula - 2º Ano - Cultura e Sociedade - Conceitos-chave
 
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptxSlides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
 
Regência Nominal e Verbal português .pdf
Regência Nominal e Verbal português .pdfRegência Nominal e Verbal português .pdf
Regência Nominal e Verbal português .pdf
 
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdf
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdfBRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdf
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdf
 
Pedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptxPedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptx
 
Slides Lição 4, CPAD, Como se Conduzir na Caminhada, 2Tr24.pptx
Slides Lição 4, CPAD, Como se Conduzir na Caminhada, 2Tr24.pptxSlides Lição 4, CPAD, Como se Conduzir na Caminhada, 2Tr24.pptx
Slides Lição 4, CPAD, Como se Conduzir na Caminhada, 2Tr24.pptx
 
Em tempo de Quaresma .
Em tempo de Quaresma                            .Em tempo de Quaresma                            .
Em tempo de Quaresma .
 
Guia completo da Previdênci a - Reforma .pdf
Guia completo da Previdênci a - Reforma .pdfGuia completo da Previdênci a - Reforma .pdf
Guia completo da Previdênci a - Reforma .pdf
 
Habilidades Motoras Básicas e Específicas
Habilidades Motoras Básicas e EspecíficasHabilidades Motoras Básicas e Específicas
Habilidades Motoras Básicas e Específicas
 
Orientação Técnico-Pedagógica EMBcae Nº 001, de 16 de abril de 2024
Orientação Técnico-Pedagógica EMBcae Nº 001, de 16 de abril de 2024Orientação Técnico-Pedagógica EMBcae Nº 001, de 16 de abril de 2024
Orientação Técnico-Pedagógica EMBcae Nº 001, de 16 de abril de 2024
 
Apostila da CONQUISTA_ para o 6ANO_LP_UNI1.pptx
Apostila da CONQUISTA_ para o 6ANO_LP_UNI1.pptxApostila da CONQUISTA_ para o 6ANO_LP_UNI1.pptx
Apostila da CONQUISTA_ para o 6ANO_LP_UNI1.pptx
 
“Sobrou pra mim” - Conto de Ruth Rocha.pptx
“Sobrou pra mim” - Conto de Ruth Rocha.pptx“Sobrou pra mim” - Conto de Ruth Rocha.pptx
“Sobrou pra mim” - Conto de Ruth Rocha.pptx
 
Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029
 
Lírica Camoniana- A mudança na lírica de Camões.pptx
Lírica Camoniana- A mudança na lírica de Camões.pptxLírica Camoniana- A mudança na lírica de Camões.pptx
Lírica Camoniana- A mudança na lírica de Camões.pptx
 
A Arte de Escrever Poemas - Dia das Mães
A Arte de Escrever Poemas - Dia das MãesA Arte de Escrever Poemas - Dia das Mães
A Arte de Escrever Poemas - Dia das Mães
 
Prova uniasselvi tecnologias da Informação.pdf
Prova uniasselvi tecnologias da Informação.pdfProva uniasselvi tecnologias da Informação.pdf
Prova uniasselvi tecnologias da Informação.pdf
 
Bullying - Atividade com caça- palavras
Bullying   - Atividade com  caça- palavrasBullying   - Atividade com  caça- palavras
Bullying - Atividade com caça- palavras
 
ATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptx
ATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptxATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptx
ATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptx
 
02. Informática - Windows 10 apostila completa.pdf
02. Informática - Windows 10 apostila completa.pdf02. Informática - Windows 10 apostila completa.pdf
02. Informática - Windows 10 apostila completa.pdf
 
activIDADES CUENTO lobo esta CUENTO CUARTO GRADO
activIDADES CUENTO  lobo esta  CUENTO CUARTO GRADOactivIDADES CUENTO  lobo esta  CUENTO CUARTO GRADO
activIDADES CUENTO lobo esta CUENTO CUARTO GRADO
 

Mineração de Dados na Base Soybean Large

  • 1. Mineração de DadosBase Soybean Large Alunos: Cassius Busemeyer Cristiane Luquetta
  • 2. IB1- Histórico As sete pontes de Königsberg: Teoria dos grafos; Vizinho mais próximos entre outros; K-NN (vizinho mais próximo); IB1.
  • 3. IB1 - Características Instance Based Learning; Pouco esforço computacional no treino; Compara-se ao J.48 (autores do algoritmo); Usa distância euclidiana para calcular similaridade.
  • 4.
  • 5. Como funciona Compara exemplos do treino com 1 (um) exemplo da base e classifica-o escolhendo a classe da instância com maior grau de similaridade; Hãã: Pega o exemplo mais parecido do conjunto de treino.
  • 6. IB1 - Algoritmo PARA CADA x pertencente aos dados de treino FAÇA 1 PARA CADA y pertencente a base FAÇA Sim [y] = similaridade (x,y) 2 ymax – alguns y pertencem a base com maximo sim[y] 3 SE class(x) = class (ymax) ENTÃO classificação – correta SENÃO classificação – incorreta 4 Classe – Classe U {x}
  • 7. Deriva da Teoria dos Jogos de John Von Neumann (1926); Albert Tucker cria o dilema do prisioneiro (1950); John Nash mostra que existe equilíbrio entre jogos não-cooperativos (1951). Minimax - Histórico
  • 9.
  • 10. MiniMax - Algoritmo 1. VERIFIQUE as próximas jogadas diretamente atingíveis a partir do tabuleiro corrente SE a altura máxima de busca não tiver sido alcançada; SENÃO RETORNE a estimativa (heurística) do tabuleiro corrente; 2. ENTÃO caso uma se trate de posição de vitória, dê a ela a mais alta estimativa possível e retorne este valor; 3. SENÃO considere todos os movimentos que o oponente possa fazer em seguida. RETORNE a pior jogada /*do oponente*/ contra a máquina. ATIVE recursivamente a expansão de estados; 4. ESCOLHA a jogada com a mais alta estimativa.
  • 11. Voting Feature Intervals HISTÓRICO É comparado com métodos estatísticos, principalmente NBC (Naive Bayes Classifier); CARACTERÍSTICAS Algoritmo funciona de modos diferentes para valores numéricos e nominais;
  • 12.
  • 13. Algoritmo LEIA a base de treino INÍCIO PARA CADA característica f PARA CADA classe c End_point = end_points[f] une-se com find_end_points (training Set, f,c); tipo (end_points[f]); SEf é linear Cada par de distintos pontos consecutivos em end_points[f] forma escala intervalar SENÃO /* é nominal */ Cada ponto distinto em end_points forma um ponto de intervalo   PARA CADA intervalo i na dimensão de atributos f PARA CADA Classe c Interval_class_count[f,i,c]= 0 Count_instances(f,conjunto de treino); PARA CADA intervalo i nos atributos PARA CADA classe c Interval_class_vote[f,i,c]=interval_class_count[f,i,c]/class_count[c] Normalize interval_class_vote[f,i,c]; /*tal que somatório de intervalo_class_vote[f,i,c]=1 */ FIM.   Contagem de instâncias (f,conjunto de treino); INÍCIO PARA CADA instância no conjunto de treino SEef é conhecido I = encontre intervalos (f,ef) Ec= classe da instância e   SEi é um ponto de intervalo SEef= limite mais baixo de i Interval_class_count[f,i,ec]+=1 SENÃO /* é um range interval*/ SEef= limite mais baixo de i Interval_class_count[f,i-1,ec]+=0.5 Interval_class_count[f,I,ec]+=0.5 SENÃO /* e entra no i*/ Interval_class_count[f,i,ec]+=1 FIM   Classificação do algoritmo INÍCIO PARA CADA classe c Vote[c]=0   PARA CADA atributo f PARA CADA classe c Feature_vote[f,c] = 0 SEef é um valor conhecido I= encontre intervalos (f,ef)   SEI é um ponto de intervalo SEef= limite mais baixo de i PARA CADA classe c Feature_vote[f,c] = intervals_class_vote[f,I,c] SENÃO /*É uma escala intervalar*/ PARA CADA classe c Feature_vote[f,c] = interval_class_vote[f,i-1,c] + interval_class_vote[f,I,c]/2 SENÃO /*entra no intervalo i*/ PARA CADA classe c Feature_vote[f,c] = interval_class_vote[f,I,c]   PARA CADA classe c Vote[c] = vote[c] + feature_vote[f,c];   RETORNE a classe c com maior vote[c] FIM
  • 14. Base Soybean Base sobre doenças da soja. Originada de um trabalho Michalski e Chilausky; Repositório disponibiliza duas versões: 340 instâncias e 307 instâncias; Alguns autores dizem que Michalski e Chilausky não disponibilizaram os dados corretamente e não sabem como eles chegaram aos resultados divulgados; Outros autores dizem que a base disponibilizada não é a mesma do trabalho original.
  • 15. Base- Soybean Large Variação dos tipos de doenças da soja. Causador: Fungo (mais temidas); Vírus; Nematóides; Fitoplasma; Protozoários; Plantas parasitárias; Agentes variados (poluição, temperatura); Por região geográfica: Existem doenças particulares do Brasil, EUA. Etc...
  • 16. KDD – Limpeza e transformação dos dados
  • 17. KDD- Seleção dos algoritmos IB1; Comparado com J.48. MiniMax; V.F.I; Comparado c/ NaiveBayes.
  • 18. Resultados Todos os resultados passaram de 75% na fase inicial (dito como suficiente – Witten e Frank, 2005).
  • 20. Considerações Finais Dificuldades: Entendimento da base; Pouca literatura ou literatura com informações divergentes sobre os algoritmos; Pesquisadores não responderam/etapa de validação; Próximos trabalhos: Melhor avaliação e comparação de resultados.