SlideShare uma empresa Scribd logo
1 de 64
Algoritmo ID3 e C.45 no Processo de Mineração de Dados Gilcimar Hoehstein
Data Mining ,[object Object],[object Object]
Descoberta de Conhecimento ,[object Object],[object Object]
Aprendizado de Máquina ,[object Object],[object Object]
Processo Indutivo ,[object Object],[object Object]
Inferência Indutiva ,[object Object],[object Object]
Hierarquia do Aprendizado Indutivo ,[object Object],[object Object]
Hierarquia do Aprendizado Indutivo ,[object Object]
Classificação  ,[object Object]
Classificação e Regressão ,[object Object],[object Object]
Outros algoritmos de Classificação e Regressão ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Árvore de Decisão ,[object Object],[object Object],[object Object]
Árvore de Decisão ,[object Object]
Atributo, valor do atributo e classes ,[object Object]
Exemplo ,[object Object],[object Object],[object Object]
Regras if-then ,[object Object],[object Object],[object Object]
Exemplo – árvore de decisão para regras de classificação 1.     Se    ( Escolaridade  =  “Graduação” )   -    Rico  =  “Não” 2.     Se    ( Escolaridade  =  “Doutorado” )   -    Rico  =  “Sim” 3.     Se    ( Escolaridade  =  “Mestrado” ) &    ( Idade  =  “>30” )   - Rico  =  “Sim” ) 4.     Se    ( Escolaridade  =  “Mestrado” ) &    ( Idade  =  “<=30” ) -  Rico  =  “Não” )
Vantagem das árvores de decisão ,[object Object]
Vantagem das árvores de decisão ,[object Object]
O algoritmo ID3 ,[object Object],[object Object],[object Object]
Portugol do ID3
Desvantagem do ID3 ,[object Object],[object Object]
Desvantagem do ID3 ,[object Object]
Transformando valores contínuos de atributos em valores discretos ,[object Object],[object Object],[object Object]
Transformação de atributos contínuos em discretos ,[object Object],[object Object],[object Object],Temperatura Frio Quente normal Se t < 16,66 Se t > 33,34 Se  16,67 < t  < 33,34
O algoritmo ID3 ,[object Object]
Dois Tipos de entropia ,[object Object],Jogo Sim Não 9 5 Prob = 9/14 5/14 - (9/14)*log(9/14;2)  + - (5/14)*log(5/14;2) Entropia dos dados (S1) = 0,0940
Exemplo Prático Precisa saber se é possível jogar tênis com Sol, frio, alta, forte. ????
Entropia dos dados da amostra Entropia dos Dados (S1) =-0,64* LOG(0,64;2)- 0,36*LOG(0,36;2) =  0,940 Obs: se a entropia estiver fora do intervalo [0,1],  alguma coisa no calculo está errado
O conjunto de dados é dividido sobre os valores dos atributos A entropia de cada valor é calculado. Então, ele é adicionado proporcionalmente, para obter a entropia total do atributo. =(5/14)*entropia do sol) + (4/14* entropia do encoberto) + (5/14) * entropia da chuva) =  0,663
Ganho de informação ,[object Object],[object Object],[object Object],[object Object]
[object Object]
Ganho de informação do Atributo Temperatura Entropia de Temperatura =(4/14)*entropia de quente) + (6/14* entropia de agradável) + (4/14) * entropia de frio) = 0,768 Ganho (S, Temperatura) = 0,940 – 0,768 =  0,172
Ganho de informação do Atributo Umidade Entropia de Umidade =(7/14)*entropia de normal)  + (7/14* alta) = 0,788 Ganho (S, Umidade) = 0,940 – 0,788 =  0,152
Ganho de informação do Atributo Vento Entropia de Vento =(6/14)*entropia de forte) + (8/14* entropia de fraco)= 0,906 Ganho (S1, Temperatura) = 0,940 – 0,906 =  0,035
Escolha do atributo com maior Ganho de informação para ser o nó raiz Encoberto Aparência Sol ??? SIM Chuvoso ???
Selecionando apenas as linhas com o valor sol para aparência ,[object Object],[object Object]
Escolha do melhor atributo ,[object Object],[object Object],[object Object],[object Object]
Escolha do atributo com maior Ganho de informação para ser o nó filho de Sol Escolha do Atributo com Maior Ganho Aparência ??? SIM Chuvoso Umidade NÃO Alta Encoberto Sol SIM Normal
Calculando nó que descende chuvoso ,[object Object]
Calculo da Entropia dos Dados ,[object Object],[object Object],[object Object],[object Object]
Entropia dos atributos em relação ao atributo-classe ,[object Object]
Entropia dos atributos em relação ao atributo-classe ,[object Object]
Entropia dos atributos em relação ao atributo-classe ,[object Object]
Selecione o atributo com maior ganho de informação ,[object Object],[object Object]
Árvore de Decisão final ,[object Object],É possível jogar tênis com Sol, frio, alta, forte. ????
Conclusão do id3 ,[object Object]
Algoritmo C.45 ,[object Object],[object Object],[object Object]
Vantagem do C.45 ,[object Object]
Razão de Ganho do C.45 ,[object Object],[object Object]
Razão de ganho ,[object Object]
Métodos de Poda ,[object Object],[object Object]
Pós-Poda ,[object Object]
Poda baseada em Erro (Error based pruning) ,[object Object],[object Object],[object Object]
Exemplo – Poda baseada em Erro
Métodos de Poda ,[object Object],[object Object]
O Weka ,[object Object]
Arquivo arff
Demonstração no Weka ,[object Object],[object Object],[object Object],[object Object],[object Object]
Resultado
Tela de resultados ,[object Object]
Escolhendo j48 ,[object Object]
Exercício ,[object Object],[object Object]
Trem Custo das Viagens Gênero Carro Trem Barato Caro padrão Ônibus Feminino Masculino Transporte 0 1 Ônibus

Mais conteúdo relacionado

Mais procurados

Java orientação a objetos (associacao, composicao, agregacao)
Java   orientação a objetos (associacao, composicao, agregacao)Java   orientação a objetos (associacao, composicao, agregacao)
Java orientação a objetos (associacao, composicao, agregacao)
Armando Daniel
 
Algoritmos e lp parte3-pseudocódigo
Algoritmos e lp parte3-pseudocódigoAlgoritmos e lp parte3-pseudocódigo
Algoritmos e lp parte3-pseudocódigo
Mauro Pereira
 
População e amostragem
População e amostragemPopulação e amostragem
População e amostragem
UERGS
 
Programando em python interfaces graficas com tk
Programando em python   interfaces graficas com tkProgramando em python   interfaces graficas com tk
Programando em python interfaces graficas com tk
samuelthiago
 

Mais procurados (20)

Introdução à analise e complexidade de algoritmos
Introdução à analise e complexidade de algoritmosIntrodução à analise e complexidade de algoritmos
Introdução à analise e complexidade de algoritmos
 
Inteligência Artificial - Busca com informação
Inteligência Artificial - Busca com informaçãoInteligência Artificial - Busca com informação
Inteligência Artificial - Busca com informação
 
Gesfin 04 - sistemas de amortização
Gesfin   04 - sistemas de amortizaçãoGesfin   04 - sistemas de amortização
Gesfin 04 - sistemas de amortização
 
Java orientação a objetos (associacao, composicao, agregacao)
Java   orientação a objetos (associacao, composicao, agregacao)Java   orientação a objetos (associacao, composicao, agregacao)
Java orientação a objetos (associacao, composicao, agregacao)
 
Introdução às Redes Neurais - Parte 1/2
Introdução às Redes Neurais - Parte 1/2Introdução às Redes Neurais - Parte 1/2
Introdução às Redes Neurais - Parte 1/2
 
Conceitos Básicos de Estatística I
Conceitos Básicos de Estatística IConceitos Básicos de Estatística I
Conceitos Básicos de Estatística I
 
Programação Orientada a Objetos
Programação Orientada a ObjetosProgramação Orientada a Objetos
Programação Orientada a Objetos
 
Estruturação de Problemas de Decisão
Estruturação de Problemas de DecisãoEstruturação de Problemas de Decisão
Estruturação de Problemas de Decisão
 
Reinforcement Learning 6. Temporal Difference Learning
Reinforcement Learning 6. Temporal Difference LearningReinforcement Learning 6. Temporal Difference Learning
Reinforcement Learning 6. Temporal Difference Learning
 
Algoritmos e lp parte3-pseudocódigo
Algoritmos e lp parte3-pseudocódigoAlgoritmos e lp parte3-pseudocódigo
Algoritmos e lp parte3-pseudocódigo
 
Programação orientada a objetos
Programação orientada a objetosProgramação orientada a objetos
Programação orientada a objetos
 
População e amostragem
População e amostragemPopulação e amostragem
População e amostragem
 
Analise Algoritmos
Analise AlgoritmosAnalise Algoritmos
Analise Algoritmos
 
Programando em python interfaces graficas com tk
Programando em python   interfaces graficas com tkProgramando em python   interfaces graficas com tk
Programando em python interfaces graficas com tk
 
Pesquisa operacional 1
Pesquisa operacional 1Pesquisa operacional 1
Pesquisa operacional 1
 
GP4US - Aula 2 - Programação Linear
GP4US - Aula 2 - Programação LinearGP4US - Aula 2 - Programação Linear
GP4US - Aula 2 - Programação Linear
 
Proximal Policy Optimization
Proximal Policy OptimizationProximal Policy Optimization
Proximal Policy Optimization
 
Análise de Algoritmos - Análise Assintótica
Análise de Algoritmos - Análise AssintóticaAnálise de Algoritmos - Análise Assintótica
Análise de Algoritmos - Análise Assintótica
 
Apostila matematica financeira_216_questoes (1)
Apostila matematica financeira_216_questoes (1)Apostila matematica financeira_216_questoes (1)
Apostila matematica financeira_216_questoes (1)
 
As vantagens e desvantagens da aplicação de padrões de projeto
As vantagens e desvantagens da aplicação de padrões de projetoAs vantagens e desvantagens da aplicação de padrões de projeto
As vantagens e desvantagens da aplicação de padrões de projeto
 

Destaque

Lista 1 - aprendizagem de máquina-
Lista 1 - aprendizagem de máquina-Lista 1 - aprendizagem de máquina-
Lista 1 - aprendizagem de máquina-
Weslley Lioba Caldas
 
Classficação de Texto e Naive Bayes
Classficação de Texto e Naive BayesClassficação de Texto e Naive Bayes
Classficação de Texto e Naive Bayes
Alexandre Duarte
 
Lista de exercicios algoritmos resolvida-
Lista de exercicios   algoritmos  resolvida-Lista de exercicios   algoritmos  resolvida-
Lista de exercicios algoritmos resolvida-
Mauro Pereira
 

Destaque (13)

Ávores de Decisão
Ávores de DecisãoÁvores de Decisão
Ávores de Decisão
 
Árvores de Decisão
Árvores de Decisão Árvores de Decisão
Árvores de Decisão
 
Lista 1 - aprendizagem de máquina-
Lista 1 - aprendizagem de máquina-Lista 1 - aprendizagem de máquina-
Lista 1 - aprendizagem de máquina-
 
Mineração
MineraçãoMineração
Mineração
 
Descoberta de Conhecimento em Bancos de Dados e Mineração de Dados
Descoberta de Conhecimento em Bancos de Dados e Mineração de DadosDescoberta de Conhecimento em Bancos de Dados e Mineração de Dados
Descoberta de Conhecimento em Bancos de Dados e Mineração de Dados
 
Weka básico
Weka básicoWeka básico
Weka básico
 
Classficação de Texto e Naive Bayes
Classficação de Texto e Naive BayesClassficação de Texto e Naive Bayes
Classficação de Texto e Naive Bayes
 
Kmeans
KmeansKmeans
Kmeans
 
TDC2016SP - Machine Learning Black Boxes - Terceirizando o Trabalho Duro
TDC2016SP - Machine Learning Black Boxes - Terceirizando o Trabalho DuroTDC2016SP - Machine Learning Black Boxes - Terceirizando o Trabalho Duro
TDC2016SP - Machine Learning Black Boxes - Terceirizando o Trabalho Duro
 
Introdução à Filosofia Moderna
Introdução à Filosofia ModernaIntrodução à Filosofia Moderna
Introdução à Filosofia Moderna
 
Lecture 4 Decision Trees (2): Entropy, Information Gain, Gain Ratio
Lecture 4 Decision Trees (2): Entropy, Information Gain, Gain RatioLecture 4 Decision Trees (2): Entropy, Information Gain, Gain Ratio
Lecture 4 Decision Trees (2): Entropy, Information Gain, Gain Ratio
 
Lista de exercicios algoritmos resolvida-
Lista de exercicios   algoritmos  resolvida-Lista de exercicios   algoritmos  resolvida-
Lista de exercicios algoritmos resolvida-
 
Apresentação de slides pronto
Apresentação de slides prontoApresentação de slides pronto
Apresentação de slides pronto
 

Semelhante a Algoritmo_ID3_e_C.45_Gilcimar

Aprendizagem Automática
Aprendizagem AutomáticaAprendizagem Automática
Aprendizagem Automática
butest
 
Aprendizagem Supervisionada I
Aprendizagem Supervisionada IAprendizagem Supervisionada I
Aprendizagem Supervisionada I
Luís Nunes
 
Clustering informatizado
Clustering  informatizadoClustering  informatizado
Clustering informatizado
Diêgo Maciel
 
Aulas arquitetura de computadores parte 1
Aulas arquitetura de computadores parte 1Aulas arquitetura de computadores parte 1
Aulas arquitetura de computadores parte 1
Vitinhoops
 
Trabalho final neurais_v1
Trabalho final neurais_v1Trabalho final neurais_v1
Trabalho final neurais_v1
Diego Damasceno
 

Semelhante a Algoritmo_ID3_e_C.45_Gilcimar (20)

Gilcimar apresentação
Gilcimar apresentaçãoGilcimar apresentação
Gilcimar apresentação
 
Mineração de dados
Mineração de dadosMineração de dados
Mineração de dados
 
ID3 Algorithm
ID3 AlgorithmID3 Algorithm
ID3 Algorithm
 
Artigo tecnico RNA Iris
Artigo tecnico RNA IrisArtigo tecnico RNA Iris
Artigo tecnico RNA Iris
 
Data mining
Data miningData mining
Data mining
 
Big data
Big dataBig data
Big data
 
Aprendizagem Automática
Aprendizagem AutomáticaAprendizagem Automática
Aprendizagem Automática
 
Introdução a Árvore de Dados Adaptativa (WTA 2011)
Introdução a Árvore de Dados Adaptativa (WTA 2011)Introdução a Árvore de Dados Adaptativa (WTA 2011)
Introdução a Árvore de Dados Adaptativa (WTA 2011)
 
kNN Algorithm
kNN AlgorithmkNN Algorithm
kNN Algorithm
 
Aprendizagem Supervisionada I
Aprendizagem Supervisionada IAprendizagem Supervisionada I
Aprendizagem Supervisionada I
 
Analytics - Data Science - Arvores de decisao
Analytics - Data Science - Arvores de decisaoAnalytics - Data Science - Arvores de decisao
Analytics - Data Science - Arvores de decisao
 
Desvendando os mistérios do Data Science
Desvendando os mistérios do Data ScienceDesvendando os mistérios do Data Science
Desvendando os mistérios do Data Science
 
Ordenação de Dados por Distribuição de Chaves
Ordenação de Dados por Distribuição de ChavesOrdenação de Dados por Distribuição de Chaves
Ordenação de Dados por Distribuição de Chaves
 
4. metodos de contrucao de algoritmo
4. metodos de contrucao de algoritmo4. metodos de contrucao de algoritmo
4. metodos de contrucao de algoritmo
 
Clustering informatizado
Clustering  informatizadoClustering  informatizado
Clustering informatizado
 
Aulas arquitetura de computadores parte 1
Aulas arquitetura de computadores parte 1Aulas arquitetura de computadores parte 1
Aulas arquitetura de computadores parte 1
 
Analise exploratório de dados
Analise exploratório de dadosAnalise exploratório de dados
Analise exploratório de dados
 
6.3 Clustering_338ca79f26242f5b9b48a218cfc35819.pdf
6.3 Clustering_338ca79f26242f5b9b48a218cfc35819.pdf6.3 Clustering_338ca79f26242f5b9b48a218cfc35819.pdf
6.3 Clustering_338ca79f26242f5b9b48a218cfc35819.pdf
 
Sistemas de Recomendação
Sistemas de RecomendaçãoSistemas de Recomendação
Sistemas de Recomendação
 
Trabalho final neurais_v1
Trabalho final neurais_v1Trabalho final neurais_v1
Trabalho final neurais_v1
 

Mais de iaudesc (12)

Data Mining - Clustering
Data Mining - ClusteringData Mining - Clustering
Data Mining - Clustering
 
Seminario fuzzy
Seminario fuzzySeminario fuzzy
Seminario fuzzy
 
Algorítimos Genéticos
Algorítimos GenéticosAlgorítimos Genéticos
Algorítimos Genéticos
 
Autômatos celulares
Autômatos celularesAutômatos celulares
Autômatos celulares
 
Vida artificial
Vida artificialVida artificial
Vida artificial
 
RNA - Redes neurais artificiais
RNA - Redes neurais artificiaisRNA - Redes neurais artificiais
RNA - Redes neurais artificiais
 
Representação do conhecimento (rc)
Representação do conhecimento (rc)Representação do conhecimento (rc)
Representação do conhecimento (rc)
 
Algoritmos de jogos
Algoritmos de jogosAlgoritmos de jogos
Algoritmos de jogos
 
Programação Genética
Programação GenéticaProgramação Genética
Programação Genética
 
Busca tabu
Busca tabuBusca tabu
Busca tabu
 
Seminário redes bayesianas
Seminário redes bayesianasSeminário redes bayesianas
Seminário redes bayesianas
 
Solvers and Applications with CP
Solvers and Applications with CPSolvers and Applications with CP
Solvers and Applications with CP
 

Algoritmo_ID3_e_C.45_Gilcimar

  • 1. Algoritmo ID3 e C.45 no Processo de Mineração de Dados Gilcimar Hoehstein
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17. Exemplo – árvore de decisão para regras de classificação 1.     Se    ( Escolaridade = “Graduação” )   - Rico = “Não” 2.     Se    ( Escolaridade = “Doutorado” )   - Rico = “Sim” 3.     Se    ( Escolaridade = “Mestrado” ) &   ( Idade = “>30” )  - Rico = “Sim” ) 4.     Se    ( Escolaridade = “Mestrado” ) &   ( Idade = “<=30” ) - Rico = “Não” )
  • 18.
  • 19.
  • 20.
  • 22.
  • 23.
  • 24.
  • 25.
  • 26.
  • 27.
  • 28. Exemplo Prático Precisa saber se é possível jogar tênis com Sol, frio, alta, forte. ????
  • 29. Entropia dos dados da amostra Entropia dos Dados (S1) =-0,64* LOG(0,64;2)- 0,36*LOG(0,36;2) = 0,940 Obs: se a entropia estiver fora do intervalo [0,1], alguma coisa no calculo está errado
  • 30. O conjunto de dados é dividido sobre os valores dos atributos A entropia de cada valor é calculado. Então, ele é adicionado proporcionalmente, para obter a entropia total do atributo. =(5/14)*entropia do sol) + (4/14* entropia do encoberto) + (5/14) * entropia da chuva) = 0,663
  • 31.
  • 32.
  • 33. Ganho de informação do Atributo Temperatura Entropia de Temperatura =(4/14)*entropia de quente) + (6/14* entropia de agradável) + (4/14) * entropia de frio) = 0,768 Ganho (S, Temperatura) = 0,940 – 0,768 = 0,172
  • 34. Ganho de informação do Atributo Umidade Entropia de Umidade =(7/14)*entropia de normal) + (7/14* alta) = 0,788 Ganho (S, Umidade) = 0,940 – 0,788 = 0,152
  • 35. Ganho de informação do Atributo Vento Entropia de Vento =(6/14)*entropia de forte) + (8/14* entropia de fraco)= 0,906 Ganho (S1, Temperatura) = 0,940 – 0,906 = 0,035
  • 36. Escolha do atributo com maior Ganho de informação para ser o nó raiz Encoberto Aparência Sol ??? SIM Chuvoso ???
  • 37.
  • 38.
  • 39. Escolha do atributo com maior Ganho de informação para ser o nó filho de Sol Escolha do Atributo com Maior Ganho Aparência ??? SIM Chuvoso Umidade NÃO Alta Encoberto Sol SIM Normal
  • 40.
  • 41.
  • 42.
  • 43.
  • 44.
  • 45.
  • 46.
  • 47.
  • 48.
  • 49.
  • 50.
  • 51.
  • 52.
  • 53.
  • 54.
  • 55. Exemplo – Poda baseada em Erro
  • 56.
  • 57.
  • 59.
  • 61.
  • 62.
  • 63.
  • 64. Trem Custo das Viagens Gênero Carro Trem Barato Caro padrão Ônibus Feminino Masculino Transporte 0 1 Ônibus