Nesta sessão o MVP em SQL Server Diego Nogare apresenta duas técnicas de aprendizado de máquina, uma sendo aprendizado supervisionado e outra não supervisionado. Realizou as explicações com Azure Machine Learning e Linguagem R respectivamente.
2. Apresentação
Diego é Autor dos livros “Do Banco de Dados Relacional à Tomada de Decisão“ e
“SQL Server além do Conceito: Blog post Collection”. Líder do grupo de usuários
Codificando .NET, Microsoft Most Valuable Professional [MVP] em SQL Server desde
2008. Junto ao PASS (Professional Association for SQL Server) é voluntário como
Regional Mentor, é Chapter Leader em São Paulo e Board Advisor para a região da
América Latina. Trabalhou no time de SQL Server na Microsoft, no Brasil, engajado
no lançamento do SQL Server 2012. É palestrante em eventos oficiais da Microsoft,
Codificando .NET, INETA BR e PASS, mantém o site: www.diegonogare.net
Email: nogare@ngrsolutions.com.br
Skype: DiegoNogare
Linkedin profile: https://www.linkedin.com/in/diegonogare
Blog: http://www.diegonogare.net
Twitter: @DiegoNogare
3. Aprendizado de Máquinas com Azure Machine Learning e R
Aprendizado de Máquinas
o Supervisionado (Usando Azure Machine Learning)
o Não Supervisionado (Usando R)
13. K-Means Cluster
Todos os dados são plotados no gráfico
Os pontos representam os indivíduos analisados, mas não estão separados em
grupos, todos fazem parte do mesmo grupo. Ao informar a quantidade de
centróides, as interções começam até o momento de convergir e encontrar os K
grupos.
Os pontos representam os dados de treinos, neste caso o dataset
14. K-Means Cluster
Centróides iniciais em posições aleatórias
Ao iniciar o algoritmo, os K pontos (chamados de centróides) são plotados
aleatoriamente no plano e possuem um ponto de partida para iniciar o algoritmo.
15. K-Means Cluster
Com base nos pontos e centros, inicia-se o algoritmo
Os centróides são re-calculados a cada interação, calculando a média da distância
entre cada ponto e a posição do centróide. Então, com base neste resultado o
centróide muda de lugar ficando mais ao centro de seus pontos (elementos).
16. K-Means Cluster
Alteração dos pontos e centros
Enquanto a distância for recalculada e elementos mudarem de centro, o algoritmo
continua executando.
Reparem que os elementos marcados mudaram de centro.
18. K-Means Cluster
Com base nos pontos e centros, inicia-se o algoritmo
Mais uma interação e re-calculo das distâncias, e com isso, mais uma vez a
movimentação dos centróides.
Posição inicial (amarelo) do centróide seguindo para uma próxima posição
(vermelho e azul).
19. K-Means Cluster
Quando parar?
No momento que os centróides não recebem nenhum elemento novo em seu grupo
significa que eles convergiram para uma posição satisfatória, e criou os grupos
necessários.
20. K-Means Cluster
Ponto satisfatório
Ao encontrar o ponto satisfatório, o algoritmo para de executar e mantém os
elementos conectados com seus centróides.
Depois da interação não houve mudança de elementos.