O documento resume as principais informações sobre uma reunião sobre Business Intelligence, Dataviz e Data Science. Apresenta brevemente os tópicos de SSIS, SSAS e PowerBI para Business Intelligence e Dataviz. Para Data Science, destaca algoritmos de regressão, classificação e clusterização, além de abordar classificadores binários e a curva ROC.
4. Planning on attending PASS Summit 2015? Start
saving today!
• The world’s largest gathering of SQL Server & BI professionals
• Take your SQL Server skills to the next level by learning from the world’s
top SQL Server experts, in over 190 technical sessions
• Over 5000 registrations, representing 2000 companies, from 52
countries, ready to network & learn
Save $150 right now using
discount code LCCOMPRX86
5. Whatever your data passion – there’s a Virtual Chapter for you!
5
www.sqlpass.org/vc
6. Select Virtual Chapter Meetings
more events and info at sqlpass.org/events
VIRTUAL CHAPTER MEETING TOPIC
DBA Fundamentals and
Women in Technology
Aug 18 11:00-12:00 (UTC-06:00) Moving from Profiler to Extended Events
presented by Jes Borland
In Memory Aug 18 16:00-17:00 (UTC 00:00) Inside xVelocity in-memory engine for
PowerPivot, Power BI and Analysis Services
Tabular presented by Marco Russo
Global Spanish Aug 19 12:00-13:00 (UTC-05:00) Introducción a Data Science presented by
Jose L. Rivera
Virtualization Aug 19 12:00-13:00 (UTC-05:00) Questions & Answers presented with David
Klee
Global Russian Aug 19 15:00-16:30 (UTC+03:00) Внутри Оптимизатора Запросов:
Агрегация presented by Dmitry Pilyugin
Global Chinese Aug 20 20:00-21:30 (UTC-06:00) New Features in SQL 2016 with Lindsey Allen
Business Analytics Aug 26 15:00-16:00 (UTC-05:00) Power BI, Mission Possible! Presented by
Reza rad
Application Development Aug 27 16:00-17:00 (UTC 00:00) Entity Framework Database Performance
Anti-Patterns presented by Russ Thomas
7. Upcoming SQLSaturdays
North America International
• Aug 22 Louisville
• Aug 29 El Paso
• Aug 29 Oklahoma City
• Sep 12 Las Vegas
• Sep 19 San Diego
• Sep 26 Spartanburg
• Aug 18 Malaysia
• Aug 22 Guatemala
• Aug 29 Oslo
• Sep 5 Gothenburg
• Sep 5 Johannesburg
• Sept 5 Paris
• Sept 12 Bogota
• Sep 26 São Paulo
Visit www.sqlsaturday.com to
register for a event near you!
8. 8
Volunteering Opportunities
PASS would not exist without passionate, dedicated,
and hardworking volunteers from around the globe.
Volunteer today!!
For local opportunities please visit
volunteer.sqlpass.org
For PASS HQ related activities, please update the
“MyVolunteering” section of your MyPASS profile.
9. 9
PASSion Award 2015
The highest of PASS accolades
presented yearly to an outstanding
volunteer.
Nominations for the 2015 PASSion
Award are now open.
Email PASSionAward@sqlpass.org to
submit a nomination.
For more information visit
http://www.sqlpass.org/Community
/Volunteers/PASSionAward.aspx
10. Stay Involved!
• Sign up for a free membership today at sqlpass.org
• Linked In: http://www.sqlpass.org/linkedin
• Facebook: http://www.sqlpass.org/facebook
• Twitter: @SQLPASS
• PASS: http://www.sqlpass.org
11. Agenda
Business Intelligence
SSIS – SQL Server Integration Services
SSAS – SQL Server Analysis Services
Dataviz (Data Visualization)
Datazen
PowerBI
Data Science
Azure Machine Learning
R
1
1
39. K-Means Cluster
Todos os dados são plotados no gráfico
Os pontos representam os indivíduos analisados, mas não estão
separados em grupos, todos fazem parte do mesmo grupo. Ao informar a
quantidade de centróides, as interções começam até o momento de convergir
e encontrar os K grupos.
Os pontos representam os dados de treinos, neste caso o dataset
40. K-Means Cluster
Centróides iniciais em posições aleatórias
Ao iniciar o algoritmo, os K pontos (chamados de centróides) são
plotados aleatoriamente no plano e possuem um ponto de partida para iniciar
o algoritmo.
As cruzes representam os centróides, e a linha tracejada é a borda de
separação entre os centróides, fazendo com que esse grupo seja
dividido entre os individuos da parte de cima desta linha, e da parte de
baixo.
41. K-Means Cluster
Com base nos pontos e centros, inicia-se o algoritmo
Os centróides são re-calculados a cada interação, calculando a
média da distância entre cada ponto e a posição do centróide. Então, com
base neste resultado o centróide muda de lugar ficando mais ao centro de seus
pontos (elementos).
Posição inicial (amarelo) do centróide seguindo para uma próxima
posição (vermelho e azul).
42. K-Means Cluster
Alteração dos pontos e centros
Enquanto a distância for recalculada e elementos mudarem de
centro, o algoritmo continua executando.
Reparem que os elementos marcados mudaram de centro.
44. K-Means Cluster
Com base nos pontos e centros, inicia-se o algoritmo
Mais uma interação e re-calculo das distâncias, e com isso, mais uma
vez a movimentação dos centróides.
Posição inicial (amarelo) do centróide seguindo para uma próxima
posição (vermelho e azul).
45. K-Means Cluster
Quando parar?
No momento que os centróides não recebem nenhum elemento novo
em seu grupo significa que eles convergiram para uma posição satisfatória, e
criou os grupos necessários.
Enquanto a média da distância calculada ainda alterar pontos entre os
grupos, o algoritmo continua interagindo e re-calculando os centróides.
46. K-Means Cluster
Ponto satisfatório
Ao encontrar o ponto satisfatório, o algoritmo para de executar e
mantém os elementos conectados com seus centróides.
Depois da interação não houve mudança de elementos.
47. K-Means Cluster
Quantos centróides usar?
Existe uma linha de pesquisa que usa esta representação de elbow
(cotovelo) para definir uma quantidade razoavel de centróides.
Esta técnica condiz em encontrar o platô e então utilizar valores
anteriores. Quando utilizar um valor que esteja estagnado no platô, o
resultado não terá tanta relevância e impacto para o agrupamento.