SlideShare una empresa de Scribd logo
1 de 33
Descargar para leer sin conexión
DATA
ciência de dados para desenvolvedores
Ana Paula Gomes
- Fã do Netflix
- Interessada em ciência de dados (óbvio)
- Mestranda em Ciência da Computação
- Organizadora do GDG BH / WTM BH (gdgbh.org)
“Democracy is so overrated.”
“Data science is all about
transforming data into business
value using math and algorithms.”
Forbes
o que você precisa fazer
o processo
• coleta de dados
• preparação
• descoberta
• visualização
coleta de dados
coletar dados_
• APIs
• Crawlers
• Apps
• Arquivos (?)
coletar dados_
Requests
coletar dados_
PyQuery
preparação
preparação_
• Remoção de ruídos
• Cruzamento de informações
• Manipulação dos dados
preparação_
Pandas
preparação_
Numpy
descoberta
descoberta_
Qual a pergunta você quer
responder?
descoberta_
• Aprendizado de Máquina
• Grafos
descoberta_
Scikit
descoberta_
NetworkX
visualização
visualizar_
Precisa ser apresentável e
entendível para o seu cliente
visualizar_
D3js
visualizar_
Matplotlib
e agora?
por onde começar
• leia bastante!
• escolha um projeto que te interesse
• pratique!
você pode escolher
• mitchcrowe.com/learn-data-science-the-hard-way
• coursera.org
• udacity.com
• guidetodatamining.com
• pt.khanacademy.org
• kaggle.com
obrigada!
@anapaulagomess
créditos
• Netflix ;)
• http://www.cinemadetalhado.com.br/wp-content/uploads/House-of-Cards-2015-TV-Series-Season-3-Poster-Wallpaper.jpg
• http://www.forbes.com/sites/sap/2014/01/21/data-scientist-sexiest-job-of-the-century/
• http://vignette3.wikia.nocookie.net/house-of-cards/images/d/d8/House-of-cards-season-2-4.jpg/revision/latest?cb=20140128232625
• https://nypdecider.files.wordpress.com/2015/02/16-6.png
• https://nypdecider.files.wordpress.com/2015/02/25-1.png
• http://vignette2.wikia.nocookie.net/house-of-cards/images/e/e5/House-of-cards-season-2-3.jpg/revision/latest?cb=20140128232625
• https://aoquadrado.catracalivre.com.br/wp-content/uploads/sites/4/2015/09/infografico-netflix-vicio.jpg
• http://battymamzelle.blogspot.com.br/2014_02_01_archive.html
• http://blogs.telegraph.co.uk/news/files/2014/02/fu-460x288.jpg
• http://convergecom.com.br/wp-content/uploads/2015/09/house-of-cards-netflix.jpg

Más contenido relacionado

Destacado

Trabalho BI Qlikview
Trabalho BI QlikviewTrabalho BI Qlikview
Trabalho BI QlikviewJose Silva
 
Sql saturday325
Sql saturday325Sql saturday325
Sql saturday325demetrioi
 
Conceitos gerais de etl - Qlikview
Conceitos gerais de etl - QlikviewConceitos gerais de etl - Qlikview
Conceitos gerais de etl - QlikviewRoberto Oliveira
 
Estudo sobre ferramentas de BI Open Source
Estudo sobre ferramentas de BI Open SourceEstudo sobre ferramentas de BI Open Source
Estudo sobre ferramentas de BI Open SourceNelson Forte
 
Como participar de projetos Open Source no Github?
Como participar de projetos Open Source no Github?Como participar de projetos Open Source no Github?
Como participar de projetos Open Source no Github?Guilherme Farias
 
Pentaho: inteligência de negócios utilizando software livre
Pentaho: inteligência de negócios utilizando software livrePentaho: inteligência de negócios utilizando software livre
Pentaho: inteligência de negócios utilizando software livreCaio Moreno
 
Open Source Business Intelligence
Open Source Business IntelligenceOpen Source Business Intelligence
Open Source Business IntelligenceDaniel Rabelo
 
Tableau: Big Data Analytics with Tableau
Tableau: Big Data Analytics with TableauTableau: Big Data Analytics with Tableau
Tableau: Big Data Analytics with TableauXpand IT
 
Dashboards maneiros: Performance
Dashboards maneiros: PerformanceDashboards maneiros: Performance
Dashboards maneiros: PerformanceWagner Alves
 
9 motivos para aprender small data
9 motivos para aprender small data9 motivos para aprender small data
9 motivos para aprender small dataRoberto Oliveira
 
Vixteam IDEA 9 Data Analytics
Vixteam IDEA 9 Data AnalyticsVixteam IDEA 9 Data Analytics
Vixteam IDEA 9 Data AnalyticsVIXTEAM
 
Curso Gratuito Online de Open Data (Dados Abertos) e BI Open Source
Curso Gratuito Online de Open Data (Dados Abertos) e BI Open SourceCurso Gratuito Online de Open Data (Dados Abertos) e BI Open Source
Curso Gratuito Online de Open Data (Dados Abertos) e BI Open SourceIT4biz IT Solutions
 
Qmeeting SP - Design para Business Intelligence
Qmeeting SP - Design para Business IntelligenceQmeeting SP - Design para Business Intelligence
Qmeeting SP - Design para Business IntelligenceRoberto Oliveira
 
Gestão administrativa de pessoal
Gestão administrativa de pessoalGestão administrativa de pessoal
Gestão administrativa de pessoalRodrigo Cristóvão
 
Qmeeting Conceitos_qlik_sense_Pablo
Qmeeting Conceitos_qlik_sense_PabloQmeeting Conceitos_qlik_sense_Pablo
Qmeeting Conceitos_qlik_sense_PabloRoberto Oliveira
 
R, Python, Twitter e Tableau para Business Intelligence
R, Python, Twitter e Tableau para Business IntelligenceR, Python, Twitter e Tableau para Business Intelligence
R, Python, Twitter e Tableau para Business IntelligenceLeandro Guerra
 
Carreiras em Business Intelligence e Big Data
Carreiras em Business Intelligence e Big DataCarreiras em Business Intelligence e Big Data
Carreiras em Business Intelligence e Big DataMarco Garcia
 

Destacado (20)

Trabalho BI Qlikview
Trabalho BI QlikviewTrabalho BI Qlikview
Trabalho BI Qlikview
 
Sql saturday325
Sql saturday325Sql saturday325
Sql saturday325
 
Documento SpagoBI
Documento SpagoBIDocumento SpagoBI
Documento SpagoBI
 
Conceitos gerais de etl - Qlikview
Conceitos gerais de etl - QlikviewConceitos gerais de etl - Qlikview
Conceitos gerais de etl - Qlikview
 
Estudo sobre ferramentas de BI Open Source
Estudo sobre ferramentas de BI Open SourceEstudo sobre ferramentas de BI Open Source
Estudo sobre ferramentas de BI Open Source
 
Como participar de projetos Open Source no Github?
Como participar de projetos Open Source no Github?Como participar de projetos Open Source no Github?
Como participar de projetos Open Source no Github?
 
Treinamento hadoop - dia3
Treinamento hadoop - dia3Treinamento hadoop - dia3
Treinamento hadoop - dia3
 
Pentaho: inteligência de negócios utilizando software livre
Pentaho: inteligência de negócios utilizando software livrePentaho: inteligência de negócios utilizando software livre
Pentaho: inteligência de negócios utilizando software livre
 
Open Source Business Intelligence
Open Source Business IntelligenceOpen Source Business Intelligence
Open Source Business Intelligence
 
Tableau: Big Data Analytics with Tableau
Tableau: Big Data Analytics with TableauTableau: Big Data Analytics with Tableau
Tableau: Big Data Analytics with Tableau
 
Dashboards maneiros: Performance
Dashboards maneiros: PerformanceDashboards maneiros: Performance
Dashboards maneiros: Performance
 
9 motivos para aprender small data
9 motivos para aprender small data9 motivos para aprender small data
9 motivos para aprender small data
 
Vixteam IDEA 9 Data Analytics
Vixteam IDEA 9 Data AnalyticsVixteam IDEA 9 Data Analytics
Vixteam IDEA 9 Data Analytics
 
Curso Gratuito Online de Open Data (Dados Abertos) e BI Open Source
Curso Gratuito Online de Open Data (Dados Abertos) e BI Open SourceCurso Gratuito Online de Open Data (Dados Abertos) e BI Open Source
Curso Gratuito Online de Open Data (Dados Abertos) e BI Open Source
 
Qmeeting SP - Design para Business Intelligence
Qmeeting SP - Design para Business IntelligenceQmeeting SP - Design para Business Intelligence
Qmeeting SP - Design para Business Intelligence
 
Gestão administrativa de pessoal
Gestão administrativa de pessoalGestão administrativa de pessoal
Gestão administrativa de pessoal
 
Business intelligence com QlikView
Business intelligence com QlikViewBusiness intelligence com QlikView
Business intelligence com QlikView
 
Qmeeting Conceitos_qlik_sense_Pablo
Qmeeting Conceitos_qlik_sense_PabloQmeeting Conceitos_qlik_sense_Pablo
Qmeeting Conceitos_qlik_sense_Pablo
 
R, Python, Twitter e Tableau para Business Intelligence
R, Python, Twitter e Tableau para Business IntelligenceR, Python, Twitter e Tableau para Business Intelligence
R, Python, Twitter e Tableau para Business Intelligence
 
Carreiras em Business Intelligence e Big Data
Carreiras em Business Intelligence e Big DataCarreiras em Business Intelligence e Big Data
Carreiras em Business Intelligence e Big Data
 

Similar a House of data - ciência de dados para desenvolvedores

Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoHélio Silva
 
Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...
Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...
Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...Adolfo Guimaraes
 
Possibilidades e tecnologias_digitais
Possibilidades e tecnologias_digitaisPossibilidades e tecnologias_digitais
Possibilidades e tecnologias_digitaisHusseyn Alaouieh
 
Criando uma cultura data driven
Criando uma cultura data drivenCriando uma cultura data driven
Criando uma cultura data drivenGuilherme Brunhole
 
Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015
Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015
Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015Bruno Rocha
 
II Congresso Latino-Americano de Inteligência Artificial e Data Science
II Congresso Latino-Americano de Inteligência Artificial e Data ScienceII Congresso Latino-Americano de Inteligência Artificial e Data Science
II Congresso Latino-Americano de Inteligência Artificial e Data ScienceGeorg Buske
 
Introducão à Ciência de Dados
Introducão à Ciência de DadosIntroducão à Ciência de Dados
Introducão à Ciência de DadosJoão Pedro Albino
 
Palestra Big Data SCTI
Palestra Big Data SCTIPalestra Big Data SCTI
Palestra Big Data SCTIBruna Pereira
 
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoBig Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoAmbiente Livre
 
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software LivrePalestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software LivreAmbiente Livre
 
BIGDATA: Da teoria à Pratica
BIGDATA: Da teoria à PraticaBIGDATA: Da teoria à Pratica
BIGDATA: Da teoria à PraticaDaniel Checchia
 
awari-ds-aula4.pptx.pdf
awari-ds-aula4.pptx.pdfawari-ds-aula4.pptx.pdf
awari-ds-aula4.pptx.pdfMarcos993896
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharepccdias
 
Big Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e TecnologiaBig Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e TecnologiaHélio Silva
 
Big Data Analytics - Data Engineer, Arquitetura, AWS e Mais
Big Data Analytics - Data Engineer, Arquitetura, AWS e MaisBig Data Analytics - Data Engineer, Arquitetura, AWS e Mais
Big Data Analytics - Data Engineer, Arquitetura, AWS e MaisCicero Joasyo Mateus de Moura
 
Aula 1 - Interaction Design From Ethnography, Mental Models to IA
Aula 1 - Interaction Design From Ethnography, Mental Models to IAAula 1 - Interaction Design From Ethnography, Mental Models to IA
Aula 1 - Interaction Design From Ethnography, Mental Models to IAAmyris Fernandez
 

Similar a House of data - ciência de dados para desenvolvedores (20)

Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e Mercado
 
Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...
Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...
Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...
 
Big Data, JVM e Redes Sociais
Big Data, JVM e Redes SociaisBig Data, JVM e Redes Sociais
Big Data, JVM e Redes Sociais
 
Possibilidades e tecnologias_digitais
Possibilidades e tecnologias_digitaisPossibilidades e tecnologias_digitais
Possibilidades e tecnologias_digitais
 
Criando uma cultura data driven
Criando uma cultura data drivenCriando uma cultura data driven
Criando uma cultura data driven
 
Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015
Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015
Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015
 
II Congresso Latino-Americano de Inteligência Artificial e Data Science
II Congresso Latino-Americano de Inteligência Artificial e Data ScienceII Congresso Latino-Americano de Inteligência Artificial e Data Science
II Congresso Latino-Americano de Inteligência Artificial e Data Science
 
Introducão à Ciência de Dados
Introducão à Ciência de DadosIntroducão à Ciência de Dados
Introducão à Ciência de Dados
 
BigData
BigDataBigData
BigData
 
Palestra Big Data SCTI
Palestra Big Data SCTIPalestra Big Data SCTI
Palestra Big Data SCTI
 
Hackathon UOL
Hackathon  UOL Hackathon  UOL
Hackathon UOL
 
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoBig Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
 
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software LivrePalestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
 
BIGDATA: Da teoria à Pratica
BIGDATA: Da teoria à PraticaBIGDATA: Da teoria à Pratica
BIGDATA: Da teoria à Pratica
 
Data Science For Dummies From a Dummy
Data Science For Dummies From a DummyData Science For Dummies From a Dummy
Data Science For Dummies From a Dummy
 
awari-ds-aula4.pptx.pdf
awari-ds-aula4.pptx.pdfawari-ds-aula4.pptx.pdf
awari-ds-aula4.pptx.pdf
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
 
Big Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e TecnologiaBig Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e Tecnologia
 
Big Data Analytics - Data Engineer, Arquitetura, AWS e Mais
Big Data Analytics - Data Engineer, Arquitetura, AWS e MaisBig Data Analytics - Data Engineer, Arquitetura, AWS e Mais
Big Data Analytics - Data Engineer, Arquitetura, AWS e Mais
 
Aula 1 - Interaction Design From Ethnography, Mental Models to IA
Aula 1 - Interaction Design From Ethnography, Mental Models to IAAula 1 - Interaction Design From Ethnography, Mental Models to IA
Aula 1 - Interaction Design From Ethnography, Mental Models to IA
 

Más de Ana Paula Gomes

In tests we trust: começando com TDD, mocks e mais
In tests we trust: começando com TDD, mocks e maisIn tests we trust: começando com TDD, mocks e mais
In tests we trust: começando com TDD, mocks e maisAna Paula Gomes
 
Flask e a sua primeira app web com python!
Flask e a sua primeira app web com python!Flask e a sua primeira app web com python!
Flask e a sua primeira app web com python!Ana Paula Gomes
 
Shut up and give me the data
Shut up and give me the dataShut up and give me the data
Shut up and give me the dataAna Paula Gomes
 
Codelab - Análise de Redes Sociais com Python
Codelab - Análise de Redes Sociais com PythonCodelab - Análise de Redes Sociais com Python
Codelab - Análise de Redes Sociais com PythonAna Paula Gomes
 
Apresentação do artigo "Experimental evidence of massive-scale emotional cont...
Apresentação do artigo "Experimental evidence of massive-scale emotional cont...Apresentação do artigo "Experimental evidence of massive-scale emotional cont...
Apresentação do artigo "Experimental evidence of massive-scale emotional cont...Ana Paula Gomes
 

Más de Ana Paula Gomes (6)

In tests we trust: começando com TDD, mocks e mais
In tests we trust: começando com TDD, mocks e maisIn tests we trust: começando com TDD, mocks e mais
In tests we trust: começando com TDD, mocks e mais
 
Developer anarchy
Developer anarchyDeveloper anarchy
Developer anarchy
 
Flask e a sua primeira app web com python!
Flask e a sua primeira app web com python!Flask e a sua primeira app web com python!
Flask e a sua primeira app web com python!
 
Shut up and give me the data
Shut up and give me the dataShut up and give me the data
Shut up and give me the data
 
Codelab - Análise de Redes Sociais com Python
Codelab - Análise de Redes Sociais com PythonCodelab - Análise de Redes Sociais com Python
Codelab - Análise de Redes Sociais com Python
 
Apresentação do artigo "Experimental evidence of massive-scale emotional cont...
Apresentação do artigo "Experimental evidence of massive-scale emotional cont...Apresentação do artigo "Experimental evidence of massive-scale emotional cont...
Apresentação do artigo "Experimental evidence of massive-scale emotional cont...
 

House of data - ciência de dados para desenvolvedores