SlideShare una empresa de Scribd logo
1 de 24
Descargar para leer sin conexión
Marcel Caraciolo - @marcelcaraciolo
Mineração de Palestras
1
Quem é Marcel ?
Marcel Pinheiro Caraciolo - @marcelcaraciolo
Mestrando em Ciência da Computação no CIN/UFPE na área de mineração de dados
Diretor de Pesquisa e Desenvolvimento na Orygens
Membro e Moderador da Celúla de Usuários Python de Pernambuco (PUG-PE)
Minhas áreas de interesse: Computação móvel e Computação inteligente
Meus blogs: http://www.mobideia.com (sobre Mobilidade desde 2006)
http://aimotion.blogspot.com (sobre I.A. desde 2009)
Jovem Aprendiz ainda nas artes pythonicas.... (desde 2007)
Sergipano, porém Recifense.
2
Como comecei esta análise ?
20 hrs atrás no Hotel....
3
Scraping do PythonBrasil
Mini-Crawler para extrair as palestras aprovadas
urllib2,BeautifulSoap, regex...
4
Dilema
Esses dados são Públicos ??
Não ? Podemos negociar ein ...
5
Alguns dados interessantes
6
48 Palestras aceitas
2160 minutos de Palestras
7
Ou seja
=˜388.800 tweets postados
8
Ou assistir
Todas temporadas Big Bang Theory
Toda a Saga Star Wars 2x
9
Na nossa língua agora...
Zerar Super Mario 216 x
http://video.google.com/videoplay?docid=-8297067084319900351&q=mario#
10
Na nossa língua agora...
Abrir o Eclipse 2 vezes!
11
Total de Pontos recebidos:
4812
12
Convertendo em votos
Não dava para eleger Tiririca, mas
Mas veja conseguimos um número perfeito!
4812 MB = Capacidade de um DVD!
13
Palestra Hackeada
Dinf & C3SL infra estrutura - 999 vontos
Apelão mesmo!
14
Distribuição das palestras
Ainda precisamos distribuir
melhor o nível das
palestras!
Avançado
2%
Intermediario
56%
Basico
42%
Avançado
Intermediario
Basico
15
Distribuição das palestras
16
Temas mais frequentes
Temas relacionados a desenvolvimento, dados, sistemas, linguagem,
ferramentas, django
A partir dos resumos
17
Temas mais frequentes
Mas como ver a distribuição dos temas
18
Temas mais frequentes
Mas ainda fica difícil de distinguir!
19
Distribuição das palestras
Utilizado o algoritmo de clustering K-means
Ferramenta de visualização em Python UbiGraph
DEMO
20
Distribuição das palestras
Ferramenta de visualização UbiGraph
Inteligencia Artificial
Hardware
Web (Django e AppEngine)
Empreendorismo
Padrões e Práticas
Ferramentas
Testes
Mineração de Dados
http://ubietylab.net/ubigraph/
21
RESUMO
Excelente nível de palestras!
Submetam seus trabalhos, vocês podem
estar aqui também!
Engaje, colabore e divulgue!
22
Marcel Caraciolo - @marcelcaraciolo
Mineração de Palestras
23
Marcel Caraciolo - @marcelcaraciolo
Mineração de Palestras
23

Más contenido relacionado

Destacado

OpenData-BR, [Captando] Dados públicos brasileiros
OpenData-BR, [Captando] Dados públicos brasileirosOpenData-BR, [Captando] Dados públicos brasileiros
OpenData-BR, [Captando] Dados públicos brasileiros
Thiago Rondon
 

Destacado (17)

OpenData-BR, [Captando] Dados públicos brasileiros
OpenData-BR, [Captando] Dados públicos brasileirosOpenData-BR, [Captando] Dados públicos brasileiros
OpenData-BR, [Captando] Dados públicos brasileiros
 
Web scraping
Web scrapingWeb scraping
Web scraping
 
03 dicas valiosas para a implantação de métodos ágeis na sua organização
03 dicas valiosas para a implantação de métodos ágeis na sua organização03 dicas valiosas para a implantação de métodos ágeis na sua organização
03 dicas valiosas para a implantação de métodos ágeis na sua organização
 
Mini Curso - WebScraping com C# - Erick Wendel
Mini Curso - WebScraping com C# - Erick WendelMini Curso - WebScraping com C# - Erick Wendel
Mini Curso - WebScraping com C# - Erick Wendel
 
O Product Owner e o Scrum
O Product Owner e o ScrumO Product Owner e o Scrum
O Product Owner e o Scrum
 
Scrum: 10 situações de quando ele poderá (e certamente irá) fracassar
Scrum: 10 situações de quando ele poderá (e certamente irá) fracassarScrum: 10 situações de quando ele poderá (e certamente irá) fracassar
Scrum: 10 situações de quando ele poderá (e certamente irá) fracassar
 
Scrum e o gerenciamento de projetos
Scrum e o gerenciamento de projetosScrum e o gerenciamento de projetos
Scrum e o gerenciamento de projetos
 
Scrum: do teórico e filosófico para os desafios reais e avançados na implemen...
Scrum: do teórico e filosófico para os desafios reais e avançados na implemen...Scrum: do teórico e filosófico para os desafios reais e avançados na implemen...
Scrum: do teórico e filosófico para os desafios reais e avançados na implemen...
 
Formando equipes de alto desempenho
Formando equipes de alto desempenhoFormando equipes de alto desempenho
Formando equipes de alto desempenho
 
Web Scraping: aplicações nos negócios e na ciência
Web Scraping: aplicações nos negócios e na ciênciaWeb Scraping: aplicações nos negócios e na ciência
Web Scraping: aplicações nos negócios e na ciência
 
Modelos Híbridos: Case, Verdades, Mitos e Resistências
Modelos Híbridos: Case, Verdades, Mitos e ResistênciasModelos Híbridos: Case, Verdades, Mitos e Resistências
Modelos Híbridos: Case, Verdades, Mitos e Resistências
 
Gerenciamento Ágil de Projetos Seguindo as Boas Práticas do PMI
Gerenciamento Ágil de Projetos Seguindo as Boas Práticas do PMIGerenciamento Ágil de Projetos Seguindo as Boas Práticas do PMI
Gerenciamento Ágil de Projetos Seguindo as Boas Práticas do PMI
 
Scraping
ScrapingScraping
Scraping
 
Open Data
Open DataOpen Data
Open Data
 
Apresentação de Serviços em Métodos Ágeis - Hiflex Consultoria
Apresentação de Serviços em Métodos Ágeis - Hiflex ConsultoriaApresentação de Serviços em Métodos Ágeis - Hiflex Consultoria
Apresentação de Serviços em Métodos Ágeis - Hiflex Consultoria
 
Desenvolvendo web crawler/scraper com Python
Desenvolvendo web crawler/scraper com PythonDesenvolvendo web crawler/scraper com Python
Desenvolvendo web crawler/scraper com Python
 
Extraindo dados públicos na marra com Python
Extraindo dados públicos na marra com PythonExtraindo dados públicos na marra com Python
Extraindo dados públicos na marra com Python
 

Más de Marcel Caraciolo

Más de Marcel Caraciolo (20)

Como interpretar seu próprio genoma com Python
Como interpretar seu próprio genoma com PythonComo interpretar seu próprio genoma com Python
Como interpretar seu próprio genoma com Python
 
Joblib: Lightweight pipelining for parallel jobs (v2)
Joblib:  Lightweight pipelining for parallel jobs (v2)Joblib:  Lightweight pipelining for parallel jobs (v2)
Joblib: Lightweight pipelining for parallel jobs (v2)
 
Construindo softwares de bioinformática para análises clínicas : Desafios e...
Construindo softwares  de bioinformática  para análises clínicas : Desafios e...Construindo softwares  de bioinformática  para análises clínicas : Desafios e...
Construindo softwares de bioinformática para análises clínicas : Desafios e...
 
Como Python ajudou a automatizar o nosso laboratório v.2
Como Python ajudou a automatizar o nosso laboratório v.2Como Python ajudou a automatizar o nosso laboratório v.2
Como Python ajudou a automatizar o nosso laboratório v.2
 
Como Python pode ajudar na automação do seu laboratório
Como Python pode ajudar na automação do  seu laboratórioComo Python pode ajudar na automação do  seu laboratório
Como Python pode ajudar na automação do seu laboratório
 
Python on Science ? Yes, We can.
Python on Science ?   Yes, We can.Python on Science ?   Yes, We can.
Python on Science ? Yes, We can.
 
Oficina Python: Hackeando a Web com Python 3
Oficina Python: Hackeando a Web com Python 3Oficina Python: Hackeando a Web com Python 3
Oficina Python: Hackeando a Web com Python 3
 
Recommender Systems with Ruby (adding machine learning, statistics, etc)
Recommender Systems with Ruby (adding machine learning, statistics, etc)Recommender Systems with Ruby (adding machine learning, statistics, etc)
Recommender Systems with Ruby (adding machine learning, statistics, etc)
 
Opensource - Como começar e dá dinheiro ?
Opensource - Como começar e dá dinheiro ?Opensource - Como começar e dá dinheiro ?
Opensource - Como começar e dá dinheiro ?
 
Big Data com Python
Big Data com PythonBig Data com Python
Big Data com Python
 
Benchy, python framework for performance benchmarking of Python Scripts
Benchy, python framework for performance benchmarking  of Python ScriptsBenchy, python framework for performance benchmarking  of Python Scripts
Benchy, python framework for performance benchmarking of Python Scripts
 
Python e 10 motivos por que devo conhece-la ?
Python e 10 motivos por que devo conhece-la ?Python e 10 motivos por que devo conhece-la ?
Python e 10 motivos por que devo conhece-la ?
 
GeoMapper, Python Script for Visualizing Data on Social Networks with Geo-loc...
GeoMapper, Python Script for Visualizing Data on Social Networks with Geo-loc...GeoMapper, Python Script for Visualizing Data on Social Networks with Geo-loc...
GeoMapper, Python Script for Visualizing Data on Social Networks with Geo-loc...
 
Benchy: Lightweight framework for Performance Benchmarks
Benchy: Lightweight framework for Performance Benchmarks Benchy: Lightweight framework for Performance Benchmarks
Benchy: Lightweight framework for Performance Benchmarks
 
Construindo Sistemas de Recomendação com Python
Construindo Sistemas de Recomendação com PythonConstruindo Sistemas de Recomendação com Python
Construindo Sistemas de Recomendação com Python
 
Python, A pílula Azul da programação
Python, A pílula Azul da programaçãoPython, A pílula Azul da programação
Python, A pílula Azul da programação
 
Construindo Soluções Científicas com Big Data & MapReduce
Construindo Soluções Científicas com Big Data & MapReduceConstruindo Soluções Científicas com Big Data & MapReduce
Construindo Soluções Científicas com Big Data & MapReduce
 
Como Python está mudando a forma de aprendizagem à distância no Brasil
Como Python está mudando a forma de aprendizagem à distância no BrasilComo Python está mudando a forma de aprendizagem à distância no Brasil
Como Python está mudando a forma de aprendizagem à distância no Brasil
 
Novas Tendências para a Educação a Distância: Como reinventar a educação ?
Novas Tendências para a Educação a Distância: Como reinventar a educação ?Novas Tendências para a Educação a Distância: Como reinventar a educação ?
Novas Tendências para a Educação a Distância: Como reinventar a educação ?
 
Aula WebCrawlers com Regex - PyCursos
Aula WebCrawlers com Regex - PyCursosAula WebCrawlers com Regex - PyCursos
Aula WebCrawlers com Regex - PyCursos
 

Análise das Palestras do PythonBrasil [6]