Este documento apresenta um sistema de Business Intelligence para extrair e analisar informações dos currículos Lattes. O sistema automatiza a coleta de dados dos currículos, armazena em um banco de dados e fornece painéis e indicadores para avaliar a produção acadêmica da UNIVILLE.
1. Ferramenta para Extração e Análise das
Informações do Currículo Lattes
Orientador: Prof. Luiz Melo Romão Acadêmico: Lucas dos Santos Abreu
DPTO. DE SISTEMAS DE INFORMAÇÃO DA UNIVILLE
2. Quem sou eu...
Lucas dos Santos Abreu
Bacharel em Sistemas de Informação
◦ Universidade da Região de Joinville – UNIVILLE (2016)
Técnico em Informática
◦ SENAI Joinville (2011)
Desenvolvedor desde 2010
◦ TOTVS Santa Catarina (2010-2016)
◦ Coderockr (2016-hoje)
3. Agenda
o Introdução
o Motivação e Descrição do Problema
o Objetivos
o Solução Proposta
o Contribuições
o Considerações Finais
o Referências Bibliográficas
4. Introdução
Currículos Científicos da Plataforma Lattes
Construir um processo automatizado de extração dos dados dos currículos
Servir os dados através de uma solução de Business Intelligence
Avaliação da Qualidade da Produção das Instituições de Ensino Superior (IES)
Agilidade para responder a Licitações e identificar recursos pra projetos
Conhecimento sobre os Projeto em atividade na IES
5. Motivação e Problema
A UNIVILLE como IES é avaliada com base na quantidade e qualidade da sua
produção científica
O processo atual para coleta de dado é manual e lento
Áreas internas da IES utilizam os dados do Lattes para suas atividades
Consolidar os dados dos currículos em uma base de consulta simples
Melhorar o tempo de resposta no uso destes dados
6. Objetivos
Objetivo Geral:
◦ Desenvolver processo de BI para auxiliar na busca de competências dos professores e
pesquisadores; e geração de indicadores para IES baseados na Plataforma Lattes
Objetivos Específicos:
◦ Levantar a base dos profissionais da Univille que possuem currículos no Lattes;
◦ Desenvolver programa extrator para coletar os currículos dos profissionais;
◦ Desenvolver programa que realize a carga desses currículos para uma base de
consulta;
◦ Criar o modelo dessa base para uso em uma ferramenta de BI;
◦ Analisar os resultados obtidos e criar cenários que auxiliem na identificação dos
dados;
7. Solução Proposta
Utilizar o WebService “WSCurriculos” do CNPq retornar currículos em XML
Modelagem de um Data Warehouse baseado na documentação do XML
Melhorias na modelagem para melhor se adequar a consulta
Cruzamento com classificação dos Periódicos Qualis
Desenvolvimento de Extrator em C# para integração
◦ Tratamento de dados duplicados
◦ Associação entre currículos
Utilização da ferramenta de BI Tableau
13. Contribuições
Consolidação de uma base para consulta dos dados dos currículos
Código fonte do extrator sobre licença GNU GPL
Painéis e modelagem para analise dos indicadores
14. Código Fonte e Base
O código fonte e manual de uso disponibilizados em: https://git.io/ExtratorLattesCNPq
15. Considerações Finais
Pontos fortes e fracos da Instituição de Ensino
A Plataforma Lattes é a principal fonte de indicadores sobre a Instituição
Outras soluções no mercado (Stela Experta e ScriptLattes)
Processo automatizado de carga para uma base de consulta
Melhorias na qualidade e tempo de entrega
Para o futuro...
◦ Tratar grupos “orgânicos” de pesquisadores da Instituição de forma automática
◦ Avaliar uso de outras ferramentas de BI
16. Referências
CNPq. EXTRAÇÃO DE DADOS. Disponível em: <http://memoria.cnpq.br/web/portal-
lattes/extracoes-de-dados;jsessionid=E265541618ED4900C9AECCB88074061B>. Acesso em: 12
jul. 2015
DE OLIVEIRA, Maria da Penha; CASSIS, Márcia Ramos. MAPEAMENTO DE COMPETÊNCIAS:
Informações e Etapas Desenvolvidas para Construção Da Matriz-Base. Disponível em: <
http://www.planejamento.gov.br/secretarias/upload/Arquivos/seges/EPPGG/outros/
produto_V_mapeamento_competencias.pdf>. Acesso em: 24 mai. 2015.
FAYYAD, Usama M. et al. Knowledge Discovery and Data Mining: Towards a Unifying Framework.
In: KDD. 1996. p. 82-88.
GROFF, Todd; JONES, Thomas. Introduction to knowledge management. Routledge, 2012.
GOEBEL, Michael; GRUENWALD, Le. A survey of data mining and knowledge discovery software
tools. ACM SIGKDD Explorations Newsletter, v. 1, n. 1, p. 20-33, 1999.
HAN, Jiawei; KAMBER, Micheline; PEI, Jian. Data mining: concepts and techniques: concepts and
techniques. Elsevier, 2011.
17. Referências
HAUSSLER, David; FAYYAD, Usama M.; STOLORZ, Paul E. KDD for Science Data Analysis: Issues
and Examples. In: KDD. 1996. p. 50-56.
MENA-CHALCO, Jesús P. e CESAR-JR, Roberto M. ScriptLattes: Uma ferramenta para extração e
visualização de conhecimento a partir de Currículos Lattes. Disponível em:
<http://scriptlattes.sourceforge.net/description.html>. Acesso em: 6 de jun. de 2016
NEGASH, Solomon. Business intelligence. The Communications of the Association for
Information Systems, v. 13, n. 1, p. 54, 2004.
PIATETSKY-SHAPIRO, Gregory; FAYYAD, Usama; SMYTH, Padhraic. From data mining to
knowledge discovery in databases. AI magazine, v. 17, n. 3, p. 37, 1996.
PONNIAH, Paulraj. Data warehousing fundamentals: a comprehensive guide for IT professionals.
John Wiley & Sons, 2004.
18. Referências
SANTIAGO JR, José Renato Sátiro. Gestão do conhecimento. São Paulo: Novatec
Editora, 2004.
STELA. Plataforma Stela Experta .Disponível em:
<http://www.stelaexperta.com.br > Acesso em: 29 fev 2015.
WIIG, Karl M. Knowledge management: an emerging discipline rooted in a long
history. Knowledge horizons: the present and the promise of knowledge
management, p. 3-26, 2000.