O documento discute a criação de um armazém de dados para armazenar informações coletadas de cursos online na UFMG, como cliques no Moodle e notas, para auxiliar na melhoria dos cursos. O armazém de dados usará o modelo dimensional em esquema de estrela e incluirá datamarts para cada processo de negócio, como resultados de avaliações, com dimensões compartilhadas entre eles. O próximo passo é concluir o modelo dimensional e definir a ferramenta, preferencialmente o Pentaho,
1. Armazém de Dados como
Suporte a Ações de Melhoria
em Cursos com Presença
Online
Aluno: Henrique Chevreux Oliveira Coelho Dias
Orientador: Prof. Osvaldo Sérgio Farhat de Carvalho
Co-orientador: Edré Quintão Moreira
UFMG :: ICEx :: DCC – Projeto Orientado em Computação I
2. Motivação
• Uso crescente de ferramentas online de suporte ao ensino
• Na UFMG cada vez mais disciplinas as usam efetivamente
• Algumas para quase todas tarefas do semestre
• DCC001 - Programação de Computadores:
° uso intensivo do Moodle + 300 alunos
° = muita fonte de dados!
• Além dos cliques, dados provém do cadastro do aluno, de
notas em avaliações, etc.
• Como utilizar esses dados de forma a melhorar o curso?
2
3. Objetivos
• Esses dados podem ajudar a responder perguntas como:
° quais alunos acessam o material antes das aulas?
° quando um aluno está prestes a abandonar a disciplina?
° quais práticas são feitas com mais facilidade/dificuldade?
° relação (desempenho tarefas semanais) X (desempenho
em provas)
• para tal os dados devem ser “separados e combinados” da
forma mais flexível e eficiente possível
• Armazém de Dados(Data Warehouse) é a solução natural
3
4. Armazém de Dados
• Sistema de armazenamento de informações com foco em
° facilidade de compreensão e utilização
° eficiência em consultas a grandes bases de dados
° suporte à tomada de decisões
° flexibilidade quanto às consultas efetuadas
• Difere de Bancos de Dados operacionais em que o foco seria
nas operações de inclusão, alteração e exclusão
• BDs tradicionais permitem apenas consultas pré-definidas
• O modelo mais usual para implementação de ADs é a
Modelo Dimensional em Esquema Estrela
4
7. Fonte de Dados
• Registros do Moodle
• LCC
• Versão do MySQL do LCC não oferece suporte a Views.
° Alternativa: exportar para MS Excel.
° ETL(Extract Transform Load): Conversões Iniciais: MS
Excel -> CSV -> SQL
• Fonte de dados contém informações de:
° Data, hora;
° Usuário: login, turma, número de matrícula;
° Avaliação;
° Nota
7
8. Data Warehouse composto de
Data Marts
• Cada processo de negócio como um data mart
• Dimensões de conformidade para serem reutilizadas em
distintos datamarts
8
9. Matriz de Barramento do DW
• Dimensões em conformidade em comum nos processos
analisados
9
11. Próximos Passos
• Conclusão do estudo da literatura:
° The Data Warehouse Toolkit(Ralph Kimball e Margy Ross)
° Data Webhose(Ralph Kimball e Richard Merz)
° Building The Data Warehouse(William H. Inmon)
• Conclusão do modelo:
° Matriz de barramento do DW(processos e dimensões de
conformidade)
° Datamarts individuais e atributos descritivos de cada
dimensão
• Definição da ferramenta a ser utilizada:
° Por enquanto preferência pelo Pentaho, mas outras
também estão sendo avaliadas
11