Conversão de áudio para texto no desenvolvimento de software
1. ESTADO DE MATO GROSSOFACULDADE DE CIÊNCIAS EXATASUNIVERSIDADE DO ESTADO DE MATO GROSSOCAMPUS UNIVERSITÁRIO DEP. EST. RENÊ BARBOURDEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software Acadêmico: Lenin Ernesto Abadié Otero Orientador: Prof. M.Sc. Fernando Selleri Silva Barra do Bugres - Julho de 2010
2. OBJETIVO Estudar as ferramentas ou softwares que permitam a conversão de áudio para texto com a finalidade de facilitar a documentação dos requisitos coletados durante o processo de desenvolvimento de software. 2 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software
3. PROBLEMA Como as ferramentas ou softwares que permitem a conversão de áudio para texto podem contribuir com a documentação de reuniões realizadas durante o processo de desenvolvimento de software? 3 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software
4. Principais Autores ABRAHAMSSON, Pekka; SALO, Outi; RONKAINEN, Jussi; WARSTA, Juhani. Agile Software Development Methods: Review and Analysis. VTT Publications 478. Oulu, Finland: VTT Publications, 2002. PETERS, James F.; PEDRYCZ, Witold. Engenharia de Software: Teoria e Prática, 3ª Impressão. Rio de Janeiro: Elsevier, 2001. RABINER, Lawrence; JUANG, Biing-Hwang. Fundamentals of Speech Recognition.Prectince-Hall International, Inc. EUA, 1993. SOMMERVILLE, Ian. Engenharia de Software, Tradução Andre Mauricio Andrade, São Paulo: Addison Wesley, 2003. 4 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software
5. MOTIVAÇÃO Conhecer e estudar os diferentes softwares de conversão ou transcrição de áudio para texto e descobrir qual destes se adéqua melhor na utilização da geração da documentação dos requisitos durante o processo de desenvolvimento de software. 5 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software
6. ESTRUTURA Introdução Capítulo I: Processos de Desenvolvimento de Software Capítulo II: Reconhecimento de Voz Capítulo III: Conversão de Áudio para Texto Considerações Finais 6 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software
7. Processo de Desenvolvimento de Software CAPÍTULO I 7 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software
8. Processos Aplicados ao Software Auxiliam a competitividade, qualidade e produtividade sistemática do software. Processo de Desenvolvimento de Software Fases durante o desenvolvimento de software (IEEE 1074-1995): De requisitos: o que o software deve fazer. De projeto: como serão estabelecidas estruturas e funções do sistema. De implementação: produção das linhas de comando. 8 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software
9. Metodologias de Desenvolvimento de Software Disciplinas com a finalidade de produzir diversos modelos do sistema . Metodologias Tradicionais Rigorosas: exatidão nas premissas e propostas, documentação detalhada. Pesadas: grande quantidade de documentos. 9 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software
10. Metodologias de Desenvolvimento de Software (Cont.) Modelo Clássico Conjuntos de passos sequenciais a serem seguidos. Figura 1 – Estágios do Modelo Clássico ou Cascata Fonte: Extraído de Sommerville (2003) 10 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software
11. Metodologias de Desenvolvimento de Software (Cont.) RationalUnifiedProcess(RUP) Abordagem disciplinada de atribuir tarefas e responsabilidades. Figura 2 – Ciclo de construção de uma versão usando o Modelo RUP Fonte: Adaptado de Kruchten (2003) 11 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software
12. Metodologias de Desenvolvimento de Software (Cont.) Metodologias Ágeis Efetuado de forma: Incremental; Colaborativa; Direta; Adaptativa. 12 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software
13. Metodologias de Desenvolvimento de Software (Cont.) Extreme Programming(XP) Equipes pequenas e médias, requisitos vagos. Figura 3 – Ciclo de Vida da Metodologia XP Fonte: Extraído de Abrahamsson et al. (2002) 13 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software
14. Metodologias de Desenvolvimento de Software (Cont.) Scrum Produzir um sistema flexível, num ambiente propenso a mudanças. Existem reuniões diárias de acompanhamento. 14 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software
15. Levantamento de Requisitos Descobrir as propriedades da aplicação, restrições, desempenho exigido para o bom funcionamento do sistema. Métodos utilizados: Levantamento Orientado a Pontos de Vista. Brainstorming. JoinAplication Design (JAD). Entrevistas. 15 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software
16. Reconhecimento de Voz CAPÍTULO II 16 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software
17. Introdução ao Reconhecimento de Voz O reconhecimento de voz é uma importante área de aplicação de reconhecimento de padrões. 17 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software
18. Breve Histórico do Reconhecimento de Voz 1950 - Primeiro esforço para arquitetar um sistema de reconhecimento de voz. 1960 – As estratégias de reconhecimento de voz baseavam-se na segmentação do sinal acústico em fonemas. Década de 1970, surgiu o DTW, protótipo predominador para reconhecimento de fala. Dynamic Time Warping: Técnica para reconhecimento de padrões de voz. 18 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software
19. Breve Histórico do Reconhecimento de Voz (Cont.) 19 Em 1980 com o surgimento de inovações tecnológicas, o reconhecimento de voz ganhou força. Aparecimento das redes neurais artificiais. Da década de 1990 até a atualidade, procura-se aperfeiçoar os estudos de reconhecimento de voz. Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software
20. Sistemas de Reconhecimento de Voz 20 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software * FC: Fala Contínua DL: Dependente do Locutor PI: Palavras Isoladas DL : Dependente do Locutor Segundo Martins (1997) e Braga (2006) .
21. Sistemas de Reconhecimento de Voz (Cont.) 21 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software * FC: Fala Contínua DL: Dependente do LocutorPI: Palavras Isoladas DL : Dependente do Locutor Segundo Martins (1997) e Braga (2006) .
22. Tipos de Sistemas de Reconhecimento de Voz De Acordo com o Tipo de Enunciado Reconhecedor de palavras isoladas. Reconhecedor de palavras conectadas. Reconhecedor de fala contínua. De Acordo com o Grau de Dependência do Locutor Dependente do locutor. Independente do locutor. 22 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software
23. Método Acústico-Fonético Identificar as unidades fonéticas da fala e após a concatenação destas, reconhecer a fala. Método de Reconhecimento de Padrões Sistemas treinados para reconhecer características específicas. Método de Inteligência Artificial Compilação e incorporação de uma multiplicidade de fontes de conhecimento para a solução do problema em mão. Métodos de Reconhecimento de Voz 23 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software
24. Dificuldades em Reconhecimento de Voz Segundo Furui (2001): Coarticulação e redução de problemas: o espectro de um fonema é influenciado por fonemas próximos. Dificuldades na segmentação: não se tem uma forma de restrição dos fonemas. Individualidade e outros problemas de variação: As características mudam de locutor para locutor. Conhecimento linguístico insuficiente: quando as características físicas de fala não carregam suficiente informação fonética. 24 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software
25. Conversão de Áudio para Texto CAPÍTULO III 25 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software
26. Softwares de Conversão de Áudio para Texto WavetoText Research Lab. Inc. Beneficios: Simplifica e otimiza o trabalho economizando tempo; Suprime a necessidade de digitar discussões anotadas, comentários e memorandos; Converte suas mensagens de voz em texto; Figura 4 – Barra de opções do WavetoText v. 5.2 26 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software
32. Usabilidade dos Softwares na Coleta de Requisitos (Cont.) 29 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software Figura 8 – Janela para Conversão de Áudio para Texto
33. Usabilidade dos Softwares na Coleta de Requisitos (Cont.) IBM ViaVoice 30 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software Figura 9 – Janela do IBM ViaVoice integrada ao Microsfot Word
34. Resultados Obtidos WavetoText Total de palavras faladas: 121 Convertidas Corretamente: 35 Gráfico 1 – Resultados dos testes de usabilidade do WavetoText 31 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software
35. Resultados Obtidos (Cont.) IBM ViaVoice Total de palavras faladas: 150. Transcritas corretamente: 131 palavras. Gráfico 2 – Resultados do Teste de Usabilidade do IBM ViaVoice 32 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software
36. Considerações Finais Contribuição Dificuldades encontradas Trabalhos futuros 33 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software
37. 34 Conversão de Áudio para Texto Aplicada ao Desenvolvimento de Software Perguntas?