Transcrição, alinhamento e criação de legendas em uma base de História Oral

Aluno(a): 

  • Lucas Meireles Tomaz de Alvarenga

Data: 

20/05/2019 - 15:00

Local: 

Sala de Reunião - EMAp (5º andar)

Resumo: 

Dado a evolução da tecnologia relacionada a Reconhecimento de Áudio, nos é permitido criar ferramentas que automatizem processos que somente eram possíveis serem feitos por humanos, se quiséssemos ter uma boa qualidade no resultado. Sendo assim, o objetivo desse trabalho é pesquisar a literatura em reconhecimento automático de áudio e utilizar esse conhecimento para criar ferramentas que auxiliem o Centro de Pesquisa e Documentação de História Contemporânea do Brasil (CPDOC) com o projeto de História Oral. Após um estudo sobre as principais técnicas na área de reconhecimento automático de áudio, foi decidido utilizar um software proprietário para a transcrição automática de áudio das entrevistas que populam o banco de dados de História Oral. Com a transcrição automática, utilizamos uma variação do algoritmo de Neddleman-Wunsch para alinharmos essa transcrição com a transcrição manual, possibilitando a criação de legendas com um texto mais correto do que seria possível somente com a transcrição automática. Concluímos que transcrições automáticas podem ser utilizadas no contexto de História Oral, que é possível alinhar textos utilizando o algoritmo de Neddleman-Wunsch e dado esse alinhamento é possível criar uma legenda, que a perda de sincronia entre o áudio e o texto não impossibilita o uso da mesma.

*Texto enviado pelo aluno. 

Membros da banca: 

  • Moacyr Alvim Horta Barbosa da Silva (orientador) - FGV EMAp
  • Paulo Cezar Pinto Carvalho - FGV EMAp
  • Vivian Luiz Fonseca - FGV CPDOC
  • Alexandre Evsukoff - UFRJ