Análise lexicográfica da produção acadêmica da Fiocruz: uma proposta de metodologia

Aluno(a): 

  • Jefferson da Costa Lima

Data: 

09/09/2016 - 10:00

Local: 

Praia de Botafogo, 190, auditório 913 - Rio de Janeiro, RJ

Resumo: 

Com o objetivo de atender às demandas de saúde da população, uma quantidade enorme de publicações são geradas a cada ano. Artigos científicos, teses e dissertações tornam-se digitalmente disponíveis, mas torná-los acessíveis aos usuário exige a compreensão do processo de indexação, que em geral é feito manualmente. O presente trabalho propõe um experimento sobre a viabilidade de identificar automaticamente descritores válidos para documentos do campo da saúde. São extraídos ngrams dos textos e, após comparação com termos do vocabulário Descritores em Ciências da Saúde (DeCS), são identificados aqueles que podem atuar como descritores para as obras. Acreditamos que este processo pode ser aplicado na classificação de conjuntos de documentos com deficiências na indexação e, até mesmo, no apoio a processos de reindexação, melhorando a precisão e a revocação das buscas, além da possibilidade de estabelecer métricas de relevância.

*Texto enviado pelo aluno. 

Membros da banca: 

  • Renato Rocha Souza (orientador) – FGV/EMAp
  • Moacyr Alvim Horta - FGV/EMAp
  • Marcel de Moraes Pedroso - FIOCRUZ