Visualização de coleções científicas digitais de biodiversidade: um framework em Altair, Python

Student: 

  • Franklin Alves de Oliveira - candidato ao título de mestre

When: 

30/03/2021 - 15:00

Where: 

Via Zoom https://fgv-br.zoom.us/j/99907432976

Abstract: 

Coleções científicas de biodiversidade têm o compromisso de ser um registro permanente da herança natural, constituídas de espécimes ou objetos relacionados ao seu domínio. Todo material é catalogado, recebendo um número de registro, permitindo que seja incorporado ao acervo. Coleções digitais tipicamente contém uma versão digitalizada dos metadados correspondentes a cada item do inventário e podem, adicionalmente, conter arquivos multimídia tais como textos, registros fotográficos ou outros registros associados ao item, quando pertinente. Garantir a qualidade desses registros é uma tarefa complexa e de fundamental relevância. Fatores como o grande volume de dados e a interdependência entre múltiplas variáveis dificultam determinar até que ponto esses dados estão completos, corretos e se, de fato, fornecem uma boa cobertura geográfica, temporal e taxonômica das espécies correspondentes. Não obstante, garantir a acurácia no registro de espécimes é uma tarefa que se inicia no campo de coleta, passando pelo seu registro, que muitas vezes é escrito em uma folha de papel ou anotado por meio de planilhas e dispositivos eletrônicos, até o processo de tombo do registro na coleção e futura publicação. O presente trabalho propõe a construção de um framework que visa guiar a aplicação de princípios e técnicas de Visualização da Informação ao contexto de coleções científicas digitais de história natural, visando fornecer um conjunto de representações visuais cuja finalidade é a de facilitar a verificação de qualidade dos registros por um especialista. Aliando a flexibilidade da linguagem de programação Python para tratamento de dados e as vantagens de se empregar uma gramática declarativa de gráficos, construiu-se propostas gráficas empregando-se a biblioteca Altair. Tal conjunto de técnicas e propostas gráficas visa atender demandas de especialistas de domínio - curadores e pesquisadores do campo de biodiversidade - fornecendo recursos visuais para a identificação de possíveis inconsistências em suas bases de dados auxiliando, por exemplo, no processo de preparação dos dados para publicação. Com pequenos ajustes, o mesmo conjunto de visualizações também pode servir à finalidade de exibir os dados da coleção em publicações científicas ou diretamente ao público não-especializado.

Texto informado pelo autor.

Thesis Committee: 

  • Asla Medeiros e Sá (orientadora) - FGV EMAp
  • Flávio Codeço Coelho - FGV EMAp
  • Cristiana Silveira Serejo - UFRJ
  • Luiz Gustavo Nonato - USP