Este curso apresenta as técnicas fundamentais de processamento de linguagem natural e de sistemas de recuperação de informação. Tem como objetivo explicar o potencial e as principais limitações destas técnicas. Alguns problemas de pesquisa atuais são introduzidos e algumas aplicações discutidas e avaliadas. Os alunos também serão apresentados à tarefas prática em processamento de linguagem natural.
Introdução à PLN; morfologia de estados finitos; part-of-speech tagging; gramáticas; estruturas de dependências; semântica composicional e semântica lexical; semântica distribucional;; pesquisas em PLN.
Recuperação de Informação; construção de índices; avaliação da recuperação: precisão e revocação, coleções de referência; consultas: consultas lógicas, consultas ordenadas por relevância, estruturas de acesso ao vocabulário, busca sequencial no vocabulário, busca exata e aproximada.
Informações Básicas
Obrigatória:
- Croft, W. B., Metzler, D., & Strohman, T. (2009). Search Engines: Information Retrieval in Practice (1 ed.). Addison Wesley.
- Ingwersen, P., & Järvelin, K. (2005). The Turn: Integration of Information Seeking and Retrieval in Context. Springer.
- Manning, C. D., Raghavan, P., & Schütze, H. (2008). Introduction to Information Retrieval. Cambridge University Press.
Complementar:
- Steven Bird, Ewan Klein and Edward Loper. Natural Language Processing with Python. O’Reilly. 2009
- Nitin Indurkhya and Fred J. Damerau. Handbook of Natural Language Processing, Second Edition. Chapman & Hall/CRC. 2010
- Baeza-Yates, R., & Ribeiro-Neto, B. (1999). Modern Information Retrieval. Addison Wesley.
- Alexander Clark and Chris Fox. The Handbook of Computational Linguistics and Natural Language Processing. Wiley 2012
- Matthew Honnibal and Patrick Harrison. Deep Learning with Text: A Modern Approach to Natural Language Processing with Python and Keras. O’Reilly, 2018