Aquisição de Dados, Pré-Processamento de dados: Limpeza, Beneficiamento, Armazenamento em Banco de Dados. Estruturas de Dados para Data Science. Descrição estatística e visualização de Dados. Dados estruturados e não estruturados: análise de textos, imagens, grafos, dados geoespaciais, redes sociais. Análise Exploratória. Tratamento de dados faltantes e outliers. Modelagem e engenharia de features. Balanceamento de datasets, validação cruzada. Algoritmos de Aprendizado de Máquinas: Não-supervisionados (Redução de Dimensionalidade e Clustering) e Supervisionados (Regressão e Classificação). Modelos Lineares, Modelos Bayesianos, Mistura de Gaussianas, kNN, Árvore de Decisão, Ensemble, Algoritmos Genéticos, Introdução à Redes Neurais.
Informações Básicas
Obrigatória:
- Provost Foster, Fawcett Tom. Data Science para Negócios. O que Você Precisa Saber Sobre Mineração de Dados e Pensamento Analítico de Dados. 2016.
- Wes McKinney. Python for Data Analysis O'Reilly Media.
- Dean Abbott. Applied Predictive Analytics: Principles and Techniques for the Professional Data Analyst
Complementar:
- Carvalho, André Carlos Ponce de Leon Ferreira de; Faceli, Katti; Lorena, Ana Carolina; Gama, João. Inteligência Artificial - Uma Abordagem de Aprendizado.
- O'Neil, Cathy. Rachel Schutt. Doing Data Science. O'Reilly Media, Inc. 2013.
- The Scipy community. Numpy Manual. 2017 <https://docs.scipy.org/doc/numpy-1.13.0/contents.html>
- Dan Saber. A Dramatic Tour through Python’s Data Visualization Landscape (including ggplot and Altair) <https://dsaber.com/2016/10/02/a-dramatic-tour-through-pythons-data-visualization-landscape-including-ggplot-and-altair/>
- Jupyter Team. The Jupyter notebook User Documentation. <https://jupyter-notebook.readthedocs.io/en/stable/>