Essa é uma matéria expositiva que tem como objetivo apresentar os conceitos fundamentais da Análise Exploratória – permitindo assim a compreensão das principais ferramentas matemáticas e estatísticas utilizadas na compreensão e análise de conjuntos de dados – e os principais conceitos da Visualização de Dados – de modo a desenvolver a capacitação para a construção de bons gráficos, tanto exploratórios como explicativos/comunicativos. Nesse sentido, a matéria irá cobrir os seguintes tópicos: Tipos de variáveis. Principais medidas de centralidade e dispersão. Limpeza de dados, dados faltantes, outliers. Estatísticas descritivas. Teste de hipótese. Clusterização: k-means e clustering hierárquico. Tipos de gráficos. Gráficos interativos. Princípios de design e apresentação de resultados. Ferramentas: R: ggplot2, ggthemes, esquisse. Python: matplotlib, plotly, seaborn, e bokeh Tableau e Power BI.
Informações Básicas
Obrigatória:
- Tukey, J. Exploratory Data Analysis. Pearson. 1977
- Wes McKinney. Python Data Analysis, O’Reilly. 2017
- Cole Nussbaumer Knaflic. Storytelling with Data: A Data Visualization Guide for Business Professionals. Wiley, 2015
Complementar:
- Philipp K. Janert. Data Analysis with Open Source Tools: A Hands-On Guide for Programmers and Data Scientists. O’Reilly, 2011.
- Osvaldo Martin. Bayesian Analysis with Python. Packt. 2016
- Shai Vaingast. Beginning Python Visualization: Crafting Visual Transformation Scripts. Apress. 2014.
- Petrou, Theodore. Pandas Cookbook: Recipes for Scientific Computing, Time Series Analysis and Data Visualization
- Rossant, Cyrille. IPython Interactive Computing and Visualization Cookbook