Introdução à Programação e Ciência de Dados

Desenvolvimento de soluções em Python: Aplicação prática para análise, modelagem e manipulação de dados; Utilização de bibliotecas essenciais em Python: Exploração dos principais módulos para análise e visualização de dados, como NumPy, SciPy, Matplotlib, ggplot2, Pandas e QuantLib, entre outros; Computação paralela e distribuída: Introdução aos conceitos e técnicas de computação paralela e distribuída para otimização de processos; Computação em nuvem: Conceitos fundamentais sobre a utilização de ambientes de computação na nuvem; Banco de dados e SQL: Fundamentos de bancos de dados relacionais e linguagem SQL, com foco em consultas, manipulação e integração de dados; Versionamento com Git/GitHub: Introdução ao uso de sistemas de controle de versão para gestão de projetos de desenvolvimento, incluindo práticas com Git e GitHub; Visualização de dados e dashboards: Técnicas de visualização eficaz de dados, utilizando ferramentas como Matplotlib, Plotly e Dash, com foco na criação de gráficos e dashboards interativos.

Bibliografia:

  • MCKINNEY, W. (2012). Python for data analysis: Data wrangling with Pandas, NumPy, and IPython. O'Reilly Media.
  • MURRAY, S. (2017). Interactive data visualization for the web: An introduction to designing with D3. O'Reilly Media.
  • CHACON, S., & STRAUB, B. (2014). Pro Git. Springer Nature.
  • BEAULIEU, A. (2009). Learning SQL: Master SQL fundamentals. O'Reilly Media.
  • HWANG, K., FOX, G., & DONGARRA, J. (2013). Distributed and cloud computing: From parallel processing to the internet of things. Morgan Kaufmann.
A A A
High contrast