Análise Preditiva de Churn com ênfase em técnicas de Machine Learning: Uma Revisão

Aluno(a): 

  • Pedro Henrique Schneider

Data: 

27/07/2016 - 14:00

Local: 

Praia de Botafogo, 190, auditório 317 - Rio de Janeiro, RJ

Resumo: 

Nas últimas duas décadas, o crescimento da internet e suas tecnologias associadas, vêm transformando a forma de relacionamento entre as empresas e seus clientes. Em geral, a aquisição de um novo cliente custa muito mais caro para uma empresa que a retenção do mesmo. Desta forma, estudos de retenção de clientes, ou gerenciamento do Churn, se tornaram mais importantes para as empresas. O presente trabalho consiste na revisão e classificação da literatura sobre aplicações de técnicas com ênfase em Machine Learning para construir modelos preditivos de perda de clientes, também chamada de Churn. O objetivo do trabalho foi reunir o maior número possível de documentos sobre o assunto, dentro da metodologia proposta, e classificação quanto as areas de aplicação, ano de publicação, técnicas de Machine Learning aplicadas, periódicos e repositórios utilizados, nível de influência dos documentos e desta forma trazer a luz os estudos já existentes nesse campo de atuação, consolidando o que há do estado da arte em pesquisas desta area, e de forma significativa contribuir como uma referência para futuras aplicações e pesquisas nesta area. Embora o trabalho não tenha sido o primeiro na literatura de Machine Learning relacionado a perda ou retenção de clientes na linha de revisão literária, foi o primeiro encontrado com foco em documentos que estudam, não exclusivamente, a perda ou retenção de clientes por técnicas de Machine Learning e sem nenhum tipo de restrições. Da mesma forma foi o primeiro a classificar os documentos por influência através das citações entre os documentos. Assim, como base final para o trabalho, analisou-se 80 documentos, onde foram encontradas como principais areas de aplicações: Telecomunicações, Financeiras, Jornais, Varejo entre outras. Constataram-se como técnicas de Machine Learning mais utilizadas para o problema em questão: Regressão Logística, Arvores de Decisão e Redes Neurais, entre outras. E ainda, de acordo com os resultados obtidos, notou-se que ano 2000 tende a ser um marco para esta pesquisa, pois foi a data mais antiga para a qual foi encontrado um artigo nesse trabalho.

*Texto enviado pelo aluno. 

Membros da banca: 

  • Renato Rocha Souza (orientador) – FGV/EMAp
  • Antônio Carlos Saraiva Branco – FGV/EMAp
  • Moacyr Alvim Horta – FGV/EMAp
  • Alexandre Evsukoff (membro externo) – UFRJ