Um breve passeio pela Estatística em alta dimensão

Quem: 

Hugo Carvalho (UFRJ)

Onde: 

Praia de Botafogo, 190 - sala 537

Quando: 

12 de Setembro de 2019 às 16h

Com o avanço na facilidade de coleta de dados através de mecanismos físicos cada vez mais sofisticados (e.g., máquinas de ressonância magnética, facilidades em sequenciamento genético, grandes telescópios, aceleradores de partículas), nos deparamos com um novo paradigma na Estatística. No cenário clássico onde temos n >> p (i.e., muito mais amostras do que parâmetros a serem estimados), tarefas como estimação de matrizes de covariância, regressão linear e PCA são garantidas de ter um bom desempenho através dos teoremas limite usuais da literatura de Teoria de Probabilidades. Porém, no novo cenário onde p é comparável a n ou p > n, os mesmos métodos e garantias de convergência no caso clássico não são mais aplicáveis; em particular, não podemos mais recorrer a resultados assintóticos. Esse segundo cenário é conhecido atualmente na literatura como "Estatística em alta dimensão".

O objetivo dessa apresentação é ilustrar alguns problemas nesse cenário e como contorná-los, a fim de motivar o estudo dessa moderna e fascinante área da Estatística, bastante em alta no momento e extremamente importante para a compeensão de aspectos tanto teóricos quanto práticos de Ciência de Dados. Para isso, iremos começar abordando o clássico problema de regressão linear, e estudaremos o seu comportamento a medida que o número de variáveis explicativas aumenta. De brinde, no meio do caminho, aprenderemos aspectos geométricos bastante não intuitivos em espaços de alta dimensão.

*Texto informado pelo autor. 

Palestrante: 

Hugo Carvalho tem Graduação (2011) e Mestrado (2013) em Matemática Aplicada e Doutorado em Engenharia Elétrica (2017), todos pela UFRJ, sendo sua tese em aplicação de métodos Bayesianos em restauração de gravações de áudio degradadas. Desde 2017 é professor do Departamento de Métodos Estatísticos do Instituto de Matemática da UFRJ, e tem interesse especial na área de recuperação de informações musicais (music information retrieval, MIR, em Inglês), bem como em temas de Estatística Computacional e Ciência de Dados.