23

Fev

2018
Eventos Nacionais

1º The Mathematics of Data Science

Horário
14h00 - 17h30
Local
Sede FGV - 4º andar

Sobre o Evento

O objetivo desta série de workshops é reunir acadêmicos e profissionais para discutir avanços metodológicos e problemas pendentes no campo da ciência de dados. Como um tema fundamentalmente interdisciplinar, pesquisadores de áreas como matemática, estatística e ciência da computação serão convidados a falar, ao lado de profissionais de diferentes áreas.

Esta série de workshops é dirigida a um grande público de acadêmicos e profissionais interessados ​​em compreender os fundamentos matemáticos do campo de rápida evolução da ciência de dados.

 

Programação

Os resumos podem ser encontrados aqui.

Eduardo Mendes (FGV) 15:00-15:30 Leonardo Bastos (Fiocruz) 15:30-16:00 Michael Jordan (UC Berkeley) 16:00-17:00 Coffee Break 17:00-18:00

Palestrantes

Pierre del Moral

INRIA

Sobre a estabilidade e a propagação uniforme das propriedades do caos de filtros de conjunto Kalman-Bucy

O filtro Ensemble Kalman é um método sofisticado e poderoso de assimilação de dados para filtrar problemas dimensionais elevados que surgem na mecânica dos fluidos e nas ciências geofísicas. Este método de Monte Carlo pode ser interpretado como uma interpretação de partículas do tipo McKean-Vlasov de campo médio das difusões de Kalman-Bucy. Além de alguns avanços recentes na estabilidade de difusões não lineares do tipo Langevin com interações de deriva, o comportamento de longo prazo de modelos com matrizes de difusão em interação e funções de interação de distribuição condicional nunca foi discutido na literatura. Uma das principais contribuições da palestra é iniciar o estudo dessa nova classe de modelos. A palestra apresenta uma série de novas desigualdades funcionais para quantificar a estabilidade desses processos de difusão não linear. A segunda contribuição desta palestra é fornecer propagação uniforme das propriedades do caos, bem como estimativas de erro médio Lp w.r.t. o horizonte de tempo.

Rentato Rocha

FGV

 

A indústria de contencioso do consumidor: perseguindo dragon kings em redes advogado-cliente

A comunidade jurídica e seus clientes formam uma rede contínua e bidirecional que se desenvolve naturalmente como resultado do processo de recomendação por meio do qual os advogados formam sua base de clientes. Este processo é um exemplo de engajamento preferencial em que advogados com mais clientes são mais propensos a serem recomendados para novos clientes. O contencioso do consumidor é um mercado importante para os advogados. Nas grandes sociedades de consumo, sempre há um número significativo de disputas de consumo que chegam aos tribunais. Neste artigo, analisamos um conjunto de dados de milhares de ações judiciais, reconstruindo a rede advogado-cliente embutida nos dados. Analisando o grau de distribuição desta rede, notamos que segue-se o de uma rede fora da escala construída por ligação preferencial, mas para alguns advogados com uma base de clientes muito maior do que seria de esperar por ligação preferencial. A propósito, a maioria deles também constava de uma lista elaborada por profissionais do direito que anunciavam abertamente os benefícios do contencioso do consumidor. De acordo com o código de ética de sua profissão, os advogados não devem incentivar os clientes a entrar em litígio, mas isso não é estritamente ilegal. Do ponto de vista da formação da rede, essa estimulação pode ser vista como um mecanismo de crescimento separado do que apenas o acessório preferido. Neste artigo, constatamos que esse crescimento composto pode ser detectado por um simples teste estatístico, pois as simulações mostram que os advogados que utilizam os dois mecanismos rapidamente se tornam os “reis dragão” da distribuição do número de clientes por advogado.

Marcelo Medeiros

PUC-Rio

Estimativas de aprendizado de máquina de efeitos de tratamento heterogêneo em dados agregados e dimensões elevadas

Consideramos um método novo, flexível e fácil de implementar para estimar os efeitos causais heterogêneos de intervenções em um pequeno grupo de unidades tratadas em uma estrutura onde um grupo de controle confiável não está prontamente disponível. Propomos uma metodologia de duas etapas em que, no primeiro estágio, um contrafactual é estimado com base em um conjunto de variáveis ​​de grande dimensão de um pool de unidades não tratadas por meio de métodos de aprendizado de máquina, como florestas aleatórias (RF), pelo menos absoluto operador de redução e seleção (LASSO) ou regressão completa de subconjunto (CSR). No segundo estágio, estimamos os efeitos médios de intervenção em um vetor de variáveis, que são consistentes e assintoticamente normais. Como aplicação, estimamos a elasticidade-preço da demanda para um grupo de produtos de uma grande rede varejista no Brasil. Nossas estimativas são segregadas por regiões diferentes e mostramos que existe uma grande heterogeneidade no comportamento do consumidor entre as diferentes regiões do país. Trabalho conjunto com Yuri Fonseca (Instituto Militar de Engenharia) e Ricardo P. Masini (Escola Paulista de Economia FGV).

Reinaldo Marques

Unifal

 

Aproximação funcional do caminho de partículas em tempo real para grandes conjuntos de dados

A era digital explora uma série de aplicações nas quais a inferência em tempo real é necessária, inclusive nos setores de seguros e riscos financeiros. Em particular, a previsão de estados latentes de modelos de espaço de estado geral é uma tarefa desafiadora bem conhecida, mas os algoritmos de partículas têm se mostrado bem-sucedidos em uma variedade de aplicações. A previsão de funções de toda a sequência de variáveis ​​latentes, denominadas funcionais de caminho, pode ser de interesse em si, mas também são elementos cruciais quando a estimativa de parâmetros estáticos é necessária. A inferência online de funções de caminho usando filtros de partículas tem se mostrado uma tarefa computacional muito mais difícil, principalmente devido a problemas de degeneração de caminho para grandes conjuntos de dados. Neste trabalho, apresentamos aproximações de bloqueio de partículas para mitigar a degenerescência do caminho quando temos acesso ao uso de funcionais recursivos após a coleta de uma grande quantidade de dados. Também fornecemos ilustrações para estimar os funcionais de caminho e para o aprendizado online de parâmetros Bayesianos.

Carlos Eduardo Mello

Unirio

Aprendizagem ativa: uma abordagem imparcial

Nesta palestra, discutimos o problema de Aprendizagem Ativa, que consiste fundamentalmente em selecionar um número limitado de instâncias a serem rotuladas para uma tarefa de aprendizagem supervisionada posterior. A principal questão com relação ao Active Learning é, portanto, encontrar um bom compromisso entre o custo de aquisição do rótulo e a precisão resultante do modelo de aprendizagem. Apresentamos brevemente alguns dos trabalhos mais importantes da literatura e também descrevemos uma nova abordagem baseada na ideia de reduzir o viés de amostragem. Uma aplicação para sistemas de recomendação é descrita e algumas questões de pesquisa são discutidas.

Local

Sede FGV - 4º andar

Auditório 415

Praia de Botafogo, 190

Botafogo - Rio de Janeiro/RJ

Endereço

Auditório 415

Praia de Botafogo, 190

Botafogo - Rio de Janeiro/RJ