Detalhes
Aproximação Paramétrica das Previsões¶
As previsões do Mosqlimate podem fornecer quantis correspondentes à mediana e aos intervalos de predição de 50%, 80%, 90% e 95%. Para obter uma distribuição preditiva completa a partir desses quantis, ajustamos uma distribuição log-normal utilizando estimação por correspondência de quantis (quantile-matching estimation).
Seja
o vetor dos níveis de probabilidade acumulada associados aos quantis disponíveis, e seja
o vetor dos valores previstos correspondentes. Nosso objetivo é estimar os parâmetros de uma distribuição log-normal cujos quantis teóricos melhor correspondam aos quantis previstos.
Assuma que
Então,
Para um determinado nível de probabilidade , o quantil teórico correspondente satisfaz
onde
e denota a função distribuição acumulada inversa (função quantil) da distribuição normal padrão.
Aplicando logaritmo em ambos os lados, obtemos
Portanto, estimar uma distribuição log-normal a partir de um conjunto de quantis previstos pode ser formulado como um simples problema de regressão linear:
onde:
- é a variável resposta;
- é a variável preditora;
- o intercepto estima ;
- a inclinação estima .
Os parâmetros podem então ser estimados utilizando mínimos quadrados ordinários. Seja
e definam-se, sendo o número de quantis,
onde representa o número de quantis disponíveis. As estimativas de mínimos quadrados são
e
Substituindo , obtemos
e
Antes do IMDC 2025¶
Antes do IMDC 2025, as previsões forneciam apenas três quantidades: a previsão mediana (pred) e os limites inferior e superior do intervalo de predição de 90%. A distribuição log-normal era então reconstruída utilizando o procedimento descrito abaixo.
Um método de otimização numérica é aplicado para determinar a média () e a variância () de uma distribuição log-normal com base nas previsões registradas na plataforma, com o objetivo de calcular métricas de avaliação (scoring metrics). O método utiliza a mediana e os limites inferior e superior do intervalo de predição de 90%.
Para os casos em que , o problema de otimização é formulado como:
onde e são, respectivamente, a mediana e o limite superior do intervalo de predição de 90% de uma distribuição log-normal com parâmetros e . Além disso, é a mediana prevista registrada na plataforma e é o limite superior do intervalo de predição de 90% da previsão submetida.
Para o caso específico em que , o problema de otimização é definido como: