Scores¶
Scores de previsão são métricas que quantificam quão bem previsões probabilísticas ou pontuais correspondem aos dados observados. Todos os scores são calculados semanalmente e o valor apresentado no dashboard se refere a média no período analisado.
Para o cálculo do CRPS (Continuous Probability Ranked Score) e do Log Score (score logarítmico) as previsões precisam ser parametrizadas como distribuições de probabilidade. Para o cálculo do dashboard optou-se por parametrizá-las como distribuições log-normais. Detalhes sobre a parametrização estão disponíveis aqui.
MAE - Erro médio absoluto¶
Mede a magnitude absoluta média dos erros nas previsões. Valores menores significam que as previsões estão, em média, mais próximas dos dados reais. É calculado pela expressão abaixo:
na qual, é o número total de semanas analisadas (ou previsões feitas), é o valor real (observado) na semana e é o valor previsto (estimado) para a semana .
MSE - Erro quadrático médio¶
Mede a média dos quadrados das diferenças entre a previsão e a observação. O MSE penaliza mais intensamente os erros maiores. Valores menores significam que as previsões estão, em média, mais próximas dos dados reais. É calculado pela expressão abaixo:
na qual, é o número total de semanas analisadas (ou previsões feitas), é o valor real (observado) na semana e i$.
CRPS - Pontuação de probabilidade ranqueada contínua¶
Mensura o quão bem a função de distribuição acumulada (CDF) prevista corresponde aos dados observados. Valores menores indicam que a distribuição prevista corresponde melhor ao resultado observado. É calculado pela expressão abaixo:
sendo, na qual, é a função de distribuição acumulada da distribuição normal padrão e , em que são os dados observados na semana , e e são os parâmetros da ditribuição log-normal na semana . Detalhes sobre como os parâmetros da distribuição são obtidos estão disponíveis aqui.
Log Score - Pontuação logarítmica¶
Mensura o log da probabilidade atribuída ao valor observado pela distribuição prevista. Valores maiores indicam que a distribuição prevista corresponde melhor ao resultado observado. É calculado pela expressão abaixo:
sendo,
na qual, são os dados observados na semana , e e são os parâmetros da ditribuição log-normal na semana . Detalhes sobre como os parâmetros da distribuição são obtidos estão disponíveis aqui.
Interval Score¶
Na análise da performance das previsões avalia os intervalos de previsão. No dashboard são utilizados os intervalos de 90% das previsões. Valores menores significam que as previsões estão, em média, mais próximas dos dados reais. É calculado pela expressão abaixo:
sendo,
na qual é a função indicadora (tem valor 1 se a condição é verdadeira, e 0 caso contrário), é o nível de significância do intervalo, é o limite superior do intervalo na semana , e o limite inferior.