Methodological approaches for imputing missing data into monthly flows series

  • Michel Trarbach Bleidorn Departamento de Engenharia Ambiental. Universidade Federal do Espírito Santo (UFES), Avenida Fernando Ferrari, n° 514, CEP: 29075-910, Vitória, ES, Brazil.
  • Wanderson de Paula Pinto Núcleo Integrado de Pesquisa em Engenharia Ambiental. Faculdade da Região Serrana (FARESE), Rua Jequitibá, n° 121, CEP: 29645-000, Santa Maria de Jetibá, ES, Brazil.
  • Isamara Maria Schmidt Departamento de Engenharia Ambiental. Universidade Federal do Espírito Santo (UFES), Avenida Fernando Ferrari, n° 514, CEP: 29075-910, Vitória, ES, Brazil.
  • Antonio Sergio Ferreira Mendonça Departamento de Engenharia Ambiental. Universidade Federal do Espírito Santo (UFES), Avenida Fernando Ferrari, n° 514, CEP: 29075-910, Vitória, ES, Brazil.
  • José Antonio Tosta dos Reis Departamento de Engenharia Ambiental. Universidade Federal do Espírito Santo (UFES), Avenida Fernando Ferrari, n° 514, CEP: 29075-910, Vitória, ES, Brazil.

Resumo

A falta de dados é uma das principais dificuldades no trabalho com registros fluviométricos. As lacunas no banco de dados podem resultar de problemas nos componentes das estações fluviométricas, interrupções no monitoramento e falha dos observadores. A análise de séries incompletas gera resultados incertos, impactando negativamente a gestão dos recursos hídricos. Assim, a consideração adequada dos dados faltantes é muito importante para garantir a qualidade de informação. Este trabalho teve como objetivo analisar, comparativamente, metodologias de imputação de dados faltantes em séries temporais de vazões fluviais mensais, considerando, em um estudo de caso, o Rio Doce, localizado no Sudeste do Brasil. Os dados faltantes foram simulados nas proporções de 5%, 10%, 15%, 25% e 40% seguindo um padrão de distribuição aleatória e ignorando os mecanismos de geração de falhas. Foram utilizadas dez metodologias de imputação de dados faltantes: média aritmética, mediana, regressão linear simples e múltipla, ponderação regional, interpolação spline e Stineman, suavização de Kalman, imputação múltipla e máxima verossimilhança. Seus desempenhos foram comparados por meio dos indicadores viés, raiz do erro quadrático médio, erro absoluto médio percentual, coeficiente de determinação e índice de concordância. Os resultados indicam que para 5% de dados faltantes, qualquer metodologia de imputação pode ser considerada, recomendando cautela na aplicação da média aritmética. No entanto, à medida que a proporção de dados faltantes aumenta, recomenda-se o uso das metodologias imputação múltipla e máxima verossimilhança quando houver estações de suporte para imputação, e os métodos de interpolação Stineman e suavização de Kalman quando apenas as séries estudadas estiverem disponíveis.

Palavras-chave: dados faltantes, imputação, Rio Doce.


Publicado
05/04/2022
Seção
Artigos