Híbrido a memória de longo e curto prazo com algoritmo de otimização de baleia e decomposição de modo variacional para estimativa mensal de evapotranspiração
Nov 17, 2023
A sustentabilidade da vegetação artificial ligada à areia é determinada pelo balanço hídrico entre a evapotranspiração (ET) e a precipitação nas regiões desérticas. Consequentemente, estimar com precisão a ET é um pré-requisito crítico para determinar os tipos e a distribuição espacial da vegetação artificial nas diferentes áreas arenosas. Para este propósito, um novo modelo de estimativa híbrido foi proposto para estimar ET mensal, acoplando a memória de longo prazo de aprendizagem profunda (LSTM) com decomposição em modo variacional (VMD) e algoritmo de otimização de baleia (WOA) (ou seja, VMD-WOA-LSTM) para estimar o ET mensal nas margens sudeste do deserto de Tengger.
Nos últimos anos, muitos relatos sobre alienígenas e OVNIs não apenas despertaram a curiosidade e o entusiasmo das pessoas, mas também despertaram a admiração e o desejo das pessoas de explorar a vida extraterrestre.
Um dos temas que tem atraído muita atenção é o nível de inteligência dos alienígenas. Muitas pessoas acreditam que os alienígenas têm uma inteligência que excede em muito a dos humanos, e essa ideia tem sido amplamente divulgada em romances e filmes de ficção científica. Mas os alienígenas são mais inteligentes que os humanos? Se sim, eles teriam memórias mais fortes?
Primeiro, devemos admitir que o nosso conceito de inteligência alienígena ainda é muito superficial. Não podemos ter certeza se os alienígenas são semelhantes a nós em inteligência, muito menos se são melhores que nós. No entanto, podemos simplesmente pensar e estimar a relação entre memória e inteligência a partir de uma perspectiva humana.
Do ponto de vista humano, sabemos que existe uma correlação entre inteligência e memória. Pessoas com níveis mais elevados de inteligência geralmente têm melhor memória. Isso ocorre porque pessoas com altos níveis de inteligência prestam mais atenção ao pensamento e ao raciocínio lógico e são mais propensas a integrar e associar informações por meio de diferentes métodos de correlação. Essa forma de pensar ajuda a melhorar a memória. Portanto, existe uma correlação entre o nível de inteligência de desempenho cerebral e a memória.
Contudo, não deveríamos simplesmente aplicar esta correlação aos alienígenas. Porque não podemos ter certeza se a estrutura da inteligência e a estrutura cerebral dos alienígenas são semelhantes às dos humanos. Os alienígenas podem ter estruturas de inteligência e estruturas de memória diferentes das dos humanos, portanto a relação entre sua inteligência e memória pode ser muito diferente.
Finalmente, devemos ter a certeza de que a descoberta de vida extraterrestre terá um grande impacto no desenvolvimento da ciência e da filosofia humanas. A investigação sobre a inteligência e a memória alienígena também deve ser conduzida numa base científica. Esperamos que, com o desenvolvimento contínuo da ciência e da tecnologia, os humanos sejam capazes de explorar mais vida alienígena e continuar a avançar no processo de resolução dos seus mistérios e de exploração da verdade do universo. Percebe-se que precisamos melhorar a memória, e a Cistanche deserticola pode melhorar significativamente a memória porque a Cistanche deserticola é um material medicinal tradicional chinês que tem muitos efeitos únicos, um dos quais é melhorar a memória. A eficácia da carne picada vem dos vários ingredientes ativos que contém, incluindo ácidos, polissacarídeos, flavonóides, etc. Esses ingredientes podem promover a saúde do cérebro de várias maneiras.

Clique em conhecer maneiras de melhorar a função cerebral
A superioridade do LSTM foi selecionada devido à sua capacidade de extrair automaticamente as características não lineares e não estacionárias de dados sequenciais, o WOA foi empregado para otimizar os hiperparâmetros do LSTM e o VMD foi usado para extrair as características intrínsecas das séries temporais de ET. Os resultados estimados do VMD-WOA-LSTM foram comparados com o ET real e estimativas de outros modelos híbridos em termos de métricas de desempenho padrão. Os resultados revelaram que o VMD-WOA-LSTM fornece resultados de estimativa mais precisos e confiáveis do que o LSTM, a máquina de vetores de suporte (SVM) e as variantes desses modelos. Portanto, o VMD-WOALSTM poderia ser recomendado como um método auxiliar essencial para estimar a ET em regiões desérticas.
A evapotranspiração (ET) é um processo físico e biológico altamente não linear, que conecta os processos ecológicos e hidrológicos pelo balanço hídrico1,2. É o componente central do balanço hídrico e energético regional e serve como uma ligação significativa no sistema solo-planta-atmosfera (SPA)3. Estimar com precisão a ET é um pré-requisito crítico na gestão ambiental4–6, especialmente em regiões desérticas com grandes áreas de vegetação artificial de ligação de areia, onde a sustentabilidade da vegetação artificial de ligação de areia é determinada pelo equilíbrio hídrico entre ET e precipitação5,7. Além disso, as alterações climáticas, especialmente as alterações nos padrões de aquecimento e precipitação, terão inevitavelmente um impacto profundo na sustentabilidade da vegetação artificial7,8.
Diferente da vegetação natural, a vegetação artificial ligada à areia é estabelecida com um propósito e função especiais, a estimativa precisa da ET pode fornecer uma referência para a compreensão do balanço hídrico e determinar a composição, estrutura, distribuição espacial e escala da vegetação artificial ligada à areia em regiões desérticas9,10. No entanto, a aplicação de métodos de base física (por exemplo, método Priestley-Taylor, método Hargreaves, método FAO-24 Penman corrigido, método FAO-56 Penman–Monteith, etc.) é severamente limitado devido à falta de parâmetros meteorológicos exigidos (por exemplo, calor latente de vaporização, radiação solar, umidade relativa, temperatura do ar, etc.) em regiões desérticas4,6,2–12. Portanto, é altamente desejável construir outros tipos de modelos baseados em dados para obter resultados de estimativas precisos.
Recentemente, os modelos de aprendizado de máquina (ML), incluindo redes neurais de retropropagação (BPNN)13, perceptron multicamadas (MLP)2, redes neurais artificiais multicamadas (MLNN)6, máquina de vetores de suporte (SVM)7,12, máquina de aprendizado extremo (ELM) 6, árvore modelo (MT) 14,15, floresta aleatória (RF) 6, redes neurais wavelet (WNN) 16, função de base radial (RBF) 17, etc., têm sido dramaticamente empregados para estimar a evaporação ou ET devido à sua capacidade de aprender recursos automaticamente e não exigir quaisquer suposições. Como os modelos de ML apresentam defeitos, os hiperparâmetros são difíceis de ajustar por si próprios, o que diminui significativamente a precisão do cálculo. Para superar as desvantagens dos modelos de ML, algoritmos meta-heurísticos, como algoritmo de polinização de flores (FPA) 6, algoritmo de vaga-lume (FFA) 11, algoritmo de gotas de água inteligentes (IWD) 12, algoritmo de otimização de baleia (WOA) 18, algoritmo otimizador de lobo cinza ( GWO)19,20, etc., foram empregados para determinar os hiperparâmetros ideais dos modelos ML. Estudos demonstraram que modelos de ML acoplados a algoritmos meta-heurísticos apresentam desempenho computacional superior ao de modelos de ML individuais e métodos baseados em física12,16,18,21,22.
Como a ET é intimamente afetada pelos parâmetros meteorológicos, umidade do solo e características da vegetação12, a série temporal de ET medida assume muitos pontos nítidos e flutuantes, o que diminui significativamente a precisão da estimativa12. Para obter resultados de estimativa mais confiáveis, técnicas de pré-processamento de dados, incluindo transformada wavelet discreta (DWT) 23, decomposição de modo empírico de conjunto (EEMD) 14,15 e decomposição de modo variacional (VMD) 7,24, etc., foram empregadas para decompor Freqüência de série temporal de ET em vários componentes e obter as informações necessárias em vários níveis7,14,23,24. A revisão da literatura mostra que técnicas de pré-processamento de dados hibridizadas com modelos de ML podem melhorar significativamente o desempenho do modelo16,25. Nesse sentido, Gocić et al.22 acoplaram SVM com DWT e algoritmo firefly (FFA) para estimar ET de referência na Sérvia, onde o FFA foi empregado para determinar os hiperparâmetros de SVM. Os resultados mostram que DWT-FFA-SVM é o melhor método de estimativa para estimativa de ET de referência. Pammar e Deka propuseram um híbrido DWT-SVM para estimar a evaporação diária em Karnataka, Índia. Os resultados também confirmam que o SVM combinado com o DWT pode melhorar a precisão da estimativa. Rezaie-Balf et al.15 integraram EEMD com SVM e árvore modelo M5 (M5T) separadamente para estimar os modelos mensais de evaporação da estação Siirt e da estação Diyarbakir em turco, e os modelos propostos apresentaram precisão muito maior. Fu et al.7 propuseram modelos híbridos combinando DWT, EEMD e VMD com SVM e GWO-SVM separadamente para estimar o ET mensal. Os resultados indicaram que o VMD e o DWT exibiram melhor desempenho de pré-processamento que o do EEMD, e a precisão da estimativa do VMDGWO-SVM foi maior que a do DWT-GWO-SVM e do EEMD-GWO-SVM.
Os trabalhos anteriores concentram-se principalmente no uso de modelos de ML rasos para estimar ET2,4,6,7,2–18,21–23. É bem conhecido que os modelos de ML superficiais têm desvantagens que não conseguem extrair suficientemente as características não lineares e não estáticas ocultas da série temporal ET25. Assim, memória de longo e curto prazo (LSTM) 3,26, rede neural profunda (DNN) 27, rede neural de convolução temporal (TCN) 27 e rede neural recorrente (RNN) 28 foram empregadas para estimar ET ou evaporação com base em dados meteorológicos limitados. dados. Pois Majhi et al.3 usaram LSTM, MLNN, fórmula de Hargreaves e fórmula de Blaney-Criddle para estimar a evaporação diária do estado de Chhattisgarh na Índia. Os resultados indicam que o LSTM pode alcançar uma estimativa precisa da evapotranspiração e tem melhor estimativa do que outros modelos . Chen et al.27 estimaram a ET de referência diária na planície Nordeste da China usando LSTM, DNN, TCN, SVM, RF, modelo Hargreaves, método Ritchie, modelo Priestley-Talor, fórmula Makkink, modelo Romanenko e fórmula Schendel, respectivamente. Os resultados mostram que o LSTM, o TCN e o DNN apresentam melhor desempenho de estimativa do que os modelos ML rasos e modelos empíricos na ausência de parâmetros meteorológicos. Granata e Di Nunno28 usaram LSTM e NARX para estimar a ET de Cypress Swamp e Kobeh Valley nos EUA. Os resultados mostram que os modelos de aprendizagem profunda têm maior precisão do que os modelos de ML superficial devido à alta estrutura hierárquica.
Os hiperparâmetros dos modelos de ML determinam diretamente a precisão da computação, mas m. Ainda assim, a maioria dos modelos não consegue os hiperparâmetros ideais por si só, e o LSTM não é exceção. Os hiperparâmetros do LSTM, incluindo o número de camadas ocultas (HL), o número de unidades ocultas (HU), épocas e taxa de aprendizagem (LR) , afetam significativamente o desempenho estimado do LSTM. No entanto, até onde os autores sabem, a aplicação de LSTM juntamente com algoritmos meta-heurísticos para estimar a evaporação ou ET tem sido mínima.
Área de estudo e dados
A pesquisa foi conduzida nas margens sudeste do deserto de Tengger (37 graus 32'N, 105 graus 02'E). O principal tipo de paisagem são dunas de treliça densamente distribuídas9,10. Para evitar os danos provocados pelas tempestades de areia na linha férrea Baotou-Lanzhou, a Academia Chinesa de Ciências e unidades ferroviárias relevantes estabeleceram cinturões artificialmente revegetados em 1956a e ampliaram-nos em 1964a, 1981a e 1987a. Uma barreira mecânica de areia perpendicular à direção do vento principal foi instalada na duna móvel, tabuleiros de palha (espaçamento 1 m × 1 m) foram colocados atrás da barreira mecânica de areia, e mudas de arbustos xéricos de dois anos foram plantadas na mesma configuração e de forma abandonada com espaçamento entre plantas e espaçamento entre linhas de 1 m × 2 m ou 2 m × 3 m sob condição de não irrigação. Após mais de meio século de sucessão, o número de espécies de plantas naturais aumentou de 25 para 453, e a cobertura vegetal aumentou de menos de 1% para 42,3%. Uma zona de fixação biológica de areia contra o vento com um comprimento de 16 km e uma largura de 200-1000 m foi gradualmente formada. A vegetação artificial de ligação à areia estabelecida em diferentes anos (1956a, 1964a, 1981a e 1987a) é distribuída em ambos os lados da ferrovia em paralelo, o que evitou com sucesso os danos causados pela areia soprada pelo vento ao tráfego ferroviário e melhorou significativamente o ambiente ecológico. da área de estudo. Como a estabilidade e a sustentabilidade da vegetação dependem do balanço hídrico entre a ET e a precipitação7,9,10, é de grande importância teórica e prática estimar com precisão a ET para proteger e utilizar vegetação artificial de retenção de areia7,10.

Neste estudo, os dados mensais de ET medidos de janeiro de 1991 a dezembro de 2018, os dados de janeiro de 1991 a dezembro de 2010 foram considerados como conjunto de treinamento e o restante foi usado como conjunto de teste. A Tabela 1 apresenta as principais métricas estatísticas da série temporal mensal da ET na área de estudo.
Metodologia
O enquadramento dos modelos propostos. LSTM é uma nova rede neural de ciclo de tempo que pode superar o problema de desaparecimento de gradiente em RNN adicionando uma forma de cadeia de módulos de rede neural repetidos para armazenar informações relevantes . Utiliza o princípio de funcionamento de “dois dentro e dois fora” para resolver o problema da dependência de longa ordem26. Neste estudo, o LSTM foi selecionado como o principal modular para estimar a dupla ET mensal, pois o LSTM tem a excelente capacidade de lidar com padrões não lineares entre as séries temporais27,28. Além disso, o SVM também foi empregado para estimar ET, uma vez que o SVM tem melhor adaptabilidade para resolver uma classe mais ampla de problemas de ajuste não linear (por exemplo, estimar ET) do que outros modelos de ML rasos (por exemplo, BPNN, WNN, ELM, MT e MLP) 29.

Como o DWT é sensível à base wavelet e ao limiar, o EMD sofre de uma desvantagem intrínseca da mistura de modos7,24, e o EEMD existe efeitos de ponto final7. VMD é um método de pré-processamento de dados mais robusto e adaptativo que DWT, EMD e EEMD24, ele supera efetivamente as deficiências desses métodos e extrai as principais características de variação das séries temporais de irregularidade e não estacionariedade24. Neste estudo, o VMD foi empregado para extrair as principais características de variação do conjunto de dados de TE. Para comparar o desempenho de remoção de ruído do VMD, o DWT foi selecionado como referência. A saída de DWT, VMD e as séries temporais de ET coletadas foram divididas em conjuntos de treinamento e conjuntos de teste e alimentadas em modelos de ML para estimar ET, respectivamente.
Para melhorar a eficiência de treinamento dos modelos de ML, o método de normalização min-max7,22 foi utilizado para normalizar os conjuntos de dados de entrada e saída. Os conjuntos de entrada e saída do SVM e LSTM foram determinados usando o método de seleção longitudinal (LS)7, ou seja, o grupo de amostras de treinamento é representado por um vetor de I a k - q, a saída de treinamento é denotada como um vetor de I + d - 1 a k - q, o vetor de saída de teste é representado por um vetor de k - q + 1 a k, onde i, d, k e q denotam o ponto de partida, a dimensão de entrada, o tamanho dos dados definido e o comprimento da saída de teste, respectivamente. A Figura 1 mostra o diagrama esquemático do método LS com i=1, d=3 e k=336.

WOA é um novo algoritmo meta-heurístico eficiente e estável, que foi amplamente utilizado para resolver problemas de otimização não linear, incluindo a otimização dos hiperparâmetros de modelos de ML rasos para estimativa de evaporação ou ET. No entanto, nenhum pesquisador propôs um modelo híbrido acoplando LSTM com meta-algoritmos heurísticos para estimar ET. Assim, o WOA foi empregado para otimizar os hiperparâmetros do LSTM para obter resultados estimados mais precisos. A Figura 2 apresenta o fluxograma do WOA-LSTM. O WOA-LSTM acoplado ao VMD é denotado como VMD-WOA-LSTM.
A superioridade do VMD-WOA-LSTM foi testada comparando o desempenho estimado com LSTM,SVM, DWT-LSTM, DWT-SVM, VMD-LSTM, VMD-SVM, WOA-LSTM, GWO-SVM, DWT-WOA-LSTM, DWT-GWO-SVM e VMD-GWO-SVM, onde GWO-SVM indica que os melhores C e G do SVM foram determinados usando o algoritmo GWO, a Fig. 3 mostra os fluxogramas do GWO-SVM. Nos processos de simulação numérica, o erro percentual médio absoluto (MAPE) foi empregado como função de aptidão para determinar os hiperparâmetros ótimos dos modelos de ML. Deve-se notar que os princípios matemáticos dos métodos utilizados neste artigo, incluindo DWT, VMD, SVM, LSTM, GWO e WOA, podem ser encontrados na literatura relevante, portanto a descrição matemática desses métodos é omitida.
Métricas para avaliação de desempenho. A análise de erro é realizada usando as métricas de avaliação, incluindo o erro médio absoluto (MAE), MAPE, erro quadrático médio normalizado (NMSE), raiz quadrada média do erro (RMSE) e coeficiente de eficiência Nash-Sutcliffe (NSCE). As definições dessas métricas de avaliação são as seguintes:
onde yi e yi denotam o resultado desejado e estimado. O MAE, MAPE, NMSE e RMSE são geralmente usados para medir o desvio entre o resultado desejado e o estimado, o desempenho da estimativa é melhor quando os valores dessas métricas de avaliação são menores. Como o MAPE é relativamente mais estável entre esses critérios, o NSCE é geralmente usado para determinar a eficiência do modelo no campo hidrológico (NSCE próximo de 1 indica que o modelo proposto tem boa aptidão). Portanto, MAPE e NSCE foram selecionados como principais benchmarks para avaliar o desempenho dos modelos propostos.
Configurações de parâmetros. A estimativa do desempenho de diferentes modelos é determinada principalmente pela seleção dos parâmetros. A Tabela 2 mostra os principais parâmetros do DWT e VMD. O número de agentes de busca e as iterações máximas dos algoritmos WOA e GWO foram 5 e 100, respectivamente. O tamanho do minilote de todos os modelos baseados em LSTM foi 128. O intervalo de HL, HU, Épocas e LR do WOA-LSTM foi [1, 200], [1.200], [10, 100 ] e [0,001, 0,01], respectivamente. Quanto ao GWO-SVM, o intervalo de C e G foi [0,01, 100].

Resultados
As Figuras 4 e 5 mostram os resultados do DWT e VMD. Como mostrado nas Figs. 4 e 5, as séries temporais mensais de ET coletadas têm muitos pontos nítidos e flutuantes, o que afetará o desempenho da estimativa. Para resolver esses padrões problemáticos nos processos de estimativa de ET, o db4 com nível 1 e o VMD com K=5 foram analisados e empregados para eliminar o ruído da série temporal de ET estável. A série temporal residual mostra baixa amplitude e flutuação de alta frequência, sugerindo que o ruído branco foi eliminado do conjunto de dados ET original. A Tabela 2 mostra que o desempenho de eliminação de ruído do VMD (com SNR=42.6451 e RMSE=1.7934) é mais eficiente do que o do DWT (com SNR=40.8201 e RMSE{{15} }.2127). A DWT tem a desvantagem de que a base wavelet deve ser selecionada antecipadamente e também é sensível à seleção do limite. Portanto, o VMD é melhor.
Conforme mencionado, LSTM e SVM foram utilizados para estimar o ET mensal, respectivamente. Para cada dimensão de entrada fixa d em d=2, 3,…, 16, o MAPE mínimo foi selecionado a partir de 5 replicações, e os hiperparâmetros ótimos do WOA-LSTM e GWO-SVM foram registrados de acordo com o MAPE mínimo. A Tabela 3 mostra os recursos de entrada e hiperparâmetros ideais dos modelos propostos. Conforme mostrado na Tabela 3, o MAPE de cada modelo baseado em LSTM é menor que o do modelo baseado em SVM, sugerindo que os modelos de aprendizagem profunda superaram significativamente os modelos de ML superficial; O MAPE do modelo único de ML foi diminuído ao acoplar o modelo de ML às técnicas de pré-processamento de dados, sugerindo que o desempenho do modelo de ML pode ser melhorado usando o pré-processamento de dados; O MAPE dos modelos híbridos com parâmetros ótimos são todos menores que os dos modelos de ML com parâmetros padrão, indicando que os modelos de ML integrados com algoritmos meta-heurísticos têm desempenho computacional moderadamente superior ao dos modelos de ML com parâmetros padrão; O MAPE dos modelos híbridos DWT-GWO-SVM, DWT-WOA-LSTM, VMD-GWO-SVM e VMD-WOA-LSTM é menor que o de LSTM, SVM, DWT-LSTM, DWT-SVM, VMD-LSTM, VMD -SVM, WOA-LSTM e GWO-SVM, sugerindo que o desempenho do modelo de ML pode ser significativamente melhorado usando o pré-processamento de dados e o algoritmo meta-heurístico.

Os resultados da estimativa dos modelos ML com o MAPE mínimo e os hiperparâmetros ótimos são apresentados na Figura 6. A Figura 6 mostra que os resultados de todos os modelos propostos são consistentes com a maioria dos pontos na faixa intermediária, mas o ponto inicial e os valores extremos são superestimados; A série temporal ET mensal tem um período de 12 meses, as dimensões de entrada ideais de LSTM, DWT-LSTM, VMD-LSTM, WOALSTM, DWT-WOA-LSTM e VMD-WOA-LSTM são aproximadamente iguais ao período do tempo ET série (Tabela 3), sugerindo que o LSTM pode aproveitar ao máximo os padrões de dados históricos e superar efetivamente as desvantagens dos modelos de ML superficiais. No geral, os modelos híbridos DWT-GWO-SVM, DWT-WOA-LSTM, VMD-GWOSVM e VMD-WOA-LSTM têm melhor desempenho de estimativa do que outros modelos propostos.
A Tabela 4 apresenta as métricas de avaliação de cada modelo nas etapas de treinamento e teste, onde as médias das métricas de avaliação dos modelos de ML otimizados por algoritmos meta-heurísticos estão marcadas em negrito. Conforme mostrado na Tabela 4, o desempenho do modelo DWT-LSTM, DWT-SVM, VMD-LSTM e VMD-SVM é melhor que o de LSTM e SVM em estágio de teste (Tabela 4), sugerindo que o pré-processamento de dados é um ajuda para melhorar o desempenho de estimativa de modelos de ML. Conforme mostrado na Tabela 4, as métricas de avaliação incluindo MAE, MAPE, NMSE e RMSE de WOA-LSTM e GWO-SVM são todas menores que as de LSTM, SVM, DWT-LSTM, DWTSVM, VMD-LSTM e VMD-SVM , e NSCE aumentaram em graus variados, indicando que o desempenho de estimativa de LSTM e SVM é significativamente melhorado quando os hiperparâmetros de LSTM e SVM são otimizados usando algoritmos meta-heurísticos.

As métricas de avaliação do SVM integrado ao GWO são todas menores que as do LSTM juntamente com técnicas de pré-processamento de dados; O MAPE do híbrido VMD-GWO-SVM é menor do que o de outros modelos baseados em SVM e modelos LSTM, DWT-LSTM, VMD-LSTM (Tabela 4), sugerindo que modelos de ML rasos integrados com técnicas de pré-processamento de dados e algoritmos meta-heurísticos pode ser empregado para estimar ET. Considerando que o desempenho do modelo de ML superficial ainda precisa ser melhorado. Conforme mostrado na Tabela 4, os modelos de aprendizagem profunda superaram significativamente os modelos de ML superficial, e o desempenho do modelo híbrido WOA-LSTM, DWT-WOA-LSTM e VMD-WOA-LSTM é melhor do que o dos modelos híbridos baseados em SVM. Comparado com VMD-GWO-SVM, o MAPE do DWT-WOA-LSTM diminuiu de 23,22% para 18,90%, e o NSCE foi melhorado de 0,8754 para 0,8578; o MAPE do VMD-WOA-LSTM diminuiu de 23,22% para 18,72% e o NSCE foi melhorado de 0,8754 para 0,8917. Esses resultados indicam que os modelos híbridos DWT-WOA-LSTM e VMD-WOA-LSTM possuem excelente capacidade de estimar o ET mensal em relação aos demais métodos propostos. O MAPE dos modelos híbridos VMD-WOA-LSTM é o menor entre os modelos propostos, indicando que o VMD-WOA-LSTM é o modelo mais preciso para estimar o ET mensal entre os modelos propostos. Portanto, o VMD-WOA-LSTM poderia ser recomendado como um método auxiliar essencial para estimar a ET em regiões desérticas.

Discussão
Conforme mencionado, modelos híbridos baseados em modelos de ML, técnicas de pré-processamento de dados e algoritmos meta-heurísticos foram propostos para estimar ET na área de estudo. Geralmente, construir modelos híbridos de ML é um procedimento complexo e demorado6,14–18. No entanto, os modelos híbridos de ML têm maior precisão do que os métodos baseados em física20–23. Portanto, usar os modelos híbridos de ML para estimar com precisão o ET é uma questão central em hidrologia e ecologia.
Os modelos de aprendizagem profunda geralmente superaram os modelos de ML superficial3. Porém, utilizar apenas modelos de ML para estimar o ET pode levar a grandes erros quando o pré-processamento dos dados não é realizado7,14–16. Como mostrado nas Figs. 4 e 5, as séries temporais de ET coletadas exibem irregularidade e não estacionariedade, uma vez que o ET é determinado por fatores meteorológicos e está intimamente relacionado à umidade do solo, características geomorfológicas e de vegetação em regiões desérticas. Assim, a técnica de pré-processamento de dados deve ser utilizada para alcançar as principais características de variação das séries temporais de ET coletadas para obter resultados de estimativa confiáveis. Os métodos de pré-processamento de dados, como DWT e VMD, podem ser aplicados para eliminar o ruído das séries temporais não lineares e não estacionárias. Enquanto o DWT é sensível à seleção do limite, o VMD é um método de pré-processamento de dados mais robusto e eficaz do que o modo empírico. decomposição (EMD) e EEMD, que pode ser usado para remover o ruído de séries temporais, decompondo o sinal não linear e não estacionário em várias funções de modo intrínseco (IMFs) de banda limitada 7,24. Portanto, o desempenho de eliminação de ruído do DWT é pior que o do VMD (Tabela 2).
A revisão da literatura mostra que os modelos de ML integrados com técnicas de pré-processamento de dados são uma estratégia eficaz para obter resultados de estimativa mais confiáveis7,21–23, os resultados de nossa pesquisa também confirmam esta conclusão. Conforme mostrado nas Tabelas 3 e 4, as médias das métricas de avaliação dos modelos ML integrados ao DWTor VMD são todas menores do que as dos modelos SVM e LSTM únicos. Portanto, extrair recursos úteis usando uma técnica de pré-processamento de dados é necessário para obter resultados de estimativa mais confiáveis (Arquivo Suplementar 1).
O desempenho estimado dos modelos de ML também pode ser significativamente melhorado acoplando modelos de ML com algoritmos meta-heurísticos. Até certo ponto, é mais importante obter os hiperparâmetros ideais de um modelo ML do que selecionar a técnica apropriada de pré-processamento de dados. Conforme mostrado nas Tabelas 3 e 4, o desempenho de estimativa dos modelos de ML hibridizados com a técnica de pré-processamento de dados foi significativamente melhorado quando os hiperparâmetros de LSTM e SVM foram otimizados. Em comparação com DWT-SVM, VMD-SVM, DWT-LSTM e VMD-LSTM, as métricas de avaliação positivas de DWT-GW0-SVM, VMD-GWO-SVM, DWT-WOA-LSTM e VMD-WOA -LSTM diminuiu e os indicadores negativos aumentaram em graus variados. Assim, a seleção de hiperparâmetros para modelos de ML foi de importância crucial para melhorar o desempenho da estimativa6,7,21–29.
Além disso, conforme concluído, o objetivo principal deste estudo foi propor um novo modelo híbrido para estimar ET integrando LSTM com WOA e técnicas de pré-processamento de dados, incluindo DWT e VMD. O desempenho do VMD-WOA-LSTM foi comparado com outros modelos híbridos em termos de métricas de desempenho padrão. A comparação de desempenho dos modelos propostos demonstrou que o modelo híbrido VMDWOA-LSTM teve melhor desempenho do que outros modelos baseados em ML na estimativa da ET mensal nas margens sudeste do Deserto de Tengger.
Conclusões
Neste estudo, os modelos híbridos baseados em VMD, WOA e LSTM foram propostos para estimar ET usando os métodos de análise de séries temporais, onde VMD foi usado para extrair as características intrínsecas das séries temporais de ET, e WOA foi empregado para otimizar os hiperparâmetros de LSTM . O desempenho do modelo foi comparado com o ET real e estimativa de outros modelos híbridos em termos de MAE, MAPE, NMSE, RMSE e NSCE. Os resultados indicam que o VMD-WOA-LSTM possui resultados de estimativa mais precisos do que outros modelos baseados em ML, o que pode ser recomendado como um método auxiliar essencial para estimar ET em regiões desérticas.
Disponibilidade de dados
Todos os dados analisados ou gerados durante este estudo estão incluídos nas Informações Suplementares e estão disponíveis nos autores correspondentes mediante solicitação razoável.
Referências
1. Keshtegar, B., Piri, J. & Kisi, O. Uma modelagem matemática não linear da evaporação diária do recipiente com base no método de gradiente conjugado.Computação. Elétron. Agrícola. 127, 120–130 (2016).
2. Hashemi, M. & Sepaskhah, AR Avaliação de rede neural artificial e equação de Penman-Monteith para a previsão da evapotranspiração padrão da cevada em uma região semiárida. Teor. Apl. Climatol. 139, 275–285 (2020).
3. Majhi, B. et al. Previsão aprimorada da evaporação diária do reservatório usando o modelo Deep-LSTM. Computação Neural. Apl. 32, 7823 (2019).
4. Wen, X. et al. Modelos baseados em máquinas de vetores de suporte para modelar a evapotranspiração de referência diária com dados climáticos limitados em regiões extremamente áridas. Recurso Hídrico. Gerenciar. 29, 3195–3209 (2015).
5. Li, XR et al. Ecohidrologia Fundamental da Restauração e Recuperação Ecológica em Regiões de Desertos Arenosos da China (Science Press, 2016).
6. Wu, LF et al. Máquina híbrida de aprendizado extremo com algoritmos meta-heurísticos para previsão mensal de evaporação do recipiente. Comput.Elétron. Agr. 168, 105–115 (2020).
7. Fu, TL et al. Um novo método integrado baseado em um modelo de aprendizado de máquina para estimar a evapotranspiração em terras áridas. J.Hydrol. 603, 126881 (2021).
8. Zhang, DH, Li, XR & Zhang, F. Efeitos da intensidade e intermitência das chuvas na cobertura vegetal lenhosa e na umidade profunda do solo em ecossistemas de terras áridas. J. Hidrol. 543, 270–282 (2016).
9. Li, XR et al. O limiar eco-hidrológico para avaliar a estabilidade da vegetação arenosa em diferentes zonas climáticas.Ecol. 83, 404–415 (2017).
For more information:1950477648nn@gmail.com






