Depuis 25 ans, le ministère malaisien de l'Environnement (DOE) a mis en place un indice de qualité de l'eau (IQE) qui utilise six paramètres clés : l'oxygène dissous (OD), la demande biochimique en oxygène (DBO), la demande chimique en oxygène (DCO), le pH, l'azote ammoniacal (AN) et les matières en suspension (MES). L'analyse de la qualité de l'eau est un élément important de la gestion des ressources en eau et doit être correctement gérée pour prévenir les dommages écologiques dus à la pollution et garantir le respect des réglementations environnementales. Cela accroît la nécessité de définir des méthodes d'analyse efficaces. L'un des principaux défis du calcul actuel est qu'il nécessite une série de calculs de sous-indices longs, complexes et sujets aux erreurs. De plus, l'IQE ne peut être calculé si un ou plusieurs paramètres de qualité de l'eau sont manquants. Dans cette étude, une méthode d'optimisation de l'IQE est développée pour tenir compte de la complexité du processus actuel. Le potentiel de la modélisation pilotée par les données, à savoir la machine à vecteurs de support (SVM) à base de fonctions Nu-Radial basée sur une validation croisée 10x, a été développé et exploré pour améliorer la prévision de l'IQE dans le bassin de Langat. Une analyse de sensibilité complète a été réalisée selon six scénarios afin de déterminer l'efficacité du modèle dans la prévision de l'IQE. Dans le premier cas, le modèle SVM-IQE a montré une excellente capacité à reproduire le modèle DOE-IQE et a obtenu des résultats statistiques très élevés (coefficient de corrélation r > 0,95, efficacité Nash Sutcliffe, NSE > 0,88, indice de cohérence de Willmott, WI > 0,96). Dans le second scénario, le processus de modélisation montre que l'IQE peut être estimé sans six paramètres. Ainsi, le paramètre OD est le facteur le plus important pour déterminer l'IQE. Le pH a le moins d'effet sur l'IQE. De plus, les scénarios 3 à 6 démontrent l'efficacité du modèle en termes de temps et de coût en minimisant le nombre de variables dans la combinaison d'entrées du modèle (r > 0,6, NSE > 0,5 (bon), WI > 0,7 (très bon)). Pris dans son ensemble, le modèle améliorera et accélérera considérablement la prise de décision basée sur les données dans la gestion de la qualité de l'eau, rendant les données plus accessibles et engageantes sans intervention humaine.
1 Introduction
Le terme « pollution de l'eau » désigne la pollution de plusieurs types d'eau, notamment les eaux de surface (océans, lacs et rivières) et les eaux souterraines. L'un des facteurs majeurs de l'aggravation de ce problème est l'absence de traitement adéquat des polluants avant leur rejet direct ou indirect dans les masses d'eau. L'altération de la qualité de l'eau a un impact significatif non seulement sur le milieu marin, mais aussi sur la disponibilité de l'eau douce pour l'approvisionnement public en eau et l'agriculture. Dans les pays en développement, la croissance économique rapide est monnaie courante, et tout projet favorisant cette croissance peut nuire à l'environnement. Pour la gestion à long terme des ressources en eau et la protection des populations et de l'environnement, la surveillance et l'évaluation de la qualité de l'eau sont essentielles. L'indice de qualité de l'eau, également appelé IQE, est dérivé des données sur la qualité de l'eau et permet de déterminer l'état actuel de la qualité des eaux fluviales. Pour évaluer l'ampleur de l'altération de la qualité de l'eau, de nombreuses variables doivent être prises en compte. L'IQE est un indice sans dimension. Il se compose de paramètres spécifiques de qualité de l'eau. L'IQE fournit une méthode de classification de la qualité des masses d'eau historiques et actuelles. La valeur significative de l'indice de qualité de l'eau (IQE) peut influencer les décisions et les actions des décideurs. Sur une échelle de 1 à 100, plus l'indice est élevé, meilleure est la qualité de l'eau. En général, la qualité de l'eau des stations fluviales affichant un score de 80 et plus répond aux normes de propreté des rivières. Une valeur IQE inférieure à 40 est considérée comme contaminée, tandis qu'une valeur comprise entre 40 et 80 indique une eau légèrement contaminée.
En général, le calcul de l'IQE nécessite un ensemble de transformations de sous-indices longues, complexes et sujettes aux erreurs. Il existe des interactions non linéaires complexes entre l'IQE et d'autres paramètres de qualité de l'eau. Le calcul de l'IQE peut s'avérer complexe et long, car les différents IQE utilisent des formules différentes, ce qui peut entraîner des erreurs. L'un des principaux défis réside dans l'impossibilité de calculer la formule de l'IQE si un ou plusieurs paramètres de qualité de l'eau sont manquants. De plus, certaines normes exigent des procédures de prélèvement d'échantillons longues et exhaustives, qui doivent être réalisées par des professionnels qualifiés afin de garantir l'exactitude de l'examen des échantillons et de l'affichage des résultats. Malgré les progrès technologiques et des équipements, la surveillance temporelle et spatiale étendue de la qualité de l'eau des rivières est entravée par des coûts d'exploitation et de gestion élevés.
Cette discussion montre qu'il n'existe pas d'approche globale de l'IQE. Cela soulève la nécessité de développer des méthodes alternatives pour calculer l'IQE de manière efficace et précise. De telles améliorations pourraient être utiles aux gestionnaires des ressources environnementales pour surveiller et évaluer la qualité des eaux fluviales. Dans ce contexte, certains chercheurs ont utilisé avec succès l'IA pour prédire l'IQE ; la modélisation par apprentissage automatique basée sur l'IA évite le calcul de sous-indices et génère rapidement des résultats d'IQE. Les algorithmes d'apprentissage automatique basés sur l'IA gagnent en popularité en raison de leur architecture non linéaire, de leur capacité à prédire des événements complexes, de leur capacité à gérer de grands ensembles de données, y compris des données de tailles variables, et de leur insensibilité aux données incomplètes. Leur pouvoir prédictif dépend entièrement de la méthode et de la précision de la collecte et du traitement des données.
Date de publication : 21 novembre 2024