Depuis 25 ans, le Département de l'Environnement de Malaisie (DOE) utilise un indice de qualité de l'eau (IQA) basé sur six paramètres clés : l'oxygène dissous (OD), la demande biochimique en oxygène (DBO), la demande chimique en oxygène (DCO), le pH, l'azote ammoniacal (NA) et les matières en suspension (MES). L'analyse de la qualité de l'eau est essentielle à la gestion des ressources en eau et doit être rigoureusement menée afin de prévenir les dommages écologiques liés à la pollution et de garantir le respect des réglementations environnementales. Ceci souligne la nécessité de définir des méthodes d'analyse efficaces. L'une des principales difficultés des méthodes informatiques actuelles réside dans la complexité et la longueur des calculs de sous-indices qu'elles requièrent. De plus, l'IQA ne peut être calculé si un ou plusieurs paramètres de qualité de l'eau sont manquants. Cette étude propose une méthode d'optimisation de l'IQA pour pallier la complexité du processus actuel. Le potentiel de la modélisation basée sur les données, et plus particulièrement de la machine à vecteurs de support (SVM) à fonction de base Nu-Radial avec validation croisée à 10x, a été développé et exploré afin d'améliorer la prédiction de l'IQA dans le bassin de Langat. Une analyse de sensibilité complète a été réalisée selon six scénarios afin de déterminer l'efficacité du modèle pour la prédiction de l'indice de qualité de l'eau (IQA). Dans le premier scénario, le modèle SVM-IQA a démontré une excellente capacité à reproduire l'IQA du modèle DOE et a obtenu des résultats statistiques très performants (coefficient de corrélation r > 0,95, coefficient de Nash-Sutcliffe > 0,88, indice de cohérence de Willmott > 0,96). Dans le deuxième scénario, la modélisation a montré que l'IQA pouvait être estimé sans six paramètres. Ainsi, le paramètre d'oxygène dissous (OD) est le facteur le plus important pour la détermination de l'IQA. Le pH a l'influence la plus faible sur l'IQA. De plus, les scénarios 3 à 6 démontrent l'efficacité du modèle en termes de temps et de coût, grâce à la minimisation du nombre de variables dans la combinaison des entrées du modèle (r > 0,6, coefficient de Nash-Sutcliffe > 0,5 (bon), indice de cohérence de Willmott > 0,7 (très bon)). En conclusion, le modèle améliorera et accélérera considérablement la prise de décision fondée sur les données dans la gestion de la qualité de l'eau, rendant les données plus accessibles et exploitables sans intervention humaine.
1 Introduction
Le terme « pollution de l'eau » désigne la pollution de plusieurs types d'eau, notamment les eaux de surface (océans, lacs et rivières) et les eaux souterraines. Un facteur important de l'aggravation de ce problème est le traitement insuffisant des polluants avant leur rejet, direct ou indirect, dans les cours d'eau. Les variations de la qualité de l'eau ont un impact considérable non seulement sur le milieu marin, mais aussi sur la disponibilité de l'eau douce pour l'approvisionnement en eau potable et l'agriculture. Dans les pays en développement, la croissance économique rapide est fréquente, et tout projet favorisant cette croissance peut nuire à l'environnement. Pour une gestion durable des ressources en eau et la protection des populations et de l'environnement, le suivi et l'évaluation de la qualité de l'eau sont essentiels. L'indice de qualité de l'eau (IQA) est calculé à partir de données sur la qualité de l'eau et permet de déterminer l'état actuel de la qualité de l'eau des cours d'eau. L'évaluation du degré de variation de la qualité de l'eau nécessite la prise en compte de nombreuses variables. L'IQA est un indice sans dimension. Il est composé de paramètres spécifiques de qualité de l'eau. L'IQA offre une méthode de classification de la qualité des cours d'eau, tant historiques qu'actuels. La pertinence de l'indice de qualité de l'eau (IQA) peut influencer les décisions et les actions des décideurs. Sur une échelle de 1 à 100, plus l'indice est élevé, meilleure est la qualité de l'eau. En général, la qualité de l'eau des stations de prélèvement fluviales ayant un IQA de 80 et plus répond aux normes relatives aux rivières propres. Un IQA inférieur à 40 est considéré comme un signe de contamination, tandis qu'un IQA compris entre 40 et 80 indique une légère contamination.
En général, le calcul de l'IQA (Indice de Qualité de l'Eau) nécessite une série de transformations de sous-indices longues, complexes et sujettes aux erreurs. Il existe des interactions non linéaires complexes entre l'IQA et d'autres paramètres de qualité de l'eau. Le calcul des IQA peut s'avérer difficile et long, car différents IQA utilisent des formules différentes, ce qui peut engendrer des erreurs. L'une des principales difficultés réside dans l'impossibilité de calculer l'IQA si un ou plusieurs paramètres de qualité de l'eau sont manquants. De plus, certaines normes exigent des procédures de prélèvement d'échantillons exhaustives et chronophages, qui doivent être réalisées par des professionnels qualifiés afin de garantir l'exactitude de l'analyse des échantillons et la présentation des résultats. Malgré les progrès technologiques et matériels, la surveillance spatio-temporelle de la qualité de l'eau des rivières reste entravée par des coûts d'exploitation et de gestion élevés.
Cette discussion montre qu'il n'existe pas d'approche globale pour l'indice de qualité de l'eau (IQA). Ceci souligne la nécessité de développer des méthodes alternatives pour calculer l'IQA de manière efficace et précise. De telles améliorations pourraient être utiles aux gestionnaires des ressources environnementales pour surveiller et évaluer la qualité de l'eau des rivières. Dans ce contexte, certains chercheurs ont utilisé avec succès l'intelligence artificielle (IA) pour prédire l'IQA ; la modélisation par apprentissage automatique basée sur l'IA évite le calcul des sous-indices et génère rapidement des résultats d'IQA. Les algorithmes d'apprentissage automatique basés sur l'IA gagnent en popularité grâce à leur architecture non linéaire, leur capacité à prédire des événements complexes, leur aptitude à gérer de grands ensembles de données, y compris des données de tailles variables, et leur insensibilité aux données incomplètes. Leur pouvoir prédictif dépend entièrement de la méthode et de la précision de la collecte et du traitement des données.
Date de publication : 21 novembre 2024


