← Centro de Aprendizaje

Inteligencia Artificial y Calidad del Agua: El Futuro (y el Presente) de la Modelación Hídrica

Simula el oxígeno disuelto con Streeter-Phelps

Modela la curva de déficit de OD en tu río con la calculadora clásica Streeter-Phelps

Abrir Calculadora Streeter-Phelps

La IA no reemplaza los modelos: los complementa

La irrupción de la inteligencia artificial (IA) y el machine learning (ML) en la gestión ambiental ha generado tanto entusiasmo como escepticismo. En el campo de la calidad del agua, la pregunta no es si la IA sustituirá modelos mecanísticos como QUAL2K, sino cómo la IA puede potenciar, acelerar y extender las capacidades de la modelación tradicional.

Este artículo presenta el estado actual de la IA aplicada a la calidad del agua, con énfasis en las herramientas que ya son accesibles para consultores ambientales en Colombia, y los límites que la IA no puede superar sin datos de calidad.

¿Qué puede hacer la IA en calidad del agua?

Predicción de parámetros: redes neuronales y modelos de gradient boosting pueden predecir OD, DBO5 o turbidez a partir de variables fácilmente medibles (caudal, temperatura, conductividad). Son especialmente útiles para llenar vacíos en series de monitoreo.

Calibración automática de modelos: algoritmos evolutivos (NSGA-II, PSO, DREAM) pueden explorar el espacio de parámetros de QUAL2K de forma sistemática, encontrando combinaciones óptimas que la calibración manual demoraría días.

Detección temprana de anomalías: sensores de monitoreo continuo (OD, pH, conductividad, turbidez) combinados con modelos de IA pueden detectar derrames o vertimientos no autorizados en tiempo real, activando alertas automáticas.

Análisis de imágenes satelitales: Google Earth Engine + modelos de regresión permiten estimar índices de calidad del agua (turbidez, clorofila-a) en embalses y ríos usando bandas de Sentinel-2 o Landsat-8/9.

Gemelos digitales de cuencas: combinación de modelos hidráulicos, hidrológicos y de calidad del agua con IA para generar representaciones digitales en tiempo real de la cuenca, con actualización continua por datos de sensores.

Herramientas de IA accesibles para el contexto colombiano

Google Earth Engine

Plataforma de análisis geoespacial en la nube con acceso gratuito para investigación y gobierno. Permite analizar series temporales de imágenes satelitales para estimar calidad del agua en embalses (IDEAM monitorea el embalse de El Peñol con técnicas similares).

Python + scikit-learn / XGBoost

La biblioteca scikit-learn (Python, gratuito) ofrece modelos de regresión, clasificación y clustering para datos de calidad del agua. Con datos históricos de monitoreo (IDEAM, CARs), es posible entrenar modelos que predigan OD o DBO5 a partir de temperatura y caudal. XGBoost es especialmente efectivo con tablas de datos ambientales.

Redes neuronales recurrentes (LSTM)

Las redes LSTM (Long Short-Term Memory) son ideales para series temporales de calidad del agua: capturan patrones estacionales y dependencias de largo plazo entre caudal, temperatura y OD. Requieren TensorFlow o Keras (Python, gratuito) y al menos 2-3 años de datos de monitoreo continuo para entrenar.

SWAT-CUP (calibración automatizada de SWAT+)

SWAT+ es un modelo de cuenca para calidad del agua y cargas difusas. SWAT-CUP es la herramienta de calibración automática que usa algoritmos de optimización para ajustar cientos de parámetros. Especialmente útil para cuencas con fuentes difusas donde QUAL2K no es suficiente.

Los límites de la IA: lo que no puede hacer sin datos

La IA no puede generar predicciones confiables sin datos históricos de calidad suficientes. En Colombia, muchas cuencas no tienen series de monitoreo continuo, lo que limita severamente la aplicación de modelos de ML. Los principales obstáculos son:

Brechas en los datos de monitoreo: pocas estaciones de calidad continua (vs. puntuales) en Colombia.

Calidad de los datos: errores analíticos, valores atípicos sin depurar, falta de control de calidad (QA/QC) comprometen el entrenamiento de los modelos.

Interpretabilidad: los modelos de "caja negra" (redes neuronales profundas) no permiten explicar por qué el OD bajó, solo predecir que bajó. Para decisiones regulatorias, la explicabilidad es necesaria.

Extrapolación: los modelos de ML no deben usarse fuera del rango de condiciones en que fueron entrenados. Un modelo entrenado en condiciones normales puede fallar en eventos extremos (avenidas, sequías ENSO severas).

Referencias

  • Shen, C. (2018). A transdisciplinary review of deep learning research and its relevance for water resources scientists. Water Resources Research, 54(11), 8558-8593.
  • Yaseen, Z.M. et al. (2018). Application of the hybrid artificial neural network coupled with rolling mechanism and grey model algorithms for streamflow forecasting over multiple time horizons. Water Resources Management, 32(5), 1883-1899.
  • Nearing, G.S. et al. (2021). What role does hydrological science play in the age of machine learning? Water Resources Research, 57(3).
  • IDEAM (Colombia). Sistema de Información del Recurso Hídrico (SIRH). sirh.ideam.gov.co.
V18