El vuelo de Guacamaya: El proyecto en que Microsoft y la investigación confluyeron en la IA

La Universidad de los Andes, el Instituto Humboldt y el Instituto SINCHI, en Colombia, crearon, junto a Microsoft, una plataforma de IA que procesa datos satelitales de grabaciones bioacústicas y de cámaras trampa
El objetivo del proyecto es supervisar la deforestación y la biodiversidad en la Amazonía.
Se trata de una innovadora y poderosa herramienta que proporcionará información clave para proteger un ecosistema crucial para la estabilidad climática planetaria.

Con 7 millones de km2 y su presencia en nueve países, la Amazonía es el mayor bosque tropical del mundo, hogar del 1% de la biodiversidad planetaria y responsable de entregar humedad y lluvias a Sudamérica, lo que ayuda a estabilizar  el clima global. Sin embargo, por actividades como la minería ilegal, la expansión agrícola, la sobrepesca, la caza y la deforestación, este ecosistema único se encuentra en serio peligro.

Según el Informe Amazonía Viva 2022 (WWF), el 18% de los bosques amazónicos se ha perdido por completo y un 17% adicional está degradado, cifras que prometen seguir empeorando y trayendo consecuencias sobre la biodiversidad, el clima global y sobre las personas. Especialmente sobre las 47 millones que viven en la región amazónica y dependen de ella para su sustento.

Para ayudar a enfrentar estas amenazas, en 2022 surgió Guacamaya, IA por la Amazonía, una iniciativa respaldada por AI for Good de Microsoft y cuyo foco estaba en promover el uso de Inteligencia Artificial para abordar desafíos sociales y medioambientales. La plataforma se valió de la IA para poner a disposición de la ciencia y del gobierno, datos certeros y oportunos sobre los fenómenos que están impactando negativamente este ecosistema único en el planeta. “Guacamaya nace a raíz de una exploración de Microsoft y la Universidad de los Andes, de Colombia. Ésta, a través de su Centro de Investigación y Formación en Inteligencia Artificial, CinfonIA, analizó cómo la IA podría ser empleada para abordar desafíos ambientales, entre ellos, la deforestación de la Amazonía. Para iniciar este análisis, una de las herramientas clave era el entrenamiento de un modelo de IA, el que debía priorizar la calidad de los datos. Para eso buscamos colaboradores que tuvieran datos validados y de alta calidad y fue así como nos asociamos con el Instituto Humboldt y el Instituto Amazónico de Investigaciones Científicas, SINCHI”, explica el investigador de CinfonIA, Andrés Hernández Celis.

Según cuenta el investigador, se escogió como foco la Amazonía, porque es una región crucial para la biodiversidad del mundo, especialmente en Colombia, que es el país más biodiverso por kilómetro cuadrado. “La selva amazónica influye en los patrones climáticos y proporciona agua a regiones como Bogotá y los páramos. Sin embargo, la deforestación ha alcanzado un punto crítico y amenaza con desertificar por completo este ecosistema natural, lo que explica que sea urgente tomar medidas poniendo a la IA a disposición de ese objetivo”, indica Hernández. 

Fue así como se resolvió impulsar un monitoreo y una entrega de datos sistemática con IA en tiempo real -o en menor tiempo- capaz de generar las alertas necesarias para tomar acciones antes de que la situación se vuelva irreversible.

IA con impacto ambiental

Guacamaya se alimenta de tres fuentes de datos sobre la Amazonía colombiana: grabaciones bioacústicas, imágenes de cámaras trampa, y datos satelitales de cobertura vegetacional. Mientras las primeras son proporcionadas por el Instituto Humboldt -la principal organización científica de biodiversidad en Colombia y la que posee el mayor repositorio de la región en la materia-, las segundas son un aporte de la Facultad de Ciencias de la Universidad de los Andes. Los terceros, en tanto, son dispuestos por el Instituto SINCHI y el Instituto de Hidrología, Meteorología y Estudios Ambientales (IDEAM). 

El director de Asuntos Corporativos, Externos y Legales de Microsoft para la región Andina Sur, Andrés Rengifo, explica que al integrar datos aéreos, acústicos y de cámaras trampa de la zona, se logra una perspectiva de 360º de la región y, por ende, entrega una comprensión mucho más rica y precisa del entorno. “La IA generativa ofrece valiosos beneficios para descifrar datos y optimizar procesos, y Guacamaya lo demostró conectando toda la información científica, que tradicionalmente ha estado aislada en universidades o institutos de investigación en esta plataforma”, explica.

Las instituciones ligadas a la ciencia aportaron más de 100 mil archivos, datos con los cuales CinfonIA y Microsoft entrenaron los algoritmos capaces de captar, a través de sonidos e imágenes, la presencia de ciertas especies o la ausencia de ellas para. De esa manera, podrían disponer de información útil respecto del estado de la biodiversidad de ese sector del Amazonas. 

“La IA se entrena y refina con el uso continuo de datos, pero los algoritmos utilizados ya tenían una base sólida proveniente de otros análisis similares, lo que permitió su adaptación al ecosistema amazónico. El éxito de este proyecto radica en la sinergia creada entre diversas entidades. Cada institución aporta su experiencia y recursos, creando un efecto multiplicador que resulta en soluciones innovadoras y efectivas para problemas complejos como el cambio climático y la conservación de la biodiversidad”, indica Rengifo.

La compañía tecnológica alimenta a Guacamaya con algoritmos y capacidad de cómputo, esencial para ejecutar modelos intensivos que facilitan la investigación científica y el recurso humano. “Contamos con una sólida capacidad computacional en nuestra plataforma Azure. Nuestro cloud es la base para ejecutar estos sistemas y donde se almacena la información, permitiendo obtener nuevos conocimientos y desarrollar enfoques para entender mejor estos datos. Contribuimos con modelos, herramientas, capacidad computacional y un equipo altamente especializado, dedicado a abordar desafíos sociales y humanos mediante la tecnología”, explica el ejecutivo de Microsoft.

MetodologIA revolucionaria

La introducción de IA al estudio del ecosistema amazónico cambió por completo la forma de obtener la información desde esa reserva biológica mundial. 

Para llegar a tener uno de los repositorios de sonidos naturales más importantes de Sudamérica a lo largo de 25 años -con 25 mil audios de más de 1.300 especies- los biólogos del Instituto Humboldt captaron estos sonidos con grabadoras de capacidad limitada, los que situaban y retiraban de la selva para entregárselas a expertos en reconocimiento de vocalizaciones de veces. Estos pasaban meses escuchando audios e identificando especies. 

Pero la llegada de Guacamaya revolucionó este campo y luego de un año y medio de trabajo, los primeros resultados son evidentes. Hoy los algoritmos de IA no sólo logran identificar sonidos de aves con un 80% de fiabilidad y quintuplicando la cantidad de datos analizados durante el mismo tiempo, sino que además son capaces de detectar amenazas como talas ilegales y maquinaria. “En el área bioacústica, se empleó un modelo en colaboración con Microsoft Speech Lab. Esto, con el fin de convertir los sonidos en espectrogramas, que son representaciones visuales del sonido», explica el investigador de CinfonIA, Andrés Hernández. Estos espectrogramas se utilizan junto con texto natural (nombre de la especie de interés, por ejemplo) para identificar sonidos de aves, insectos o frecuencias específicas, aclara.

El procesamiento de las imágenes de cámaras trampa también está gozando de las bondades de la iniciativa. “Antes, un científico revisaba manualmente más de 100 mil imágenes y ahora Guacamaya lo hace automáticamente, ejecutando un monitoreo 10 veces más rápido y ahorrando un 90% del tiempo. Los algoritmos filtran las útiles e identifican animales específicos, facilitando análisis eficientes y la detección de especies raras o invasoras», explica Rengifo. 

Actualmente, los modelos pre entrenados del proyecto Guacamaya ya están disponibles en Pytorch Wildlife, una plataforma de código abierto de Microsoft para la biodiversidad, que fomenta la colaboración entre desarrolladores del área. “Pytorch Wildlife nos entregó un marco colaborativo de aprendizaje profundo para la conservación, incluyendo diferentes tipos de redes neuronales que abordan tareas específicas del proyecto. Un ejemplo de esto es la segmentación y detección de animales en imágenes de cámaras trampa, utilizando el Megadetector de Microsoft», explica el investigador Andrés Hernández.

Otro aporte sustantivo de Guacamaya es su capacidad para interpretar en tiempo real las imágenes satelitales del bosque amazónico. Según los datos oficiales del Instituto de Hidrología, Meteorología y Estudios Ambientales de Colombia, el IDEAM, la Amazonía colombiana perdió más de 40.000 hectáreas entre 2021 y 2022. “Guacamaya utiliza imágenes de alta resolución para monitorear la pérdida de bosques, lo que agiliza los informes sobre la cobertura forestal y permite tomar decisiones informadas para la conservación casi en tiempo real. Esto marca una diferencia con los informes tradicionales, que tenían un retraso de hasta 18 meses en Colombia», aclara Andrés Rengifo.

Código abierto

El investigador de CinfonIA, Andrés Hernández, destaca que el mayor desafío técnico en el entrenamiento de los algoritmos ha sido la gestión de datos. «Por ejemplo, es crucial contar con imágenes detalladas de cámaras trampa para identificar especies con precisión. Esto es difícil debido a las variaciones en las imágenes y la distribución desigual de las especies en la base de datos. Algunas especies son comunes y están sobrerrepresentadas, mientras que las raras aparecen menos de 100 veces. Esta desigualdad presenta un reto considerable, ya que es necesario manejar una distribución desbalanceada en los datos”.

Lo anterior explica por qué los megadatos que cada pilar -las cámaras trampa, los sonidos y la cobertura naturalista- han sido entrenados a través de modelos propios o predeterminados, siendo los algoritmos bioacústicos y de cámara trampa los más avanzados. “En el de imágenes satelitales estamos afinando la consistencia temporal, lo que permitirá producir resultados confiables en diferentes momentos y evitar la inestabilidad en los bordes de los mapas de cobertura forestal. Así, mejorará la precisión de las mediciones de hectáreas reforestadas. El objetivo principal de nuestro modelo es ampliar las investigaciones actuales integrando los tres pilares del proyecto en una plataforma para analizar la relación entre la pérdida de biodiversidad: los patrones migratorios de los animales y la deforestación en diferentes regiones”, explica Hernández.

Para lograr esa escalabilidad, Guacamaya se diseñó como una plataforma abierta para la colaboración científica y en esta nueva fase, tras su lanzamiento oficial a fines de 2023, busca consolidar los datos en la plataforma Azure e invitar a más instituciones internacionales a participar en el monitoreo de la Amazonía. “Este proyecto se diseñó así para permitir que otros miembros de la comunidad científica y países como Perú, Ecuador, Bolivia, Brasil, Paraguay, Venezuela, Surinam, Guyana y Guayana Francesa, puedan sumarse y contribuir. La colaboración abierta es esencial para abordar retos como el cambio climático y tener una mirada global y más comprensiva de lo que está ocurriendo en este ecosistema”, afirma el ejecutivo de Microsoft, Andrés Rengifo.

Se vuelve vital, entonces, sumar datos de diversas fuentes para seguir mejorando los algoritmos y generar análisis más profundos y precisos sobre la Amazonía. Para ello, el código fuente de los modelos y la plataforma están disponibles para cualquier centro de investigación o científico interesado en contribuir a la protección de este lugar. “En Microsoft creemos que la tecnología es una herramienta crucial para enfrentar retos como el cambio climático. Hemos recibido apoyo de científicos y del gobierno colombiano, quienes han aportado datos y mostrado entusiasmo al ver cómo opera la plataforma y ver el potencial de la colaboración tecnológica en la conservación de la biodiversidad”, dice el ejecutivo de Microsoft.

El equipo de Guacamaya sigue trabajando en mejorar los algoritmos y espera tener modelos funcionales en cada una de las categorías para presentar los avances de esta iniciativa en la COP16 de Cali, Colombia. “Esta iniciativa no es solo responsabilidad de un país o un grupo de personas, sino que es un esfuerzo conjunto que involucra a toda la región amazónica y más allá. Nuestro objetivo es expandir esta herramienta a instituciones y organizaciones de otros países que trabajan en la Amazonía para que se unan al proyecto Guacamaya. La Amazonía no es solo un tesoro natural, sino también el pulmón del planeta que regula el clima global. Proteger este invaluable ecosistema es una responsabilidad compartida que trasciende fronteras y requiere un esfuerzo conjunto de todos los países amazónicos y la comunidad internacional”, concluye el investigador de CinfonIA.

Compartir:

Mas noticias

OBIA, el Observatorio Brasileño de IA

Como respuesta al impacto de la IA en los ecosistemas productivos, educativos y comerciales, así como para garantizar la transparencia y responsabilidad en su uso,