L'herbe de la pampa, une plante ornementale à plumes originaire d'Amérique du Sud, s'est répandue bien au-delà des jardins, envahissant les écosystèmes du monde entier. Au Portugal, cette graminée tenace n'a cessé d'étendre son aire de répartition, déplaçant les plantes indigènes et perturbant les habitats.
Garder un œil sur la progression incessante des plantes envahissantes comme l'herbe de la pampa est essentiel pour protéger la biodiversité, mais c'est plus facile à dire qu'à faire. Les méthodes de surveillance traditionnelles, qui reposent sur des enquêtes sur le terrain et sur des experts identifiant minutieusement les plantes, sont coûteuses et prennent du temps.
Mais et si nous pouvions réaliser cette tâche herculéenne en exploitant les millions de photos de plantes partagées chaque jour sur les réseaux sociaux ? Ana Sofia Cardoso et ses collègues ont tenté d'exploiter la puissance de l'intelligence artificielle pour parcourir les réseaux sociaux à la recherche d'images de l'herbe incriminée.
Leurs détectives de plantes IA, formés sur des photos identifiées par des experts provenant de bases de données scientifiques citoyennes, se sont révélés remarquablement habiles à repérer l’herbe de la pampa dans toutes sortes d’images. Les résultats, publiés dans la revue Ecological Informatics, font allusion à un nouveau paradigme pour surveiller la propagation des espèces envahissantes : un paradigme plus rapide, moins cher et plus évolutif que jamais.
Rencontrez les détectives des plantes IA : un trio de modèles d'apprentissage profond avec un œil attentif sur l'herbe de la pampa.
Pour entraîner leurs algorithmes à identifier avec précision cette plante envahissante, l'équipe de recherche a commencé par leur fournir des photos savamment étiquetées provenant de plateformes de science citoyenne comme Invasoras.pt et INaturalist. Ces images, minutieusement annotées par des bénévoles compétents, constituent une référence en matière de ce à quoi ressemble l’herbe de la pampa à l’état sauvage.
L’équipe a mis à l’épreuve trois architectures d’apprentissage profond différentes : DenseNet201, R-CNN ResNet50 plus rapide et Création R-CNN plus rapide-v2. Le premier modèle, un spécialiste de la classification, a appris à étiqueter les images comme contenant ou non de l'herbe de la pampa. Les deux autres, des modèles de détection d’objets, sont allés plus loin en apprenant à dessiner des cadres de délimitation autour de la plante dans des images.
Après une formation approfondie, les modèles ont été testés sur un nouvel ensemble d’images de science citoyenne. Les résultats ont été impressionnants : les modèles les plus performants, DenseNet201 et Faster R-CNN ResNet50, ont correctement identifié l'herbe de la pampa dans plus de 94 % du temps. Lorsque les algorithmes commettaient des erreurs, c’était souvent sur des images plus délicates, où l’herbe était petite, floue ou en arrière-plan.
Mais le véritable défi était encore à venir. Les chercheurs voulaient voir si leurs détectives de plantes IA pouvaient repérer l’herbe de la pampa « à l’état sauvage » – non pas dans des photos de science citoyenne, mais dans le flux non filtré d’images publiées sur les réseaux sociaux. Ils ont lancé les algorithmes sur des centaines d’images récupérées sur Instagram, Flickr, Twitter et Facebook.
Remarquablement, les modèles ont tenu bon, identifiant correctement l’herbe de la pampa dans plus des trois quarts des photos des réseaux sociaux. Selon les chercheurs, la baisse des performances provient de la qualité et de la résolution inférieures de nombreuses images des réseaux sociaux. Ces résultats suggèrent que les modèles d’apprentissage profond, formés sur un ensemble relativement restreint de photos, peuvent traduire efficacement ces apprentissages dans le monde non structuré de l’imagerie des médias sociaux.
Pourquoi Instagram?
Des sites comme Instagram peuvent fournir des photos en volume, mais une photo seule ne suffit pas. Ce qui rend une photo partagée sur les réseaux sociaux si utile, ce sont les données qui l'accompagnent. De nombreuses images partagées sur des plateformes comme Instagram et Flickr sont accompagnées de données de localisation, de coordonnées de latitude et de longitude intégrées qui indiquent exactement l'endroit où la photo a été prise. En extrayant ces géolocalisations à partir d'images signalées comme contenant de l'herbe de la pampa, les chercheurs ont pu cartographier la répartition de la plante envahissante avec une précision sans précédent.
L’équipe a concentré ses efforts sur des photos publiées entre 2019 et 2021, une période d’expansion rapide de l’herbe de la pampa au Portugal. Comme ils l'espéraient, les cartes générées par l'IA ont révélé un certain nombre d'observations d'herbe de la pampa jusqu'alors non documentées, en particulier dans les régions du nord, du littoral et du sud du pays.

La comparaison des détections géolocalisées d'une année à l'autre dressait un tableau troublant : l'herbe de la pampa était en mouvement, apparaissant dans de nouveaux endroits et remplissant son aire de répartition au fil des années. D’une simple dispersion de détections en 2019, l’herbe s’est répandue dans plus du double du nombre d’emplacements en 2021.
Bien que les résultats soient inquiétants du point de vue de la conservation, ils mettent en valeur le potentiel de cette approche de surveillance des espèces envahissantes basée sur l’IA et les médias sociaux. En révélant les points chauds de l'herbe de la pampa et en suivant la propagation de la plante en temps quasi réel, ces cartes pourraient aider à orienter les efforts critiques de détection précoce et de réponse rapide.
Le dépistage des espèces d’IA n’est pas quelque chose comme Conservation-GPT
L'IA est vraiment le mot à la mode en 2024, mais l'IA utilisée par Cardoso et ses collègues est très différente des grands modèles de langage, comme Chat-GPT, qui font la une des journaux. Cardoso et ses collègues soulignent l'importance de l'intelligence humaine dans le système. Les photos d'herbe de la pampa utilisées pour entraîner l'IA sont explicitement identifiées grâce à l'expertise de la communauté iNaturalist. Les chercheurs soulignent également certaines limites.
D’une part, les modèles d’IA ne sont actuellement fiables que pour identifier l’herbe de la pampa lorsqu’elle est en pleine floraison plumeuse. Au cours d’autres étapes de son cycle de vie, lorsque la plante n’a pas ses panaches distinctifs, elle peut être difficile à distinguer des autres espèces de graminées. Cela signifie que certaines populations d'herbes de la pampa, en particulier celles plus jeunes ou récemment établies, pourraient passer inaperçues par l'IA.
Les humains limitent également la provenance des données. Les gens ont tendance à prendre et à partager des photos dans certaines zones, comme les villes, les parcs et les attractions touristiques, plus que dans d’autres. Cela signifie que les cartes générées par l’IA pourraient surreprésenter les populations d’herbes de la pampa dans ces endroits populaires, tout en manquant d’observations dans les zones plus reculées ou moins fréquentées.
Pour relever ces défis, les chercheurs travaillent déjà d’arrache-pied sur la version 2.0 de leurs détectives d’usines IA. Ils explorent les moyens de former les modèles sur un ensemble plus diversifié d'images d'herbe de pampa, montrant la plante à différents stades de vie et dans une plus grande variété d'habitats. Ils étudient également des méthodes permettant de prendre en compte et de corriger les biais inhérents aux données géolocalisées des réseaux sociaux.
Les chercheurs soulignent que leurs outils d’IA sont destinés à compléter, et non à remplacer, l’expertise des écologistes humains et des défenseurs de l’environnement. Mais en automatisant certaines tâches fastidieuses ou chronophages, comme passer au crible des milliers de photos, ces algorithmes pourraient libérer de précieuses ressources humaines pour les consacrer à une stratégie de plus haut niveau et à des actions sur le terrain.
Il est également possible d'étendre cette approche à d'autres espèces envahissantes, des algues à la moule zébrée. Même si les détails diffèrent, l’idée de base – utiliser les données des médias sociaux et l’IA pour cartographier les invasions en temps réel – pourrait changer la donne dans le domaine de l’écologie des invasions.
Les chercheurs préviennent qu’il existe des considérations éthiques
Ces applications ont le potentiel de soutenir l'identification des domaines prioritaires pour les efforts d'éradication, l'allocation efficace des ressources et l'évaluation du succès des interventions de gestion au fil du temps. Néanmoins, nous sommes également conscients des obstacles potentiels à l’acceptabilité et à la confiance dans l’utilisation des outils d’intelligence artificielle et des contenus générés par les utilisateurs par ces organisations, en particulier dans le contexte de questions sociales telles que l’éthique et l’équité.
Cardoso et al. 2024/XNUMX/XNUMX
La question éthique est de savoir s’il est acceptable que les scientifiques utilisent des images publiques sur les réseaux sociaux. Les images sur iNaturalist sont soumises dans le but d'aider la recherche scientifique. Les images sur Instagram ou d'autres sites de réseaux sociaux sont téléchargées pour de nombreuses raisons. La puissance de l’utilisation de ces sites réside dans le grand nombre d’images pouvant être numérisées. Cependant, ce volume de données signifie également qu’il n’est pas pratique de rechercher un consentement actif pour toutes les images. Pouvons-nous supposer que les gens ne s’opposent pas à ce que leurs photos soient utilisées pour suivre les espèces envahissantes ?
Le poison de cette hypothèse est qu’il existe d’autres outils qui utilisent l’analyse photo par l’IA pour la reconnaissance faciale. L'un de ces sites propose volontiers des liens vers des actualités sur comment ses outils peut être utilisé pour le cyberharcèlement. Il est facile de comprendre pourquoi il peut y avoir un manque de confiance dans de tels systèmes. Pour cette raison, Cardoso et ses collègues déclarent : « il est essentiel de souligner la transparence et l’équité du flux de travail global adopté, en abordant tout préjugé ou préoccupation éthique associée aux applications d’apprentissage profond et à l’utilisation de données personnelles. »
Si ces préoccupations éthiques peuvent être résolues, la numérisation photographique pourrait alors s’avérer un outil précieux pour lutter contre les espèces envahissantes. Si maintenant
LIRE L'ARTICLE:
Cardoso, AS, Malta-Pinto, E., Tabik, S., August, T., Roy, HE, Correia, R., Vicente, JR et Vaz, AS (2024) «La science citoyenne et les images des réseaux sociaux peuvent-elles aider à détecter de nouveaux sites d’invasion ? Un cas de test d'apprentissage profond avec Cortaderia Selloana, » Informatique écologique, (102602), p. 102602. Disponible à : https://doi.org/10.1016/j.ecoinf.2024.102602.
Image de couverture : Herbe de la pampa par JLPC / Wikimédia Commons.
