Détection des arbres à partir de données d’imagerie à très haute résolution dans les zones exposées à la sécheresse
(1) Thomas Onfroy - Département R&D Modélisation, CCR
(2) Aurélien Couloumy - Digital Factory, CCR
(3) Antoine Labonne - Digital Factory, CCR
(4) Michel Médic - Institut Paris Région
(5) Jean-Baptiste Henry - Esri France
INTRODUCTION
La présence d’arbres à proximité des maisons individuelles, est l´un des facteurs aggravants de l’aléa sécheresse RGA (Retrait-Gonflement des Argiles) en France métropolitaine [1]. Dans certains cas, elle peut même être la cause déterminante des dommages. Dans l’objectif d’intégrer ce phénomène en tant que paramètre du modèle d’aléa sécheresse RGA de CCR, une étude de détection des arbres à l´échelle infraparcellaire a été menée sur le territoire d´une commune d´Île-de-France exposée au péril RGA : Montigny-le-Bretonneux. Dans le cadre de la prévention de ce risque, la distance préconisée par le ministère de la Transition écologique et de la Cohésion des territoires entre un arbre et le périmètre extérieur d’une maison peut varier de 0,5 H à 1,5 H, c’est-à-dire une distance correspondante à 0,5 ou 1,5 fois la hauteur de l’arbre, selon son essence. Les techniques actuelles de télédétection et d’Intelligence Artificielle permettent aujourd’hui une géolocalisation précise de chaque arbre à partir de données d’imagerie à Très Haute Résolution (THR, pour une résolution inférieure au mètre).
Au-delà de la distinction de la couverture arborée des autres types d’occupation du sol par télédétection, les caractéristiques de l’arbre telles que le diamètre de la couronne et la hauteur de la cime à une date donnée sont des informations clés pour l´étude. Elles peuvent être collectées à partir de l’extraction des valeurs altimétriques contenues dans les données LIDAR (Laser Imaging Detection and Ranging) ou issues de traitements de MNS (Modèles Numériques de Surfaces) et de MNT (Modèle Numérique de Terrain) en THR. La combinaison de méthodes de télédétection de la couverture arborée sur des images aériennes à 20 cm de résolution (BD ORTHO HR de l’IGN), de tâches de Deep Learning dédiées à la détection de chaque individu (Object Detection) et de traitements SIG des données altimétriques conduisent ainsi à une localisation précise des arbres et de leurs dimensions. Afin d’évaluer la faisabilité d’une telle étude et dans l’optique de l’appliquer à l’échelle de la métropole, des travaux ont été initialement menés sur le territoire d´une commune. Les résultats obtenus ont permis de localiser les arbres, de connaître leurs dimensions à proximité de chaque habitation et de proposer un indicateur d’exposition relatif à la présence d´arbres. En cas de généralisation de la méthode à l’ensemble du territoire national, les données cartographiques produites permettront d’améliorer la compréhension des causes de la sinistralité RGA et prendre en compte la présence des arbres dans la modélisation des dommages consécutifs
MÉTHODOLOGIE
Pour localiser et mesurer précisément la hauteur, la distance et la densité des arbres à proximité des maisons individuelles, une approche hybride a été adoptée. Celle-ci combine :
- des méthodes de télédétection sur les images de la BD ORTHO HR de l’IGN à 20 cm ;
- la détection automatisée de l´emprise de chaque arbre par Deep Learning à partir de la BD ORTHO HR et d´extraits du LIDAR HD de l´IGN ;
- le traitement de données altimétriques en THR : Modèle Numérique de Surface à 20 cm de l’Institut Paris Région et Modèle Numérique de Terrain RGE ALTI à 1 m de l’IGN ;
- des analyses spatiales SIG sur les bâtiments de la BD TOPO de l´IGN.
La mise en œuvre d’une méthodologie favorisant la complémentarité entre méthodes de télédétection, techniques d´Intelligence Artificielle (Deep Learning Object Detection) et analyses SIG a permis de proposer un indicateur en fonction de la hauteur et de la proximité des arbres aux bâtis : le TreeBatiScore. En premier lieu, la couverture arborée est cartographiée à 20 cm de résolution avec l’indice NDVI (Natural Difference Vegetation Index) à partir des images BD ORTHO HR RVB (bandes Rouge, Vert, Bleu) et IRC (Couleurs Infrarouge) de l’IGN. L’indice NDVI est considéré comme l’un des plus efficaces pour distinguer la végétation des autres types d’occupation du sol sur tous types de données optiques RVB et IRC [2]. Le résultat du NDVI est une image à 20 cm de résolution dont les valeurs des mailles vont de -1 à 1. Le seuil considéré pour extraire les zones végétalisées et les arbres est de 0.1. Toutes les valeurs inférieures à 0.1 correspondent à d’autres types d’occupation du sol [3].
# arbres
# sécheresse RGA
# imagerie THR
# télédetection
# apprentissage profond
# détection d’objet
La hauteur de la végétation et des arbres est ensuite estimée par la soustraction entre un Modèle Numérique de Surface (MNS à 20 cm de l´Institut Paris Région) et un Modèle Numérique de Terrain (MNT RGE ALTI 1m de l´IGN). Cela permet d´obtenir le Canopy Height Model (CHM) à 20 cm. Le CHM résultant permet de connaître les valeurs altimétriques de tous les éléments du sursol y compris celles de la végétation. La plupart des haies et buissons ne dépassent pas 3 m de hauteur sur la commune de l´étude. Ainsi, le seuil choisi pour définir un arbre est ici de 3 m. Cela permet de masquer toutes les valeurs du CHM inférieures à 3 m et d’obtenir une cartographie des arbres (caractérisés en amont par l´indice NDVI) et de leur hauteur (figure 1).
Parallèlement aux traitements réalisés par télédétection et SIG, un modèle de Deep Learnig “Deep Forest” [4] de type Détection d’Objet a été utilisé pour identifier chaque arbre à partir de la BD ORTHO HR RVB à 20 cm. Ce modèle a dû être réentraîné compte tenu de la spécificité de la tâche (images du National Ecological Observatory Network 10 cm contre images BD ORTHO 20 cm).
Afin de réentraîner le modèle, un travail d’annotation a été nécessaire. Des « bounding boxes » de pré-annotation ont été déterminées à partir de la base LIDAR HD de l’IGN. Plus exactement, les points LIDAR correspondant à la végétation haute ont d’abord été sélectionnés puis analysés à l’aide de la librairie PyCrown [5]. Un travail de post-processing a permis de reproduire ces « bounding boxes » pour chaque arbre détécté. Ces pré-annotations ont grandement facilité le travail d’annotation manuel final. Cela a permis de réentraîner DeepForest sur 2 zones LIDAR : Louhans (Saône-etLoire) et Manosque (Alpes-de-Haute-Provence).
Après prise en compte de seuils de détection (fonction softmax), une augmentation significative des performances du modèle au regard du modèle pré entraîné a été observée sur la base de test de Montigny-le-Bretonneux.
En sortie de ce modèle, des emprises rectangulaires sont obtenues pour chaque arbre. Comme on peut l’observer sur certaines parties de la Figure 3, certains arbres ne sont pas détectés par l’indice NDVI mais le sont par les emprises obtenues par Deep Learning et réciproquement.
Ainsi, les différentes approches de traitement d´image (indice NDVI, CHM et tâches Deep Learning) se complètent pour une minimisation des données manquantes. Cette complétion réciproque est non négligeable et rend les deux approches complémentaires.
À partir du CHM à 20 cm et d´une fonction de l’outil “R-ArcGIS ForestTools” [6], les cimes des arbres sont localisées par un algorithme de fenêtre glissante. Lorsqu’une cellule du CHM donnée se trouve être la plus haute dans la fenêtre, elle est étiquetée comme le point le plus haut de la canopée. Ce point est appelé le Tree Top Maxima. Les valeurs maximales de chaque arbre sont ensuite utilisées en tant que zones tampons dont le rayon représente la distance de sécurité entre l´arbre et le périmètre extérieur de l´habitation. On peut noter que pour chaque arbre détecté par l´approche Deep Learning et non-détecté par le NDVI le Tree Top Maxima est également récupéré dans chaque emprise par une fonction de statistique zonale.
La distance préconisée entre un arbre et une habitation peut varier de 0.5 H à 1.5 H en fonction de l’espèce d’arbre. La classification des espèces d’arbres à partir d’imagerie en THR nécessite une étude de télédétection approfondie qui n’a pas été priorisée dans la présente étude.
# arbres
# sécheresse RGA
# imagerie THR
# télédetection
# apprentissage profond
# détection d’objet
Ainsi, la distance arbre-maison est ici fixée à 1 H. Le linéaire de mur exposé peut-être calculé sous SIG avec la couche de la BD TOPO de l´IGN. Il s’agit du linéaire de mur en rouge sur la Figure 4. La généralisation de cette méthodologie à l’ensemble du territoire national soulève des enjeux pratiques et techniques majeurs. En premier lieu, la question de la disponibilité de données d’imagerie comparables en résolutions spatiale et spectrale, d’un millésime suffisamment récent sera au cœur de la reproductibilité de l’approche. La présente étude a été menée à l’échelle d’une commune comportant un certain échantillon de végétation. Aussi, la généralisation à un territoire plus vaste imposera un entrainement complémentaire et extensif des modèles de Deep Learning. Se posera ensuite la problématique de la gestion technique du volume de données engendré par ces diverses couvertures à très haute résolution, tant sur leur mode de stockage, de diffusion que de traitement. Enfin, cette méthodologie ne donnera tout son potentiel qu’avec une capacité à suivre l’évolution de la couverture végétale et l’imperméabilisation des sols dans le temps, à partir de données régulièrement mises à jour, accentuant d’autant plus le besoin d’une automatisation complète des procédés d’extraction.
Figure 1 – Canopy Height Model et Modèle Numérique de Surface à 20 cm
Figure 2 – Exemple de traitement PyCrown des données LiDAR et post-traitement
Figure 3 – Emprises des arbres produites par Deep Learning et avec le CHM (Canopy Height Model)
Figure 4 – Périmètre exposé par habitation (linéaire de mur en rouge)
Figure 5 – Résultats du TreeBatiScore sur les maisons de particuliers (Pourcentage du linéaire de mur exposé)
LES PARTENAIRES
L’Institut Paris Région a pour mission essentielle de réaliser des études et travaux nécessaires à la prise de décision de la Région Île-de-France et de ses partenaires. De l’échelon local à l’échelon des grandes métropoles, il intervient dans de nombreux domaines tels que l’urbanisme, les transports et la mobilité, l’environnement, l’économie et les questions de société. Il apporte son soutien aux politiques d’aménagement et de développement des communes, des intercommunalités et des départements. Il réalise également pour les organismes qui lui en font la demande des études, tant en Île-de-France qu’à l’étranger.
Esri France distribue et développe les usages d’ArcGIS, la plateforme cartographique et d’analyse spatiale d’Esri Inc. La société propose des solutions bureautiques et en ligne complètes en valorisant l’approche géographique.
Fondée en 1969 sous le nom d’Environmental Systems Research Institute en tant que société de conseil en aménagement du territoire, l’entreprise possède 10 bureaux régionaux aux États-Unis et plus de 80 distributeurs à l’international, avec environ un million d’utilisateurs dans 200 pays et 3 800 employés dans le monde.
RÉSULTATS
Ces travaux ont permis de localiser chaque arbre sur des données d´imagerie en THR et de mesurer leur hauteur et leur distance par rapport aux habitations.
Le pourcentage de linéaire de mur extérieur exposé par un ou plusieurs arbres trop proches en fonction de leur taille, et selon une distance de sécurité arbremaison de 1 H, a été calculé pour chaque habitation. Le TreeBatiScore visible sur la Figure 5 correspond au pourcentage du linéaire de mur extérieur exposé par habitation. La présence d’arbres à proximité directe des fondations d’une maison individuelle contribue à l’aggravation de l´aléa sécheresse RGA, cependant, d’autres facteurs physiques et structurels participent aux dommages RGA sur les maisons individuelles [7].
L’environnement de chaque parcelle doit également être considéré : pentes, présence de drains, de réseaux de recueil des eaux de pluie, de puisards ou tranchées techniques d’alimentation d’eau, profondeur et emprise des réseaux d’électricité ou de gaz. Ces éléments ne sont pas tous disponibles et leur numérisation à l´échelle du territoire métropolitain reste incomplète. Les données relatives aux matériaux de construction et à la structure de chaque bâtiment peuvent être utilisées et mises en relation avec les informations propres à l’aléa sécheresse RGA. Sur ce dernier point, la Base de Données Nationale des Bâtiments (BDNB) sera explorée. Lorsque l´ensemble de ces données (environnement de la parcelle et matériaux de construction) seront disponibles sous forme de base de données géographiques, celles-ci pourront être prises en compte en tant que facteurs aggravants du péril RGA et intégrées dans un indicateur multicritère.
CONCLUSION
La combinaison de méthodes de télédétection à partir de données d´imagerie à Très Haute Résolution (THR) et d´un modèle de Deep Learning a permis de localiser précisément les arbres à proximité des maisons. Pour délimiter les couronnes des arbres et une estimation de la hauteur de chaque individu, un Modèle Numérique de Surface, un Modèle Numérique de Terrain ou des données LIDAR à THR sont des données essentielles.
Les résultats du TreeBatiScore, basés sur la présence des arbres, pourront être croisés avec les données géolocalisées liées au péril RGA. La proximité des arbres aux bâtis n’étant pas le seul facteur aggravant, les données relatives à l’environnement des habitations et aux matériaux de construction doivent être utilisées afin d’établir un diagnostic complet de la vulnérabilité des maisons.
Afin de généraliser les méthodes employées sur l’ensemble du territoire, la problématique de la gestion et du stockage des données devra être considérée. La capacité à suivre l’évolution de la couverture végétale et la hauteur de chaque arbre dans le temps imposera une automatisation complète des procédés d’extraction.
Les données du LIDAR HD de l’IGN, disponibles à partir de fin 2025 sur toute la métropole, permettront de décrire très précisément l’altitude du terrain et les éléments du sursol y compris le couvert végétal. In fine, lorsque les données sur les arbres seront produites à l’ensemble du territoire national, celles-ci pourront être utilisées en entrée du modèle RGA interne afin d’améliorer la prédiction des sinistres./
RÉFÉRENCES
1. Li, J., & Guo, L. (2017). Field investigation and numerical analysis of residential building damaged by expansive soil movement caused by tree root drying. Journal of Performance of Constructed Facilities
2. Tucker, C.J. (1979) ‘Red and Photographic Infrared Linear Combinations for Monitoring Vegetation’, Remote Sensing of Environment
3. Kang, et al. (2021) Land Cover and Crop Classification Based on Red Edge Indices Features, MDPI Remote Sensing
4. Weinstein, et al. (2019) Individual Tree-Crown Detection in RGB Imagery Using Semi-Supervised Deep Learning Neural Networks. Remote Sensimg
5. Zörner, , et al. (2018) PyCrown - Fast raster-based individual tree segmentation for LiDAR data. Landcare Research NZ Ltd
6. Plowright. (2021) Canopy analysis in R using Forest Tools, CRAN-R Project
7. IFSTTAR 2017. Retrait et gonflement des argiles Analyse et traitement des désordres créés par la sécheresse, Guide Tecnique IFSTTAR
CITATION
Onfroy et al., Détection des arbres à partir de données d´imagerie à Très Haute Résolution dans les zones exposées au péril Retrait Gonflement des Argiles In Rapport Scientifique CCR 2022 ; CCR, Paris, France, 2022, pp. 23-27