Premières validations de la carte d'occupation du sol OSO

En 2017, le Centre d'Expertise Scientifique OSO (Occupation du SOl) par l'intermédiaire du CESBIO a produit une carte d'occupation du sol de l'année 2016 à l'échelle du territoire métropolitain français et corse. On l'appelle la carte d'occupation du sol OSO ! Cette carte est le résultat de traitements automatiques massifs de séries temporelles d'images satellites optiques Sentinel-2. Comme les images Sentinel-2, cette carte a une résolution spatiale de 10 m correspondant à une unité minimale de collecte (UMC) de 0.01 ha. L'occupation du sol est décrite grâce à 8 classes au premier niveau et 17 classes à second niveau de détail, définies en fonction des potentialités de détection de l'imagerie Sentinel-2 et des besoins exprimés par des utilisateurs finaux. Ces classes couvrent les grands thèmes d'occupation du sol (surfaces artificialisées, agricoles et semi-naturelles).

Son principal avantage en comparaison avec d'autres cartes d'occupation du sol existantes, (loin de nous l'idée de les critiquer) est son exhaustivité territoriale et surtout sa fraîcheur ! Disposer d'une carte d'occupation du sol exhaustive sur l'ensemble du territoire national au premier trimestre de l'année suivante, c'est ce qu'OSO vous propose !

Quelle richesse thématique ?

Les classes détectées par télédétection sont celles du second niveau, celles du premier niveau sont obtenues par agrégation des classes du second niveau :

  • Culture annuelle
    • Culture d'hiver
    • Culture d'été
  • Culture pérenne
    • Prairie
    • Verger
    • Vigne
  • Forêt
    • Forêt de feuillus
    • Forêt de conifères
  • Formation naturelle basse
    • Pelouse
    • Lande ligneuse
  • Urbain
    • Urbain dense
    • Urbain diffus
    • Zone industrielle et commerciale
    • Surface route / asphalte
  • Surface minérale
    • Surfaces minérales
    • Plages et dunes
  • Eau
    • Eau
  • Glaciers et neiges éternelles
    • Glaciers et neiges éternelles

Avec quelle qualité ?

Valider une carte d'occupation n'est pas une procédure simple. Il s'agit de s'interroger sur :

  • la spécification des classes
  • l'échelle de validation
  • le jeu de données de validation

Dans tous les cas, il est rarement possible d'établir une validation exhaustive sur l'ensemble d'un territoire. Classiquement, une validation statistique permet d'appréhender partiellement la précision de la cartographie obtenue, et ne permet pas d'identifier l'ensemble des confusions thématiques et des erreurs géométriques de classification.

La suite de cet article tente de qualifier la précision de la carte d'occupation du sol OSO de 2016 grâce à des jeux de données de partenaires du CES OSO. Une première validation, intrinsèque au processus de classification, a été effectuée. Les résultats statistiques sont visibles ici.

Le jeu de données d'échantillons de la couverture de surface a été produit grâce à des bases de données nationales telles que la BD Topo, le Registre Parcellaire Graphique (RPG) et Corine Land Cover. 70% de ces échantillons ont été utilisés pour l'apprentissage et 30% pour la validation a posteriori visible sur la figure ci-dessous. Cette validation, bien que pertinente, s'appuie sur des échantillons dont la génération suit la même procédure que les échantillons d'apprentissage, biaisant quelque peu l'indépendance de la validation.

Validation de la carte d'occupation du sol OSO avec 30% des échantillons extraits des 3 jeux de données utilisés lors de la classification - BD Topo, Registre Parcellaire Graphique et Corine Land Cover)

De plus, il nous était impossible de valider les deux cultures annuelles de la classification. En effet, l'indisponibilité du RPG pour l'année 2016 et 2015 (toujours indisponible le jour de l'écriture de cet article), nous a amené à développer une méthode d'apprentissage basée sur le principe de l'adaptation de domaine utilisant des échantillons du RPG 2014. Cette méthode est très bien expliquée ici. Quoiqu'il en soit, il nous était impossible de valider la classification des cultures d'été et d'hiver de 2016, seuls des échantillons issus du terrain nous le permettait, en voilà la preuve !

Continue reading

Les séries temporelles d'images à haute résolution pour la modélisation des échanges de surface

English version right here.

 

Les modèles de surface simulent les échanges d’eau et d’énergie entre le sol, le couvert (végétal ou non) et l’atmosphère. Leurs  applications vont de  la prévision numérique du temps à la modélisation de l’état hydrique des sols.

 

Bilans d’eau et d’énergie du continuum sol-plante

 

Cependant, ces modèles, initialement conçus pour simuler de grandes étendues, utilisent des paramètres du couvert à basse résolution (au-delà du kilomètre) qui sont issus des observations satellites à moyenne  résolution (MODIS, VEGETATION). Ces paramètres sont principalement l’indice foliaire, le type de végétation, l’albédo de la surface. Or, les paysages agricoles d’Europe de l’Ouest sont caractérisés par un patchwork de cultures avec des parcelles bien inférieures au kilomètre carré et des cycles de végétation très différentes (cultures d’été, cultures d’hiver, …) qui ne peuvent être décrits qu’à haute résolution. De plus, les pratiques culturales (dites anthropiques car liées à une action de l’homme) comme la rotation des cultures ou l’irrigation, ne sont également généralement pas prises en compte.

 

Les produits satellite à haute résolution spatiale et temporelle issus de la mission Sentinel-2 peuvent contribuer à palier à ces lacunes puisqu’ils ont une résolution inférieure à l’échelle de la parcelle.

 
Continue reading

La première carte d'occupation des sols 2016 de la France avec Sentinel-2

=>

(article copié depuis le blog OSO)

Poster_OSO_V4.png

Une fois n'est pas coutume, nous sommes en avance. Enfin, presque. Nous avions promis une carte d'occupation des sols 2016 de la France métropolitaine avant la fin du premier trimestre 2017. Elle existe et est disponible ici. Il s'agit d'une carte à 10 m de résolution, avec la même nomenclature que celle utilisée pour les derniers produits prototypes Landsat à 17 classes.

La carte est principalement basée sur des données Sentinel-2 allant de fin 2015 à fin 2016, mais nous avons aussi utilisé des données Landsat-8. Nous vous donnons les détails de la procédure de production plus bas.

Continue reading

La chaîne d'occupation des sols iota2 sait maintenant traiter Sentinel-2

=>

Vous connaissez déjà la chaîne iota2 et vous savez qu'elle sait traiter les séries temporelles Landsat8 et générer des cartes d'occupation des sols. Ces derniers jours, Arthur Vincent a terminé le code permettant d'utiliser les séries temporelles Sentinel-2. Même si nous n'avons pas encore des séries Sentinel-2 sur toute la France (mais elles devraient arriver bientôt), nous avons utilisé des produits de démonstration fournis par THEIA pour valider la chaîne de traitement.

 

Tout a l'air de bien marcher et la résolution de 10m. de Sentinel-2 permet d'avoir beaucoup plus de détails au niveau des cartes produites. Voici 2 extraits (près d'Avignon) qui montrent la différence entre Landsat8 (en haut) et Sentinel-2 (en bas). Attention, la comparaison n'a de sens qu'en termes de détail spatial : les cartes ne correspondent pas aux mêmes périodes d'acquisition, seuls quelques mois de données Sentinel-2 ont été utilisés, sans la période estivale, et les données de référence sont légèrement différentes. Il ne faut pas tirer donc de conclusion par rapport à la qualité thématique de ces cartes.

 

Le premier extrait montre une zone de végétation naturelle avec un peu d'agriculture (en haut LANDSAT8, en bas Sentinel-2)

coudoux.png

Continue reading

Nouvelle version des produits d'occupation des sols OSO sur la France en 2014

=>

Nous avons beaucoup travaillé sur la procédure de génération des cartes d'occupation des sols ces derniers mois. Trois axes principaux1 ont été abordés par Arthur Vincent et David Morin au Cesbio :

  1. Le portage et la validation de la chaîne de traitement iota2 sur l'infrastructure de calcul à haute performance (HPC) du Cnes.
  2. L'amélioration de la procédure de préparation des données de référence utilisées pour l'apprentissage des classifieurs et la validation des cartes produites.
  3. La mise au point de la stratification qui permet de spécialiser les algorithmes de classification par zone éco-climatique, par exemple.

En utilisant toutes ces nouveautés, nous avons produit beaucoup (vraiment beaucoup!) de cartes sur la France métropolitaine. Nous venons de mettre en ligne quelques exemples sur l'année 2014 en utilisant toutes les données Landsat8 disponibles. Nous avons choisi de vous montrer les 4 cas qui correspondent aux combinaisons suivantes :

  • sur la donnée de référence :
    1. utilisation de 4 classes de surfaces artificielles (abusivement appelées "bâti") : urbain continu, urbain discontinu, surfaces "route" et zones industrielles et commerciales (2);
    2. regroupement a posteriori de ces 4 classes (3);
  • sur le mode de stratification :
    1. avec stratification par zone éco-climatique (4);
    2. sans stratification, mais avec une fusion de plusieurs (10) classifieurs appris sur des tuiles images différentes.

Le village en rose, au centre de la zone marron, c'est le village de Chateauneuf du Pape, et la zone marron autour du village, ce sont des vignes ! Pas besoin de vérité terrain pour le vérifier, mais on veut bien aller vérifier quand même.

Arthur nous a concocté une interface assez pratique pour la visualisation et la comparaison des différentes cartes.  Vous pouvez y accéder ici. L'icône en haut à droite vous permet de sélectionner les cartes qui seront affichées. A gauche, sous les boutons qui gèrent le niveau de zoom, vous avez la possibilité de sélectionner 2 des cartes pour lesquelles les statistiques de qualité (FScore par classe5) seront affichées sous la zone de visualisation. Cela vous permet d'apprécier les différences entre les approches.

 

Aux 4 nouvelles cartes, nous avons ajouté la version que nous avions publié en début d'année, dont la qualité est inférieure. Si vous regardez la précision globale de cette carte (Overall Accuracy) vous verrez qu'elle est en fait supérieure à celle des nouvelles cartes. Ceci est dû au fait que dans cette ancienne version, nous utilisions beaucoup de pixels d'eau pour la validation, et l'eau est très facile à classer. Le problème principal de cette ancienne version est le sur-classement des zones urbaines au dépens des surfaces minérales naturelles et des vergers. Ceci a été amélioré grâce au travail sur la préparation de la donnée de référence.

 

Pour comparer des cartes, il est utile de regarder les FScore par classe. Vous verrez ainsi que la stratification éco-climatique apporte des améliorations importantes sur les valeurs moyennes et sur les intervalles de confiance.

 

Si vous voulez récupérer les fichiers GeoTiff complets (attention, c'est volumineux!), vous pouvez utiliser les liens suivants :

N'hésitez pas à nous faire des retours. Nous continuons à travailler sur les améliorations des méthodes.

Notes:

1Beaucoup d'autres tâches ont été réalisées, dont la préparation de l'ingestion des données Sentinel-2, par exemple.

2Ces 4 classes correspondent à la nomenclature de Corine Land Cover, dont les polygones du millésime 2012 ont été affinés en utilisant une procédure développée par David et Marcela et décrite dans cette présentation (à partir de la planche 33).

3L'apprentissage et la classification sont toujours faits avec les 4 classes séparées, mais elles sont regroupées à la fin, ce qui permet d'augmenter la précision de la carte en échange d'une perte de finesse thématique. Mais les pixels de 30 m. de Landsat ne nous permettent d'être très précis pour ces classes.

4Nous avons utilisé la carte publiée par Joly et al.

5Nous utilisons cette métrique, car elle combine les erreurs d'omission et de commission.

 

3 ans de données LANDSAT8 N2A sur la France mises à disposition par Theia

=>

Le centre de traitement prototype MUSCATE du CNES, pour le compte de THEIA, continue à produire au niveau 2A et a distribuer les données LANDSAT 8 acquises au dessus de la France. Les produits de niveau 2A fournissent des réflectances de surface, après correction des effets atmosphériques, accompagnées d'un très bon masque de nuages.  Les premières données de Landsat 8 avaient été acquises le 13 avril 2013, et THEIA vient juste de distribuer les données jusqu'au 15 avril 2016. THEIA met donc à disposition 3 ans de données LANDSAT 8, auxquelles s'ajoutent 3 ans de données LANDSAT 5 et 7 acquises entre 2009 et 2011. Enfin, nous allons bientôt mettre à disposition les données sur les régions et communautés d'outre mer, acquises depuis les débuts de LANDSAT 8.

 

La correction atmosphérique et la détection des nuages sont faites avec la chaîne MACCS développée au CESBIO. Camille Desjardins, du CNES (Service Physique de la Mesure Optique) a fait une validation des épaisseurs optiques des aérosols sur tous les sites disponibles en France et sur 3 ans. Les résultats sont résumés dans la courbe ci-dessous. Pour les non spécialistes, c'est un excellent résultat, largement au niveau de l'état de l'art, et comme la détermination de l'épaisseur optique des aérosols conditionne fortement la qualité de la correction atmosphérique, on peut être rassuré sur celle-ci.

 

La diversité des utilisateurs de ces données montre qu'elles peuvent être appliquées à de nombreuses thématiques. Voici un exemple de ce qu'il est possible de faire automatiquement avec ces données (ici, celles de 2014). N'hesitez pas à cliquer sur la carte pour plus de détails.

Cette carte d'occupation des sols, encore à l'état préliminaire, a été générée par la chaîne iota2 dont le développement est coordonné par Jordi Inglada au CESBIO. Cette chaîne a récemment été présentée au Living Planet Symposium.

 

Les produits LANDSAT8 distribués par THEIA ont été téléchargés par 127 utilisateurs différents depuis juillet 2015 et la mise en place du nouveau serveur de distribution. Auparavant, nous avions déjà eu 98 utilisateurs, mais je n'ai pas fait l'exercice de savoir s'il s'agit des mêmes personnes.

Nombre de produits téléchargés depuis juillet 2015 13074
Nombre d'utilisateurs depuis juillet 2015 127

Comme d'habitude, nous avons peu de retours sur l’utilisation de ces données, ce qui est bon signe, car en cas de problème, les questions arrivent vite : si vous êtes un des utilisateurs, nous serions très intéressés d'avoir votre avis sur ces données et éventuellement de voir vos résultats. Nous pouvons même les afficher sur ce blog.

Les séries temporelles d'images pour reconnaître les essences en forêt

Les collègues du laboratoire DYNAFOR (INRA / INP-ENSAT / INP-EI Purpan), en collaboration avec le Centre National de la Propriété Forestière (CNPF), travaillent depuis quelques années sur la reconnaissance des espèces arborées en forêt. Les premiers travaux ont démarré avec des séries temporelles d'images MODIS et ont permis de cartographier la chaîne des Pyrénées à moyenne résolution spatiale. Plus récemment, pour préparer l'arrivée des images Sentinel-2, des séries temporelles denses à haute résolution spatiale (FORMOSAT-2), couvrant tout le cycle annuel de la végétation, ont été exploitées. Les séries temporelles sont particulièrement utiles pour ce type d'application puisque d'une essence à l'autre, les cycles végétatifs sont différents avec des dates de débourrement ou de jaunissement et chute des feuilles différentes (le terme technique est senescence, et l'étude inter-annuelle des dates auxquelles se répètent les événements caractéristiques, comme la senescence, s'appelle la phénologie). On peut s'en rendre compte facilement en comparant deux images acquises à 2 dates différentes, comme c'est le cas ci-dessous. La première est un extrait d'image FORMOSAT-2 en fausses couleurs infra-rouge datant du 16 février 2013 (la végétation apparaît dans la gamme des rouges). La seconde image est datée du 20 juillet 2013. On peut observer une différence importante entre les feuillus et les conifères aux deux dates. Les feuillus ayant perdus leurs feuilles en hiver, ils n'apparaissent pas en rouge sur l'image de Février, contrairement à l'image de Juillet.

 

Image d'hiver en fausses couleurs infra-rouge FORMOSAT-2 datée du 16/02/2013 (résolution spatiale : 8m)


Image d'été en fausses couleurs infra-rouge FORMOSAT-2 datée du 20/07/2013 (résolution spatiale : 8m)

Continue reading

Estimation de l'évapotranspiration à l'échelle d'un bassin versant.

=>

L’évapotranspiration est un facteur clé pour estimer les quantités mises en jeu dans le cycle de l’eau. On estime par exemple que 60% des quantités d’eau de pluie sont évapotranspirées, et par exemple, un plan de blé rejette environ 500mm d'eau par an via le processus d'évapotranspiration.  Les volumes en question sont donc très importants. Suivre l’évolution de cette variable au cours d’une campagne agricole permet à la fois d'estimer les besoins en eau des plantes, mais aussi d’identifier des périodes de stress hydrique et d’en estimer spatialement l’importance. Le suivi de cet indicateur constitue un enjeu crucial dans la gestion de la ressource en eau à l’échelle de la parcelle mais aussi du bassin versant.

Schéma explicatif du processus d'évapotranspiration des plantes

 

 

Dans le cadre du projet SIRHYUS mené en partie au CESBIO, un prototype de chaîne de traitement de données spatiales a été développé afin d’apporter des éléments de réponse à cette problématique à l’échelle d’un bassin versant. La zone d’étude retenue est le Fresquel, un bassin versant de 937 km², situé entre Castelnaudary (le cassoulet) et Carcassonne (la forteresse). Les principales cultures présentes sur ce bassin sont les suivantes : céréales, tournesol, vigne et -dans une moindre mesure- maïs et colza.

 

Zone d'étude : le bassin versant du Fresquel

Comme dans l’article présentant le modèle Sat-irr, le modèle FAO-56 (Allen & al. 1998) a été utilisé en ajoutant un module spatial. Le modèle FAO-56 propose la modélisation de l’ET de tout type de plante en modulant -via un coefficient empirique KC- l’ET de référence (noté ET0), elle-même calculée avec l’équation de Penman-Monteith. Ce coefficient KC dépend des propriétés biologiques de la plante (hauteur, taille des feuilles, type de photosynthèse…) et de son stade de développement.

 

L’équation de Penman-Monteith nécessite en entrée des données météorologiques (température, humidité etc.) qu’il est possible d’obtenir via des modèles globaux (NCEP, ECMWF) en quasi  temps réel. Afin d’automatiser entièrement la réception de ces données, des algorithmes ont été développés en python. Ils sont disponibles ici.

 

Les images landsat fournies par le centre de donnéeq Theia ont été utilisées pour ajuster le coefficient KC au plus proche du cycle phénologique des plantes. L'utilisation de ces images satellitaires fournit en effet une vision synoptique et quasi temps réel du développement des cultures de la zone étudiée : le NDVI calculé à partir des bandes rouge et InfraRouge, interpolé sur l’ensemble de la saison agricole permet de suivre en temps réel et de façon spatialisée les stades de croissance réels des cultures. Ce recours aux images multitemporelles permet alors d’obtenir une meilleure estimation de l’ET.

 

La connaissance des cultures agricoles sur le bassin permet alors la spatialisation de l’ensemble du modèle en attribuant à chaque pixel, les coefficients culturaux de l’espèce identifiée sur la carte d’occupation du sol.


Ainsi il est possible d'obtenir des cartes d'estimation de l'évapotranspiration à l'échelle d'un bassin versant, disponibles via une interface Web, (rubrique "Evapotranspiration"). La figure suivante est une capture d'écran de l'interface Web produite au CESBIO : sur chaque pixel du bassin versant il est possible d'obtenir la chronique de l'évapotranspiration estimée sur l'ensemble de l'année écoulée, au pas de temps 8 jours et sur l'année entière.

 

Capture écran de l'application web "évapotranspiration". Le graphique au bas de l'image représente l'évapotranspiration de différentes espèces en fonction du temps (vert clair : prairies permanentes, rouge : vignes, violet : tournesol, rose : légumes/fleurs...).

 

Il est ensuite possible de dériver de ce produit des cartes de quantité d'eau dans le sol sur l'ensemble de la zone étudiée.

Représentation de la quantité d'eau dans le sol après calcul du bilan hydrique : le graphique sur le bas de l’image affiche la quantité d’eau présente dans le sol (%) en fonction de la date (jour)).

 

Ces produits modélisés permettent d'estimer en quasi temps réel la quantité d'eau présente dans la zone racinaire du sol de la région étudiée. Cet estimation est importante car elle permet également d'optimiser les apports en eau et ainsi d'économiser cette ressource. Les résultats sont consultables sur le même lien que pour les cartes d'évapotranspiration.

 

Plusieurs campagnes de validation du modèle utilisé dans ce projet ont été menées à Lamasquère et Auradé (les deux sites pilotes du CESBIO) entre 2006 et 2011. Ces études ont permis de tester les performances du modèle utilisé pour modéliser l'évapotranspiration. La figure suivante permet de visualiser la comparaison entre l'évapotranspiration mesurée in situ sur le site test de Lamasquère en 2008 et l'évapotranspiration modélisée.

 

Comparaison entre l'ET observée (courbe noire) et l'ET modélisée (courbe rouge)

.

Face aux nouveaux challenges actuels que sont l'économie de la ressource en eau et la lutte contre le changement climatique et ses répercussions notamment sur le cycle de l'eau, la gestion optimale des ressources en eau est de nos jours un défi important.

Ce travail permet de mieux connaître et appréhender les quantités d'eau évapotranspirées par chaque type de plante à l'échelle d'un bassin versant et ainsi d'estimer les besoins en eaux des bassins versants. La connaissance de l'état hydrique des sols permet également d'optimiser les apports en eau et ainsi d'économiser cette ressource.

Ce travail s’insère dans la perspective de l'arrivée prochaine des images du satellite Sentinel-2 qui permettra d'obtenir des résultats de modélisation encore plus précis du fait de sa période de revisite très courte. La surface opérationnelle sera également accrue : ainsi la fiabilité générale des modélisations sera augmentée.

 

 

 

Génération automatique et opérationnelle de cartes d'occupation des sols

=>

Pour le moment,  il n'existe pas de cartes d'occupation des sols en France produites annuellement à résolution décamétrique. La carte Corine Land Cover, largement utilisée, n'est produite que tous les 5 ans, et la version de 2012 est sortie il y a tout juste quelques mois. Celle-ci est en effet produite par photo-interprétation, ce qui demande une énorme quantité de travail. La couche d'occupation des sols de l'IGN, de grande précision, est mise à jour progressivement, zone par zone, sur un cycle de 3 à 4 ans, et ne fournit donc  que les occupations du sols pérennes.. Il y a aussi le produit Global Land Cover 30m, fourni à la résolution de LANDSAT, et les couches HR de Copernicus, mais leurs qualités sont assez décevantes, par exemple sur la forêt des Landes.

 

Grâce à la répétitivité de ses observations à haute résolution, Sentinel-2 devrait permettre la production automatique de cartes d'occupation des sols à l'échelle de pays entiers. En se basant principalement sur des travaux de recherche menés au CESBIO depuis plusieurs années, le projet de produire opérationnellement des cartes d'occupation des sols sur tout le territoire Français commence à prendre de l'ampleur. Les efforts de recherche se sont récemment fédérés dans le cadre du Centre d'Expertise Scientifique du pôle thématique surfaces continentales de Theia, consacré à l'Occupation des Sols Opérationnelle , le bientôt fameux CES-OSO.

 

Ce zozo vient de mettre à disposition ses premiers produits prototypes, réalisés avec les données LANDSAT 8 produites par Theia, en attendant la disponibilité d'une année entière de données Sentinel-2. Les premiers produits couvrent près d'un tiers du territoire Français, et, selon les différentes versions, comportent entre 15 et 20 classes.

 

La chaine de production de cartes d'occupation des sols utilisées pour ce travail est largement basée sur les applications de l'Orfeo Tool Box. Elle a été mise en musique par Marcela Arias, sous la direction de Jordi Inglada, avec de nombreuses contributions de collègues du CESBIO, pour la collecte et la mise en forme des données de référence, comme pour le codage de la chaîne.

 

Extrait de la Version 1 du produit prototype CESOSO réalisé avec les données acquises par LANDSAT8 en 2013. Cliquer sur l'image pour une visualisation interactive des données

Avertissement :

Ces produits n'ont pas été élaborés dans des conditions idéales. Ils ont été crées à partir de données acquises à partir du mois d'avril 2013, date à laquelle LANDSAT-8 a été déclaré opérationnel. Le début du cycle végétal n'a pas été observé. Les produits opérationnels utiliseront quant à eux une année entière de données. Par ailleurs, les données LANDSAT 8 n'ont pas la répétitivité ni la résolution de Sentinel-2, la qualité des résultats ne peut pas être du même niveau que celle attendue de Sentinel-2.

 

Mais il s'agit du même type de données et leur traitement présente pour nous les mêmes difficultés, il s'agit donc de tests en vraie grandeur de notre méthodologie. Enfin, bien que moins précis, les résultats sont de même nature, et doivent permettre aux utilisateurs d'avoir une première idée des produits qui seront distribués par Theia.

 

Ces produits contiennent des erreurs et ne doivent être considérés que comme des documents de travail. Nous les publions dans le but d'obtenir des retours sur leur qualité et leur utilité. N'hésitez pas à nous dire si ces produits vous seraient utiles, et pour quels besoins. N'hésitez pas à nous dire aussi s'ils sont trop imprécis ou s'il manque quelque chose à leurs caractéristiques pour que vous puissiez les utiliser pleinement.

 

Les données ont été produites en utilisant des applications de l'Orfeo Tool Box, mises en musique par Marcela Arias,  sous la direction de Jordi Inglada, avec de nombreuses contributions de collègues du CESBIO pour la collecte et la préparation des données de référence et pour la réalisation des chaînes de traitement,

 

Description des prototypes de produits

Les produits sont mis à disposition avec la licence Open Data Commons Attribution Licence. Cette licence permet de :

  • partager : copier, distribuer et utiliser les données
  • créer des produits dérivées à partir de ces données
  • adapter : modifier, transformer la base de données

sous la contrainte d'attribution suivante : vous devez citer la source de la base de données (le CESBIO) dans toute utilisation ou diffusion.

Ces cartes ont été produites avec des images du satellite Landsat-8 (résolution 30 m. et 7 bandes spectrales) acquises avec une revisite de 16 jours.

Les acquisitions ont démarré le 12 avril 2013 et s'étalent jusqu'au 30 décembre 2013. Chaque point de la surface a été vu (hors nuages et autres artefacts) entre 8 et 25 fois, et en moyenne, 16 fois. Sur les Pyrénées, il y a des zones qui, à cause des nuages, ont été vues peu de fois, et on remarque des artefacts dans les cartes.

Les images Sentinel-2, avec une résolution spatiale de 10 m., une revisite de 5 jours et 12 bandes spectrales, permettront la génération de cartes de bien meilleure qualité.

 

Les cartes sont réalisées en utilisant un apprentissage automatique sur des bases de données de référence dans lesquelles l'occupation des sols est connue pour certains points du territoire. Les bases de données suivantes ont été utilisées :

  • Registre parcellaire graphique (RPG) pour les classes suivantes :
    • cultures annuelles herbacées (été et hiver)
    • cultures ligneuses (vergers, vignes, arboriculture, oliviers)
    • prairies permanentes
    • estives-landes
  • Corine Land Cover 2012 pour les classes
    • Bâti dense
    • Zones industrielles et/ou commerciales
    • Pelouses
    • Plages et dunes
    • Mer et océans
    • Surfaces minérales
    • Glaciers et neiges éternelles
  • BD TOPO pour les classes suivantes :
    • Eau
    • Forêt de feuilles persistantes
    • Forêt de feuilles caduques
    • Forêts mélangées
    • Lande ligneuse

Ces bases de données peuvent correspondre à des périodes différentes et être plus anciennes que la période d'acquisition des images satellite. Plusieurs versions des cartes ont été réalisées en choisissant des nomenclatures légèrement différentes.

V2

Regroupement des classes suivantes :

  • estives/landes et landes ligneuses
  • élimination des forêts mélangées
  • fusion des classes vergers, oliviers, arboriculture
  • fusion des classes eau et mers et océans

Une visualisation en ligne ainsi que les statistiques de validation sont disponibles ici.

Le produit à pleine résolution peut être téléchargé ici.

 

 

 

Calcul automatique de cartes d'occupation du sol sans données de terrain

=>

Avec la mise à disposition régulière d’images corrigées des effets atmosphériques et téléchargeables librement par le pôle Theia, il est possible d’imaginer la production de classifications de l’occupation du sol automatique et en continu au fil de la mise à disposition de nouvelles images.

 

Dans le cadre du projet SYRHIUS, un prototype a été développé au CESBIO pour tester les résultats de ce type de classification à l’échelle d’un bassin versant.  La zone d’étude retenue est le Fresquel, un bassin versant de 937 km², situé entre Castelnaudary (le cassoulet) et Carcassonne (la forteresse). Les principales cultures présentes sont : céréales, tournesol, vigne et dans une moindre mesure maïs et colza.

 

Le type de méthode de classification utilisée est une classification supervisée (SVM), pour laquelle les échantillons d’apprentissage ne sont pas des zones connues des images à classer (comme les méthodes supervisées classiques, par exemple celle qui sera utilisée dans le projet THEIA) mais sont issues d’une base de données d’apprentissage créée à partir d’années antérieures et de données de terrain acquises pour ces dates. Une telle méthode présente l’avantage de ne nécessiter aucune connaissance à priori sur l’année en cours (et donc aucune étape manuelle d’apprentissage si la base d’apprentissage est exhaustive) mais présente le défaut de nécessiter un très grand volume de données (les chroniques des années antérieures) et peut entraîner une forte confusion dans le cas d’années au climat exceptionnel.

Illustration de la chaîne de traitement mise en place pour la production des cartes d'occupation du sol.

 

Afin de tester cette approche, le RPG (référentiel parcellaire graphique) a été utilisé sur les années 2011 et 2012 pour le bassin du Fresquel apportant une connaissance spatialisée des cultures semées,  conjointement aux séries landsat5/7 qui permettent de suivre l'évolution temporelle de la réflectance des parcelles du RPG. L’association de ces deux types de données a permis de créer une base d’apprentissage, utilisée dans un second temps pour la classification des années 2013, 2014 et 2015 pour l’ensemble du bassin du Fresquel.

 

Les images de niveau 2A (corrigées des effets atmosphériques et accompagnées d'un masque de nuages) utilisées en entrée du traitement, sont mises à disposition par le centre de données THEIA.  La validation des classifications proposées ne sera possible que lorsque le RPG 2013 sera disponible, néanmoins, de précédentes campagnes ont fait état de résultats convenables avec un kappa autour de 0.65-0.7 pour la région Midi-Pyrénées.

 

Une approche de production en continu de ces classifications a été testée afin de fournir à l’utilisateur des résultats dès le début de la saison agricole. Une nomenclature évolutive a donc été proposée, celle-ci s'enrichissant à mesure de la mise à disposition des images satellite Landsat. Trois dates-clés ont été retenues : fin mars, fin juillet et fin de l’année d’étude : à chacune de ces dates la carte d'occupation est alors recalculée. Plus l'année en cours avance, plus la classification des diverses espèces végétales sera fine et précise. Le niveau de détail augmente donc au fur et à mesure pour atteindre son maximum lors de la production de la dernière carte, à la fin de l'année, comme illustré sur la figure suivante.

 

Production de trois cartes d'occupation durant l'année : la première (S1) en mars, la seconde (S2) en juillet et la dernière (S3) à la fin de l'année, avec des nomenclatures de plus en plus riches

 

Les résultats de cette étude sont disponibles via une interface Web.


On notera cependant l’importance d’une couverture régulière et les problèmes liés à l’ennuagement qui peuvent pour certaines années être très contraignants  comme dans le cas de l’année 2013, très pluvieuse (et dépourvue de données LANDSAT avant la mise en service de LANDSAT 8 en Avril).  En 2013, certaines zones n’ont été observées que trois fois durant l’ensemble de l’année. De très mauvais résultats sont donc obtenus en début de saison agricole, qui s'améliorent par la suite. Heureusement, l'arrivée de Sentinel-2 devrait permettre d'assurer une bien meilleure répétitivité dès 2016.

Le projet SIRHYUS

Le projet SIRHYUS a pour objectifs de concevoir,  de développer et de mettre en œuvre des services opérationnels dédiés à la gestion des ressources en eau douce continentale grâce à l'intégration, l'assimilation et à la valorisation des données satellitaires d’observation de la Terre. Ce projet est mené par un consortium de huit partenaires complémentaires : Veolia Environnement Recherche&Innovations, Veolia Eau, EDF, G2C environnement, Acri ST, l’UMR TETIS-IRSTEA, le CNES, VERI et le CESBIO. Il est financé dans le cadre du 12ème Fonds Unique Interministériel par le ministère en charge de l’eau, les régions Paca et Languedoc- Roussillon, ainsi que par la Fondation Sciences et Techniques pour l’Aéronautique et l’Espace. La finalité de ce projet est de pouvoir proposer de nouveaux services, s'appuyant sur des savoir-faire scientifiques et industriels reconnus. Dans ce cadre, le CESBIO a développé ou amélioré les algorithmes de création de quatre produits : le produit manteau neigeux, le produit occupation du sol, le produit évapotranspiration et le produit quantité d’eau dans le sol. Ces algorithmes sont principalement dédiés à l’exploitation des données Sentinel-2. Dans le cadre de ce projet, deux articles sont publiés sur ce blog : le premier (ci-dessus) concerne l'occupation du sol et le second l'estimation de l'évapotranspiration et du bilan hydrique à l'échelle d'un bassin versant (lien).

 

Yoann Moreau et Isabelle Soleihavoup