Premières validations de la carte d'occupation du sol OSO

En 2017, le Centre d'Expertise Scientifique OSO (Occupation du SOl) par l'intermédiaire du CESBIO a produit une carte d'occupation du sol de l'année 2016 à l'échelle du territoire métropolitain français et corse. On l'appelle la carte d'occupation du sol OSO ! Cette carte est le résultat de traitements automatiques massifs de séries temporelles d'images satellites optiques Sentinel-2. Comme les images Sentinel-2, cette carte a une résolution spatiale de 10 m correspondant à une unité minimale de collecte (UMC) de 0.01 ha. L'occupation du sol est décrite grâce à 8 classes au premier niveau et 17 classes à second niveau de détail, définies en fonction des potentialités de détection de l'imagerie Sentinel-2 et des besoins exprimés par des utilisateurs finaux. Ces classes couvrent les grands thèmes d'occupation du sol (surfaces artificialisées, agricoles et semi-naturelles).

Son principal avantage en comparaison avec d'autres cartes d'occupation du sol existantes, (loin de nous l'idée de les critiquer) est son exhaustivité territoriale et surtout sa fraîcheur ! Disposer d'une carte d'occupation du sol exhaustive sur l'ensemble du territoire national au premier trimestre de l'année suivante, c'est ce qu'OSO vous propose !

Quelle richesse thématique ?

Les classes détectées par télédétection sont celles du second niveau, celles du premier niveau sont obtenues par agrégation des classes du second niveau :

  • Culture annuelle
    • Culture d'hiver
    • Culture d'été
  • Culture pérenne
    • Prairie
    • Verger
    • Vigne
  • Forêt
    • Forêt de feuillus
    • Forêt de conifères
  • Formation naturelle basse
    • Pelouse
    • Lande ligneuse
  • Urbain
    • Urbain dense
    • Urbain diffus
    • Zone industrielle et commerciale
    • Surface route / asphalte
  • Surface minérale
    • Surfaces minérales
    • Plages et dunes
  • Eau
    • Eau
  • Glaciers et neiges éternelles
    • Glaciers et neiges éternelles

Avec quelle qualité ?

Valider une carte d'occupation n'est pas une procédure simple. Il s'agit de s'interroger sur :

  • la spécification des classes
  • l'échelle de validation
  • le jeu de données de validation

Dans tous les cas, il est rarement possible d'établir une validation exhaustive sur l'ensemble d'un territoire. Classiquement, une validation statistique permet d'appréhender partiellement la précision de la cartographie obtenue, et ne permet pas d'identifier l'ensemble des confusions thématiques et des erreurs géométriques de classification.

La suite de cet article tente de qualifier la précision de la carte d'occupation du sol OSO de 2016 grâce à des jeux de données de partenaires du CES OSO. Une première validation, intrinsèque au processus de classification, a été effectuée. Les résultats statistiques sont visibles ici.

Le jeu de données d'échantillons de la couverture de surface a été produit grâce à des bases de données nationales telles que la BD Topo, le Registre Parcellaire Graphique (RPG) et Corine Land Cover. 70% de ces échantillons ont été utilisés pour l'apprentissage et 30% pour la validation a posteriori visible sur la figure ci-dessous. Cette validation, bien que pertinente, s'appuie sur des échantillons dont la génération suit la même procédure que les échantillons d'apprentissage, biaisant quelque peu l'indépendance de la validation.

Validation de la carte d'occupation du sol OSO avec 30% des échantillons extraits des 3 jeux de données utilisés lors de la classification - BD Topo, Registre Parcellaire Graphique et Corine Land Cover)

De plus, il nous était impossible de valider les deux cultures annuelles de la classification. En effet, l'indisponibilité du RPG pour l'année 2016 et 2015 (toujours indisponible le jour de l'écriture de cet article), nous a amené à développer une méthode d'apprentissage basée sur le principe de l'adaptation de domaine utilisant des échantillons du RPG 2014. Cette méthode est très bien expliquée ici. Quoiqu'il en soit, il nous était impossible de valider la classification des cultures d'été et d'hiver de 2016, seuls des échantillons issus du terrain nous le permettait, en voilà la preuve !

Continue reading

Produits de Niveau 3A : comparaison avec la méthode classique du maximum de NDVI

=>

Comme nous le disions dans un précédent article, nous utilisons les données SPOT4 (Take 5) pour tester différentes méthodes de création de produits de niveau 3A. Le pôle Thématique appliquera par la suite ces méthodes aux données Sentinel-2.   Pour rappel, si vous n'avez pas cliqué sur le lien ci-dessus, les produits de niveau 3A sont des synthèses périodiques (a priori mensuelles) de réflectances de surface sans nuages. Notre méthode est basée sur des moyennes pondérées de réflectances des pixels non nuageux obtenus pendant une certaine période de temps. Pour plus de détails, il faudra vraiment aller voir ce lien...

 

Les travaux de Mohamed Kadiri au CESBIO, financés par le budget CNES de THEIA, ont d'abord porté sur la mise au point d'indices de qualité (décrits dans le lien ... bon, j'arrête), et ont permis de montrer que notre méthode produit de bonnes performances. Nous avons voulu comparer ces résultats avec la méthode du "Maximum de NDVI", développée par nos ancêtres télédétecteurs, et appliquée depuis des temps immémoriaux aux données de moyenne résolution comme celles des instruments AVHRR. Cette méthode consiste, pour chaque pixel, à utiliser dans le produit de Niveau 3A, la date dont le NDVI est le plus grand. Pourquoi ce choix ? Principalement parce que le NDVI d'un nuage est très faible, et donc que cette méthode permettra de choisir préférentiellement les pixels non nuageux. Cette méthode date d'un temps où les masques de nuages n'étaient pas très précis.

 

Extrait de synthèse mensuelle obtenue avec la méthode du maximum de NDVI Extrait de synthèse mensuelle obtenue avec la méthode de la moyenne pondérée.

Nous vous présentons ici, avec les données SPOT4-(Take5), une comparaison des résultats obtenus sur le site de Versailles, avec  la méthode du maximum de NDVI à gauche et la méthode de moyenne pondérée à droite.  On note, sur l'image de gauche, la présence de nombreux artefacts sous la forme de points brillants ou sombres que l'on ne voit pas sur l'image de droite. Ces points de niveau différents sont dûs au fait que d'un pixel à l'autre, une date différente a été utilisée, en fonction de la valeur du maximum de NDVI. Ces artefacts sont moins présents sur les zones couvertes de végétation (en rouge), car pour cette synthèse obtenue au printemps, la croissance de la végétation fait que le maximum de NDVI correspond à la date la plus tardive de la synthèse..

 

Si l'on regarde les valeurs de nos critères de qualité, décrits dans l'article précédent (cela faisait longtemps ;) ), on note que les performances de la méthode par moyenne pondérée sont bien meilleures que celles de la méthode du maximum de NDVI, vis à vis de la fidélité à l'image de la date centrale de la synthèse mensuelle (en Jaune, pour les 70% de pixels les meilleurs, et Vert, pour les 95% de pixels les meilleurs), et surtout, vis à vis de la présence ou non d'artefacts (en bleu). L'abscisse des courbes correspond à la moitié du nombre de jours utilisés pour chaque synthèse, nous recommandons la valeur 21.

 

Maximum de NDVI Moyenne Pondérée

Les produits de Niveau 3A

=>

Parmi les produits que nous préparons pour les traitements de données Sentinel-2 du pôle THEIA, les produits de Niveau 3A n'ont pas encore été abordés dans ce blog. Ceux-ci fournissent une synthèse mensuelle des produits de niveau 2A. Les produits de Niveau 3A devraient être bien utiles pour les raisons suivantes :

  • Le produit de Niveau 3A, fourni une fois par mois, représente un volume de données jusqu'à 6 fois inférieur à celui des niveaux 2A acquis pendant un mois.
  • Le produit de niveau 3 fournit un échantillonnage temporel régulier de l'évolution des réflectances, alors que l'échantillonnage du Niveau 2A est dépendant de la couverture nuageuse
  • Beaucoup de méthodes de traitement sont perturbées par la présence de trous dans les images dus à la couverture nuageuse. Le Niveau 3A vise à minimiser les pixels manquants.

 

Grâce au jeu de données SPOT4(Take5), nous avons pu expérimenter différentes méthodes de création des produits de Niveau 3A sur différents types de sites. C'est Mohamed Kadiri, au CESBIO, qui a pris en charge ce travail, financé par le budget CNES du projet THEIA, et avec le soutien de Mirelle Huc. La méthode consiste à calculer, pour chaque pixel, la moyenne des réflectances de surface des observations non nuageuses, obtenues pendant une demi période de N jours autour de la date T0 du produit de niveau 3A. Par exemple, dans l'exemple ci-dessous obtenu avec N=21, pour le produit du 15 mars (T0), les données utilisées couvrent la période du 24 février au 4 avril.

 

 

La moyenne calculée est une moyenne pondérée, qui attribue plus de poids :

  • aux images sans nuages
  • aux pixels situés loin de nuages
  • aux images avec peu d'aérosols
  • aux images proches de la date du produit de Niveau 3

 

Les poids et surtout la demi-période N ont une forte influence sur la qualité des résultats. Pour déterminer leurs valeurs, nous avons mis au point 3 critères de qualité :

  • le pourcentage de pixels dont la réflectance est manquante en raison des nuages
  • la différence du produit de Niveau 3A avec un produit de Niveau 2A faiblement nuageux acquis à quelques jours de la date centrale T0.
  • une mesure des artefacts. Les artefacts apparaissent en bordure des trous (dus aux nuages ou aux ombres) présents sur chacune des images.

 

Voici par exemple les performances obtenues sur le site de Versailles, site fortement nuageux lors du printemps 2013. Cette courbe confirme que malgré le mauvais  temps, Sentinel-2 devrait pouvoir fournir des produits quasiment sans nuages chaque mois sur ce genre de sites. Sur ce site, l'optimum de la durée de synthèse est compris entre 2*21 et 2*28 jours :

Performances obtenues sur le site de Versailles, pour plusieurs valeurs de la longueur de période N. En rouge, les trous résiduels (échelle à gauche), en jaune et vert, l'écart maximal à l'image centrale exprimé en réflectance, pour les 70% et 90% de pixels les meilleurs, et en bleu l'écart-type moyen des artefacts

 

Les produits de niveau 3A de Sentinel-2 devront aussi inclure une correction des effets directionnels, afin de pouvoir inclure dans un même produit de Niveau 3A des données issues de traces orbitales différentes, et donc acquises avec des angles de prise de vue différents. Enfin, en option, nous pourrons proposer une opération de bouchage des trous résiduels par interpolation temporelle ou en utilisant le comportement moyen de pixels similaires. Bref, il nous reste du pain sur la planche. Une comparaison avec la méthode classique de maximum de NDVI est fournie dans cet article.

Bientôt, des séries LANDSAT de Niveau 2A au pôle THEIA

=>

Le centre de production MUSCATE du pôle THEIA au CNES va bientôt lancer la production puis la distribution de données de niveau 2A acquises par LANDSAT 5 et 7, puis LANDSAT 8 couvrant toute la surface de la France (Métropole pour LANDSAT 5 et 7, Métropole + ROM COM pour LANDSAT 8).

 

Mosaique de données LANDSAT 5 et 7 produite au CESBIO, à partir de données de l'ESA et de l'USGS. Les données sont découpées en tuiles de 110 x 110 km². Pour chaque tuile, toutes les dates ayant un petit coin de ciel clair sont fournies.

 

Pour LANDSAT 5 et 7, nous utilisons des données provenant à la fois de l'USGS et de l'ESA : en effet pour le moment, seule l'ESA dispose des données LANDSAT 5 acquises au dessus des stations de Mas Palomas (Canaries), Matera (Italie) et Svalbard (Norvège). Un transfert des données de l'ESA vers l'USGS est prévu, il a peut-être débuté pour Svalbard, mais il n'est pas encore commencé pour la station Matera, qui couvre la France.

 

Niveau 1C :

Les données de l'USGS sont bien ortho-rectifiées, mais celles de l'ESA ne le sont pas, nous avons donc mis en place, comme pour SPOT4(Take5), une chaîne d'ortho-rectification des images à partir de l'outil SIGMA du CNES. Les produits de l'ESA dont nous disposons présentent aussi quelques défauts : la bande thermique est inutilisable et vous trouverez, par ci par la, des points brillants colorés, comme ceux que la mobylette du voisin faisait apparaître sur notre télé quand nous étions petits. Malgré tout, nous arrivons à produire des produits de Niveau 1C corrects, même si nous attendons avec impatience le retraitement des données par l'USGS. Depuis peu, l'ESA a sa propre chaîne de traitement de données LANDSAT 5, mais celle-ci s'arrête au niveau 1C.

 

Pour LANDSAT 7, ce traitement n'est pas nécessaire car les données sont déjà ortho-rectifiées. Nous interpolons seulement une petite partie des données manquantes (les stries sur les images), puis nous rognons une grande partie de l'image. Pour LANDSAT 8, aucun de ces traitements n'est nécessaire.

 

Niveau 2A :

Les produits de Niveau 2A (Masque de Nuages, Corrections atmosphériques) seront produits à partir de la chaîne prototype développée et maintenue par Mireille Huc (CESBIO, CNRS). J'avais réalisé au CESBIO, il y a quelques années une production de ces mêmes données sur l'extrême Sud de la France, de Bordeaux à Marseille en passant par les Pyrénées. Cette production est d'ores et déjà disponible sur le site du pôle THEIA. Les illustrations ci-jointes en proviennent.

 

LANDSAT 5 et 7 :

Nous traiterons, dans un premier temps, probablement à partir du mois d'Avril, les données LANDSAT 5 et 7 acquises de 2009 à 2011.

LANDSAT 8 :

A partir d'Avril ou Mai 2014, nous traiterons les données LANDSAT 8 acquises depuis avril 2013, puis nous traiterons les données arrivant au fur et à mesure.

Format des données :

Le format des données sera identique à celui utilisé pour SPOT4 (Take5). La France sera découpée en tuiles de 110*110 kilomètres se recouvrant avec leurs voisines sur 10 kilomètres. (Cf la mosaique d'images de 2010 sur le sud de la France).

 

En fonction du succès de la mise à disposition de ces données, nous déciderons s'il y a lieu de produire d'autres années, ou d'étendre la zone couverte à d'autres produits. N'hésitez donc pas à nous faire part de votre intérêt pour ces données.

Exemple des images disponibles pour les de juillet à octobre 2009 pour la tuile centrée sur Toulouse. Pour chaque date, nous fournissons à gauche l'image de niveau 1C (en réflectances TOA), et à droite l'image de niveau 2A (en réflectances de surface). Les nuages détectés sont entourés en rouge

Validation des épaiseurs optiques d'aérosols obtenues pour SPOT4(Take5)

=>

Nous sommes en train de préparer un retraitement des données SPOT4 (Take5) pour la fin de l'année. Pour en choisir les paramètres, j'ai compilé tous les résultats de validation des épaisseurs optiques mesurées par notre méthode MACCS, en les comparant avec celles mesurées par le réseau Aeronet. Dans la méthode MACCS appliquée à SPOT4(Take5), en l'absence d'une bande spectrale dans le bleu, l'estimation de l'épaisseur optique peut être faite de deux manières :

  • soit par inversion de l'épaisseur optique par la méthode multi-temporelle,
  • soit par bouchage de trous, les trous pouvant être dus à la présence de nuages, d'eau ou de neige, ou à la présence de pixels de réflectance trop forte ou ayant varié trop fortement entre deux dates.

 

Comparaison des épaisseur optiques mesurées avec MACCS avec celles mesurées in-situ par des photomètres du réseau Aéronet. Les points bleus correspondent aux cas où l'atmosphère est stable et où il n'y a pas de nuages dans le voisinage. Les points rouges correspondent aux cas où l'atmosphère est moins stable (variation de l'épaisseur optique en une heure) ou aux cas où des nuages sont détectés dans le voisinage de la mesure (20*20 km).
La courbe de gauche ne retient que les dates et sites ayant moins de 60% de pixels dont l'épaisseur optique est obtenue par bouchage de trous et pour celle de droite, seules les dates et sites ayant moins de 20% de pixels bouchés sont retenus. On constate que le bouchage de trous n'introduit pas trop d'erreurs dans les cas stables, mais en introduit davantage dans les cas instables.

 

Les estimations d'aérosols ont été obtenues avec le prototype de MACCS développé et maintenu par Mireille Huc au CESBIO. Le modèle d'aérosols n'est pas celui qui a été utilisé pour la première production de SPOT4 (Take5). Il s'agit d'aérosols un peu plus gros (rayon modal 0.2 µm, contre 0.1µm dans le traitement initial), qui fournissent un meilleur accord global avec les mesures d'Aeronet. C'est ce modèle qui sera utilisé dans le futur retraitement des données SPOT4 (Take5), pour la plupart des sites.

 

L'écart-type des mesures d'épaisseur optique pour les cas stables est de 0.06, ce qui est du niveau de l'état de l'art, et constitue une performance remarquable, compte tenu de la difficulté à estimer l'épaisseur optique des aérosols sans bande bleue. De plus, certains des sites Aéronet (Bruxelles, Gwangju, Ouarzazate, Wallops, NASA_LaRC) utilisés sont assez éloignés de l'image SPOT, parfois de plus de 60 kilomètres.

Les sites aéronet utilisés ici sont :

Site SPOT4 Take5 Site Aeronet
Belgique Bruxelles
South Great Plains Cart_Site
Korea Gwangju_GIST
Chesapeake NASA_LaRC
Chesapeake Wallops
Versailles Paris
Versailles Palaiseau
Tunisia Ben Salem
Maroc Saada
Maroc Ouarzazate
Sudmipy-Est Seysses + Le Fauga
Sudmipy-Ouest Seysses
Provence Carpentras
Provence Frioul

 
Les plus mauvais résultats sont obtenus pour les sites :

  • Gwangju (Korée): le site SPOT est en bord de mer, alors que le site Aeronet est à l'intérieur des terres, dans une grande ville (notamment les points rouges avec une forte épaisseur optique sur la courbe "_60".)
  • Ben Salem (Tunisie): sur ce site très nuageux au début de la période, de fortes variations des réflectances de surface alors que les images à peu près claires sont très espacées dans le temps.
  • Palaiseau et Paris : dans ce cas, le modèle d'aérosols utilisé pour tous les sites n'a pas l'air d'être le bon modèle, il faudrait rajouter des aérosols carbonés et absorbants.

En revanche, les sites Maroc, Provence (même l'extrapolation à l'ile du Frioul), Sudmipy, Wallops et Cart_site donnent d'excellents résultats.

 

Enfin, certains utilisateurs nous on rapporté des problèmes de correction atmosphérique pour les les sites forestiers équatoriaux, mais malheureusement (ou heureusement pour nos statistiques), aucun d'entre eux ne dispose d'un instrument du réseau AERONET.

 

Retour sur le pilotage en temps réel de l'irrigation d'une parcelle par télédétection

=>

Le CESBIO contribue à un laboratoire mixte international au Maroc, baptisé TREMA, "Télédétection et Ressources en Eau en Méditerranée semi-Aride". Cette année, ce laboratoire s'est lancé dans une expérience ambitieuse de pilotage de l’irrigation par imagerie satellitaire, sur une parcelle de blé dur près de Marrakech. Nous vous en parlions au mois de mars. Cette expérience s'est révélée très encourageante.

 

L’objectif principal de l’expérience était de vérifier si nous pouvions assumer la logistique de pilotage de l’irrigation par un modèle de bilan hydrique dans des conditions réelles. Pour cela, un agriculteur s’est prêté à notre jeu en proposant deux parcelles de blé dur de quatre hectares : L'irrigation de la parcelle de référence était pilotée par l’agriculteur selon sa méthode habituelle. La parcelle d’essai était pilotée par l’outil SAMIR (modèle FAO-56 forcé par l’imagerie satellitaire).

Depuis la date de semis fin décembre jusqu’à la récolte en début juin, une station météo installée sur une culture de référence nous a transmis quotidiennement les mesures d’Evapotranspiration de Référence. D’autre part, pour contrôler à posteriori la qualité de nos estimations des besoins en eau d'irrigation, deux stations de flux ont été mises en place. Nous avons également acquis une série d’image SPOT5 en début de saison pour pallier au démarrage un peu tardif de l’expérience SPOT4(TAKE5) qui commençait en février.

 

En plus d’une météo très claire tout au long de la saison, nous avons pu bénéficier de l’excellent travail de l’équipe SPOT4(TAKE5) qui nous a délivré les images géoréférencées très rapidement. Les trajectoires de NDVI ont ainsi pu être corrigées dans un délai relativement court. En fin de chaîne, la relation avec l’Office Agricole du Haouz nous a permis d’effectuer les irrigations de la parcelle d'essai dans les meilleures conditions tout en étant soumis aux contraintes du système de canaux.

 

Sur le terrain, cela n’a pas fonctionné aussi bien que nous le souhaitions. Suite à un malentendu avec l’agriculteur, nous avons complètement raté la seconde irrigation et l'application des engrais n’a pas été opportune. En effet, la parcelle étudiée est installée sur un sol très argileux qui forme une croûte de battance. Une irrigation spécifique, quelques jours après le semis, est nécessaire pour faciliter l’émergence des plantes. D’autre part, l'agriculteur a appliqué l'engrais azoté sur les deux parcelles juste après l'irrigation de la parcelle de référence et relativement loin de l'irrigation de la parcelle d'essai. Sous ces conditions l'azote est relativement moins soluble sur la parcelle étudiée.

 

Notre expérience a donc été sérieusement handicapée par ces malentendus avec l'agriculteur. En dépit de cela, nous avons mené l’expérience jusqu’à sa fin.

Ce graphe fournit les variations tout au long de long de l'expérience des apports d'eau par les précipitations et les irrigations, ainsi que de l'évapo-transpiration ETobs mesurée sur le terrain et de l'observation ET modélisée par le modèle SAMIR, à partir de l'état de la végétation observé par SPOT4 (Take5). Sur cette parcelle, les dates des irrigations ont été préconisées par le modèle.

 

A notre grand étonnement, les résultats sont extrêmement prometteurs. En effet, malgré une biomasse inférieure de 20% par rapport à la parcelle pilotée par l’agriculteur, nous avons obtenu un rendement en grain équivalent. Ceci peut s’expliquer par le fait que, bien que le nombre moyen de talles (les "brins" de blés) fusse très inférieur sur la parcelle d’essai, il est très probable que la parcelle de référence, irriguée, selon la méthode traditionnelle, ait subit un stress hydrique en fin mars limitant ainsi le remplissage des grains.

 

Cette expérience grandeur nature est riche d’enseignements. Tout d’abord, la logistique imagerie-météo-irrigation a très bien fonctionné (télétransmission de la météo, réception et corrections géométriques et radiométriques des images, run du modèle, lancement des irrigations) et peut-être largement automatisée. Les données SPOT4(Take5) qui préfigurent celles de Sentinel-2, avec la météo de cette année, se sont révélées parfaitement adaptées.  Malheureusement, la croûte de battance a fortement limité l’émergence de la culture. Ce phénomène pourtant bien connu de notre agriculteur nous a appris à cultiver l’humilité ;-) et nous devrons envisager l’introduction de ce risque dans un système d’aide à la décision. Enfin, les contraintes fonctionnelles de l’irrigation en système gravitaire nous ont appris que notre outil devra être plus flexible en proposant plutôt une fenêtre de dates plutôt qu’une seule meilleure date d’irrigation, et qu’il devra pouvoir être lié à un ou plusieurs pronostics météo.

 

Suite à cette expérience, nous avons commencé à mettre en place un outil Web (SAT-IRR) qui devrait à court terme offrir les fonctionnalités essentielles pour l’aide à la décision d’irrigation dans une interface simplifiée.

 

L'USGS distribue des produits LANDSAT corrigés des effets atmosphériques

=>

L'USGS et de la NASA viennent de mettre en place la production et la distribution de produits LANDSAT de Niveau 2A (exprimés en réflectance de surface, corrigés des effets atmosphériques, et accompagnés d'un masque des nuages et de leurs ombres, et de masques de neige et d'eau). Pour le moment, les données thermiques sont exprimées en température de brillance au sommet de l'atmosphère. Ce produit est déjà disponible pour LANDSAT 5 et LANDSAT 7 et la NASA travaille actuellement à l'adaptation de ses chaînes à LANDSAT -8.

 

Depuis la semaine dernière, ces données sont disponibles sur le site earthexplorer, il faut chercher un peu pour les trouver: cliquer sur l'onglet "data sets", et choisir "Landsat CDR". Vous pouvez donc commander vos données, qui sont prêtes dès le lendemain (sauf peut-être si vous en commandez des centaines). Il est seulement dommage que l'USGS ne dispose pas d'une grande partie des données LANDSAT historiques (Landsat 4 et 5) acquises dans les stations de l'ESA. Un transfert de ces données est prévu, mais il n'a pas encore eu lieu (nous l'attendons avec impatience).

 

Comparaison des pourcentages de nuages détectés par MACCS (=MTCD) et LEDAPS sur des scènes LANDSAT aux Etats-Unis. L'accord est très bon dans la plupart des cas, même si on note dans quelques cas rares une sous détection de nuages par LEDAPS. L'un des points les plus éloignés de l'axe est illustré ci-dessous.

Les produits de réflectance de surface LANDSAT ont été obtenus avec la chaîne LEDAPS de [Vermote et Masek 2006]. La chaîne LEDAPS utilise la méthode DDV pour estimer l'épaisseur optique des aérosols, et une batterie de tests portant sur une seule date pour détecter les nuages. Nous avions fait l'an dernier une comparaison avec nos méthodes (MACCS), et les résultats étaient assez proches, même si la méthode mono date ne peut pas tout à fait rivaliser avec la précision des méthodes multi-temporelles (cf figures ci-dessous). LEDAPS est également un peu moins bon pour la détection des ombres, encore plus difficiles à détecter que les nuages. Mais au total, l'existence de ce produit va certainement simplifier le travail de beaucoup d'utilisateurs.

 

Le produit LANDSAT Surface Reflectance est pour le moment le seul produit de niveau 2A à haute résolution existant ou prévu, avec une couverture mondiale.  Cependant, le pôle THEIA a produit des données de niveau 2A à partir des données de l'expérience SPOT4 (Take5) (disponibles ici) et à partir  des données acquises par LANDSAT 5, 7 ou 8 sur la France depuis 2009 (disponibles là).

Selon les plans actuels, l'ESA ne fournira pas de produit 2A pour Sentinel-2. Il est dores et déjà prévu que THEIA fasse tourner la chaîne MACCS pour fournir des données de niveau 2A pour Sentinel-2 sur toute la France, et très probablement sur quelques autres pays ou régions à définir, couvrant au total une surface équivalente à 10 fois la France. L'application de MACCS au monde entier n'est pas encore décidée, même si THEIA se positionne pour le faire.

 

Comparaison des masques de nuages MACCS (gauche) et LEDAPS (Droite), dans un cas difficile avec des nuages très fins, mieux détectés (entourés en rouge) par MACCS. Dans les cas standards, les masques des deux méthodes sont plus proches.

 

Reference : Masek, J. G., Vermote, E. F., Saleous, N. E., Wolfe, R., Hall, F. G., Huemmrich, K. F., ... & Lim, T. K. (2006). A Landsat surface reflectance dataset for North America, 1990-2000. Geoscience and Remote Sensing Letters, IEEE, 3(1), 68-72.

SPOT4 (Take5) : statistiques de couverture nuageuse sur un mois

=>

Nous avons reçu d'Astrium Geo toutes les images de niveau 1A de l'expérience SPOT4(Take5), acquises entre le 31/01/2013 et le 10/03/2013, qui ne sont pas entièrement couvertes de nuages. Nous ortho-rectifions ces images pour obtenir des produits de Niveau 1C. Il arrive cependant que la couverture nuageuse soit trop importante pour pouvoir fabriquer un produit de Niveau 1C

Toutes ces productions nous permettent de calculer des statistiques sur la proportion d'images nuageuses.

 

Proportion d'images produites au niveau 1A et au niveau 1C
Organisme Images acquises N1A produits N1C produits N1A (%) N1C (%)
CNES 324 184 157 56 % 49 %
JRC 54 29 27 53 % 50 %
ESA 84 41 34 49 % 40 %
NASA 48 26 26 54% 54%
CCRS 6 1 1 17 % 17 %

 

En moyenne, la moitié des images acquises sont inutilisables car entièrement nuageuses ou presque, et l'autre moitié des images (60*60 km2) contient assez de pixels clairs (au moins 15%) pour que l'ortho-rectification soit possible. Lorsque nous aurons produit les masques de nuages au Niveau 2A, nous pourrons en déduire, pour chaque pixel, le nombre d'observations claires par mois.
Nous n'en sommes pas là, mais nous avons constaté visuellement sur les acquisitions en Europe ou en Afrique du Nord,  que la totalité des pixels de ces sites ont été vus sans nuages au moins une fois en février, à l'exception de 3 sites : CAlsace, EBelgium, CTunisie (!). Pour le site Alsacien, il a fallu attendre le 4 mars, et pour le site Tunisien, le 10 mars. Enfin, seule une petite partie du site Belge a été vue, le 8 mars.

 

Nombre d'images acquises en février en fonction de leur taux de couverture nuageuse
Site nuages<10% 10%<nuages<50% 50%<nuages<80% Nuages>80%
Alpes 2 0 2 2
Alsace 0 0 0 6
Ardèche 1 1 0 4
Loire 1 0 3 2
Bretagne 1 0 1 4
Languedoc 0 2 2 2
Provence 2 3 1 0
SudmipyO 1 1 1 3
SudmipyE 1 1 1 3
VersaillesE 2 0 1 3

 

Le mois de février 2013 a été très nuageux en France, mais malgré cela, la répétitivité de 5 jours a permis d'observer la quasi totalité des sites au moins une fois en un mois, parfois davantage, mais pas toujours. Si SPOT4 n'était passé qu'une fois sur deux, seuls les sites Provence, Alpes et Versailles auraient été observés entièrement à coup sûr.

 

Ce résultat montre qu'il est absolument nécessaire de lancer les deux satellites Sentinel-2 à des dates très proches, afin de pouvoir assurer une utilisation opérationnelle et fiable des données. Il ne faudrait pas que les récentes réductions du budget de l'Union Européenne consacré à GMES/Copernicus conduisent à retarder le lancement du second satellite, réduisant la répétitivité de Sentinel-2 à seulement 10 jours pendant de longues années.

Premiers masques de nuages sur SPOT4(Take5)

=>

Maintenant que vous savez presque tout sur nos méthodes multi-temporelles de détection des nuages et de leurs ombres, nous pouvons vous présenter nos premiers résultats obtenus par Mireille Huc avec SPOT4 (Take5). Nous avons dû pour cela attendre d'avoir suffisamment de données pour initialiser correctement cette méthode multi-temporelle. Ces masques ne sont pas (encore) parfaits, mais ils sont déjà tout à fait présentables.

 

Nous présentons ci-dessous une série de 6 images de niveau 1C, exprimées en réflectances au sommet de l'atmosphère, avec superposition des masques de nuages, des ombres de nuages, et aussi des masques d'eau et de neige. Les nuages sont entourés en vert clair, leurs ombres sont entourées de noir, l'eau et la neige sont respectivement entourées de bleu et de rose. Cliquez deux fois sur les images pour voir les masques en détail. Ces images ont été acquises en Provence, chacune d'entre elles est le résultat de la fusion de 4 images SPOT4 de 60*60 km2, acquises simultanément, et ortho-rectifiées.

 

Le résultat est très honorable, la plupart des nuages, y compris de très fins nuages, sont détectés, et les grandes plages d'ombres ont également été repérées. Les fausses détections de nuages et d'ombres sont assez rares, et finalement, le masque de nuages est sévère mais juste. Le masque d'eau est très précis et quasiment sans fausse détection. Le masque de neige présente quelques manques, là où la couverture de neige reste partielle.

 

Cependant, nous ne doutons pas que votre regard, de plus en plus expert, saura trouver des nuages très fins non détectés dans le coin Nord est de la première image, quelques fausses détections de nuages sur la troisième, ainsi que dans cette même image, une partie de la neige, quand la couverture de neige est partielle, qui reste classée comme nuage au lieu de d'être classée comme neige. Sur la cinquième image, qui a une charge d'aérosols un peu plus forte, quelques parcelles de sols nus au centre de l'image sont classées nuageuses. C'est dû à une augmentation de la réflectance en raison d'une probable baisse de l'humidité des sols après de fortes pluies. Le seuil de détection des nuages au-dessus de l'eau pourrait également être relevé, certains étangs de Camargue sont déclarés nuageux à tort. Mais en pourcentage, ces petites erreurs sont bien faibles comparées à la qualité des détections et nous affinerons tous ces seuils quand nous disposerons d'un plus grand nombre d'images de test.

Sur la quatrième date, seules deux images (60*60 km²) sur les quatre sont disponibles car la couverture nuageuse sur la partie ouest du site était trop forte pour que l'ortho-rectification puisse fonctionner. En fait, on pourrait dire que l'étape d'ortho-rectification constitue notre premier filtre de nuages...

 

Les nuages sont entourés en vert clair, leurs ombres sont entourées de noir, l'eau et la neige sont respectivement entourées de bleu et de rose. Cliquez deux fois sur les images pour voir les masques en détail à 40m de résolution.