Le retraitement de SPOT4 (Take5) est en cours / SPOT4 (Take5) reprocessing on its way.

Le retraitement des données SPOT4 (Take5) est en cours dans le centre MUSCATE de THEIA, au CNES. Les niveaux 1C ont été produits, le traitement des niveaux 2A commence aujourd'hui. Nous avons perdu une semaine avec un bug qui a été trouvé à la dernière minute sur des données FORMOSAT-2, et bien qu'il ne soit pas très probable qu'il se produise sur SPOT4 (Take 5), nous avons décidé de le corriger avant ce retraitement. Le traitement des Niveaux 2A devrait être terminé dans une semaine, et les produits seront disponibles pour la distribution la semaine suivante.

The SPOT4-(Take5) reprocessing is on its way in the MUSCATE processing center at THEIA, CNES. The level 1C products have been produced, and the level 2A should start today. A last minute bug on the level 2 was found when processing some Formosat-2 data, and although it was not likely to happen on SPOT4 (Take 5), data, we decided to correct it before launching the reprocessing. The level 2A processing should end next week, and distribution will start the week after.

Sentinel-2 Agriculture

We are very proud to tell that our consortium was selected by ESA for the S2-Agri call for tender.

 

Our consortium is built from the following partners :

 

The S2-Agri project, whose website was just created, aims at showing on a large scale project, the capabilities of Sentinel-2 mission for agriculture monitoring, by providing, after consulting several "champion" users, and open source processing software, that will provide the following types of products :

 

  • periodic synthese of surface reflectances (Level 3A products)
  • a crop mask
  • a map of the main crops (see the image below, and the post on land cover maps)
  • some vegetation indices or biophysical variables

Example of a land cover map automatically generated by a software developed by Isabel Rodes (CESBIO), from LANDSAT 5 and 7 data in 2010. This land cover map was produced by I. Rodes, in the framework of a methodological PhD thesis, it is not as specialized for Agriculture as the ones that will be produced for S2-Agri project. It still already provides 3 agriculture classes : winter crops, summer corps, and meadows.

 

This project, which started on January 31st, 2014, will be carried out in three phases, each with an approximative duration of 1 year.

  1. A test phase, to develop, tune and validate methods and products, on 13 sites scattered around the world, this phase will mainly rely on SPOT4-Take5 data, complemented by LANDSAT 8 or RapidEye images. Several sites will be selected within the JECAM network.
  2. A development phase, during which the production system will be built, and prototype products will be issued and tested.
  3. A demonstration phase, based on the first year of Sentinel-2 acquisitions, for which 3 entire countries (> 500 000 km²) plus 5 sites of 300x3000 km². At least 2 of selected  the countries are in Africa.

At the end of the project, the production system will be released as an open source software by ESA, and

A l'issue de ce projet, le système de production sera disponible en open source auprès de l'ESA, and given the amount of work, we will have won dark circles around our eyes!

 

Sentinel-2 - Agriculture

=>

Nous sommes très fiers d'annoncer que notre consortium vient de remporter l'appel d'offres S2-Agri de l'ESA.

Ce consortium est constitué par les entités suivantes :

Ce projet, dont le site officiel vient d'être créé, a pour but de mener une démonstration à grande échelle de l'intérêt du projet Sentinel-2 pour le suivi de l'agriculture, en fournissant, après consultation d'un grand nombre de "champion users", un logiciel libre de traitement, permettant d'obtenir des produits tels que :

  • des synthèses périodiques de réflectances de surface (produits de Niveau 3A)
  • un masque des cultures
  • une carte des principaux types de cultures (cf illustration ci-dessous, et voir l'article sur les cartes d'occupation des sols)
  • des indices de végétation ou des variables biophysiques

Exemple de classification réalisée automatiquement par Isabel Rodes (CESBIO), à partir de données LANDSAT 5 et 7 acquises en 2010. Cette carte d'occupation des sols, réalisée dans le cadre d'une thèse méthodologique, n'est pas spécialisée sur l'agriculture, contrairement à celles qui seront générées pour le projet S2-Agri, mais elle fournit déjà trois classes agricoles :cultures d'été, cultures d'hiver et prairies.

 

Ce projet, qui a démarré le 31/01/2014, se déroulera en trois phases d'une durée approximative d'un an chacune :

  1. Une phase de test et de mise au point des méthodes et produits, sur 13 sites distribués à travers le monde, qui s'appuiera sur des données SPOT4-Take5, complétées éventuellement par des données LANDSAT 8 ou RapidEye. Plusieurs sites feront partie du réseau JECAM.
  2. Une phase de développement du système de production, avec la génération et la validation des produits prototypes à partir des données acquises et pré-traitées durant la première année
  3. Une phase de démonstration, basée sur la première année d'acquisitions de Sentinel-2, pour laquelle 3 pays entiers (de la taille de la France) devront être traités, plus 5 sites de grande taille (300*300 km²) ! Au moins deux des trois pays sélectionnés seront situés en Afrique.

A l'issue de ce projet, le système de production sera disponible sous la forme d'un logiciel libre, auprès de l'ESA, et vue l'ampleur de la tâche, nous aurons gagné de beaux cernes sous les yeux.

 

The level 3A products

Among the products prepared to be processed by the THEIA land data center, the level 3A product was not yet described in this blog. The level 3A products provide a monthly synthesis of the level 2A. These products should be very useful for the following reasons :

  • The level 3A, produced once a month, uses up to six times less volume than the level 2A products acquires during a month.
  • The level 3A provides a regular time sampling of the reflectances variation, while the level 2A sampling is dependent on the cloud cover
  • Several processing methods and applications are hindered by the data gaps due to cloud cover. The level 3A product aims at minimizing the residual gaps.

 

Thanks to SPOT4 (Take5) data set, we were able to try and test several methods to produce level 3A products on varous types of landscapes and climates. This work, suprvised by Mireille Huc and myself, is performed by Mohamed Kadiri, at CESBIO, and is funded by the CNES budget of THEIA Land Data Center. Our method consists in computing, foe each pixel, a weighted average of the surface reflectances of the cloud free observations, obtained within a N day distance frome the central date TO of the level 3A product. For instance, the example below was obtained with N=21, for the 15 th of each month. As a result, the level 2A used in the average for the level 3A product dated on March the 15th, were acquired from Feruary the 24th to April the 4th.

 

 

The weighted average gives more weight to

  • the cloud free images
  • the pixels which are far from clouds
  • the images with a low aerosol content
  • the images acquired near the level 3A product date.

Les values of the weight and of the duration N, have a large influence on the product data quality. To tune their values, we set up three quality criteria :

  • The percentage of residual data gaps for which all the observations were cloudy
  • The difference of the level 3A reflectances with the values of a selected level 2A product acquired near the central date T0.
  • A measurement of the artefacts standard deviation. The artefacts appear near the borders of data gaps that affect one of the dates used in the level 3A synthesis.

 

For instance, here are the performances obtained on the Versailles site, which was heavily clouded in the spring of 2013. For this site, one can note, that the residual gap percentage is very low despite the bad weather, confirming that Sentinel-2 should be able to provide cloud free Level 3A products each month. For this site, the optimal duration of the synthesis is somewhere between 2* 21 and 2*28 days.

 

Performances obtained for Versailles SPOT4(Take5) site, for several values of the half-period N. In red, the residual percentage of data gaps (scale on the right), in yellow and green, the maximum value of the difference of the level 3A to the central level 2A, for resp the best 70% and 95% of pixels. In blue, the residual error standard deviation.

 

 

 

For Sentinel-2, the level 3A will have to include a correction for directional effects, in order to use in the same level 3A product, the data acquired from different satellite tracks, from different viewing angles. Finally, as an option, we might include a gap-filling method to fill the residual gaps.

In short, we still have work to do. A comparison with the classical NDVI Maximum Value Composite is provided in this post.

Les produits de Niveau 3A

=>

Parmi les produits que nous préparons pour les traitements de données Sentinel-2 du pôle THEIA, les produits de Niveau 3A n'ont pas encore été abordés dans ce blog. Ceux-ci fournissent une synthèse mensuelle des produits de niveau 2A. Les produits de Niveau 3A devraient être bien utiles pour les raisons suivantes :

  • Le produit de Niveau 3A, fourni une fois par mois, représente un volume de données jusqu'à 6 fois inférieur à celui des niveaux 2A acquis pendant un mois.
  • Le produit de niveau 3 fournit un échantillonnage temporel régulier de l'évolution des réflectances, alors que l'échantillonnage du Niveau 2A est dépendant de la couverture nuageuse
  • Beaucoup de méthodes de traitement sont perturbées par la présence de trous dans les images dus à la couverture nuageuse. Le Niveau 3A vise à minimiser les pixels manquants.

 

Grâce au jeu de données SPOT4(Take5), nous avons pu expérimenter différentes méthodes de création des produits de Niveau 3A sur différents types de sites. C'est Mohamed Kadiri, au CESBIO, qui a pris en charge ce travail, financé par le budget CNES du projet THEIA, et avec le soutien de Mirelle Huc. La méthode consiste à calculer, pour chaque pixel, la moyenne des réflectances de surface des observations non nuageuses, obtenues pendant une demi période de N jours autour de la date T0 du produit de niveau 3A. Par exemple, dans l'exemple ci-dessous obtenu avec N=21, pour le produit du 15 mars (T0), les données utilisées couvrent la période du 24 février au 4 avril.

 

 

La moyenne calculée est une moyenne pondérée, qui attribue plus de poids :

  • aux images sans nuages
  • aux pixels situés loin de nuages
  • aux images avec peu d'aérosols
  • aux images proches de la date du produit de Niveau 3

 

Les poids et surtout la demi-période N ont une forte influence sur la qualité des résultats. Pour déterminer leurs valeurs, nous avons mis au point 3 critères de qualité :

  • le pourcentage de pixels dont la réflectance est manquante en raison des nuages
  • la différence du produit de Niveau 3A avec un produit de Niveau 2A faiblement nuageux acquis à quelques jours de la date centrale T0.
  • une mesure des artefacts. Les artefacts apparaissent en bordure des trous (dus aux nuages ou aux ombres) présents sur chacune des images.

 

Voici par exemple les performances obtenues sur le site de Versailles, site fortement nuageux lors du printemps 2013. Cette courbe confirme que malgré le mauvais  temps, Sentinel-2 devrait pouvoir fournir des produits quasiment sans nuages chaque mois sur ce genre de sites. Sur ce site, l'optimum de la durée de synthèse est compris entre 2*21 et 2*28 jours :

Performances obtenues sur le site de Versailles, pour plusieurs valeurs de la longueur de période N. En rouge, les trous résiduels (échelle à gauche), en jaune et vert, l'écart maximal à l'image centrale exprimé en réflectance, pour les 70% et 90% de pixels les meilleurs, et en bleu l'écart-type moyen des artefacts

 

Les produits de niveau 3A de Sentinel-2 devront aussi inclure une correction des effets directionnels, afin de pouvoir inclure dans un même produit de Niveau 3A des données issues de traces orbitales différentes, et donc acquises avec des angles de prise de vue différents. Enfin, en option, nous pourrons proposer une opération de bouchage des trous résiduels par interpolation temporelle ou en utilisant le comportement moyen de pixels similaires. Bref, il nous reste du pain sur la planche. Une comparaison avec la méthode classique de maximum de NDVI est fournie dans cet article.

The product level names, how they work ?

Simulation of Sentinel-2 products from Formosat-2 data (CESBIO)

 

Many of you are confused by the earth observation product names. Maybe detailing the logic behind the names will help you recall them. Here is how the THEIA Land Data Center product names were chosen.

  • we decided to use Sentinel-2 product names 1C, 2A, 3A, since we are sure Sentinel-2 will become a reference in high resolution earth observation.
    • Level 1C is a monodate ortho-rectified image expressed in TOA reflectance
    • Level 2A is a monodate ortho-rectified image expressed in surface reflectance, provided with a cloud/cloud shadow/snow/water mask
    • Level 3A is a monthly composite of Level2A Cloud/Cloud shadows free pixels
  • this nomenclature, defined by ESA and CNES, complies with the norms of the Committee on Earth Observation Satellites (CEOS)

 

CEOS naming rules are quite difficult to find, and I had searched them several times unsuccessfully. But recently, I found the list of members of the CEOS product harmonization committee, and two of its members (Frédéric Baret (INRA, France), and Kenneth McDonald (NOAA, USA)) replied very quickly to my questions.

 

The CEOS norm is based on a nomenclature defined by NASA in 1996, which is available on  Wikipedia :

 

Data Level NASA-EOSDIS Definition

http://science.nasa.gov/earth-science/earth-science-data/data-processing-levels-for-eosdis-data-products/
Level 0 Reconstructed, unprocessed instrument and payload data at full resolution, with any and all communications artifacts (e.g., synchronization frames, communications headers, duplicate data) removed.
Level 1A Reconstructed, unprocessed instrument data at full resolution, time-referenced, and annotated with ancillary information, including radiometric and geometric calibration coefficients and georeferencing parameters (e.g., platform ephemeris) computed and appended but not applied to Level 0 data.
Level 1B Level 1A data that have been processed to sensor units (not all instruments have Level 1B source data).
Level 2 Derived geophysical variables at the same resolution and location as Level 1 source data.
Level 3 Variables mapped on uniform space-time grid scales, usually with some completeness and consistency.
Level 4 Model output or results from analyses of lower-level data (e.g., variables derived from multiple measurements).

 

I do not know what you think of it, but my sense is that it is quite vague in some aspects (what is a  "sensor unit") and too directive in some other aspects : a resampling of data on a cartographic grid is only allowed at level 3. If a uses does not want to handle the always complex reprocessing of data, he has to use the level 3 data.

 

The CEOS norm provided below was clearly inspired by NASA's norm, but it allows a data resampling  starting at level 1, and the data can be expressed in Physical units and not only "Sensor units". The CEOS norm does not detail the sub-levels (1A, 2B...). However, the distinction between Level 1 and Level 2 is still a bit fuzzy, as it is not always easy to tell a physical unit from a geophysical unit. We often consider a top of atmosphere reflectance as a Level 1 product and a surface reflectance after atmospheric correction a Level 2 product. Is a surface reflectance a physical unit or a geophysical unit?

 

Data Level CEOS Definition

http://www.ceos.org/images/WGISS/Documents/Handbook.pdf

Level 0 Reconstructed unprocessed instrument data at full space time resolution with all available supplemental information to be used in subsequent processing (e.g., ephemeris, health and safety) appended.
Level 1 Unpacked, reformatted level 0 data, with all supplemental information to be used in subsequent processing appended. Optional radiometric and geometric correction applied to produce parameters in physical units. Data generally presented as full time/space resolution. A wide variety of sub level products are possible.
Level 2 Retrieved environmental variables (e.g., ocean wave height, soil moisture, ice concentration) at the same resolution and location as the level 1 source data.
Level 3 Data or retrieved environmental variables which have been spatially and/or temporally re-sampled (i.e., derived from level 1 or 2 products). Such re-sampling may include averaging and compositing.
Level 4 Model output or results from analyses of lower level data (i.e., variables that are not directly measured by the instruments, but are derived from these measurements).

 

Having had some difficulties finding the famous CEOS norm, I had build my own idea of what the CEOS norm should be, probably, from dscussions with colleagues during the POLDER.project preparation. So here is my own version of a norm ( but I know a personal norm is useless...)

 

Data Level Product nomenclature according to... myself
Level 0 Reconstructed unprocessed instrument data at full space time resolution with all available supplemental information to be used in subsequent processing (e.g., ephemeris, health and safety) appended.
Level 1 All pixels were acquired at the same time (within a few instants, during one satellite overpass), and their processing does not make assumptions on the nature of the observed pixel. Each pixel is processed in the same way, whatever it is made of (cloud, forest, sea...). The values are expressed in physical units or the product provides all the necessary information to convert the values to physical units. The product may be resampled onto a cartographic grid, or may just provide the necessary information to resample it.
Level 2 All pixels were acquired all at the same time (within a few instants, during one satellite overpass), but here, the processing may include assumptions on the nature of the pixel, for instance concerning the atmosphere, vegetation of sea state. The pixels may be processed differently according to their nature.
Level 3 The product is obtained from data acquired at different dates, often with different footprints. As for Level 2, processing may differ according to the pixel nature, and assumptions on this nature are allowed.

Level 3 products are often composite products based on the level 2 data acquired during a certain period of time (10 days, one month...)

 

The CEOS norm does not define sub-levels, and for that aspect, NASA's norm has some influence. For instance, with Sentinel-2, Level 1A and Level 1B exist as internal products and are quite similar to what is in NASA norm, while the Level 1C is ortho-rectified and expressed in top of atmosphere reflectance. The level 1C only will be distributed to standard users.

 

Sentinel-2 Mission requirement document also defines a level 2A, expressed in surface reflectance, and a Level 2B that provides biophysical variables such as LAI, fAPAR...However, none of these product will be operationally processed by Sentinel-2 ground segment. These products will be produced by THEIA Land Data Center, but not globally at first.

 

Finally, let's recall that several Earth observing missions do not respect the CEOS norms, often because their nomenclature was defined before the norm existed. It is the case of SPOT and followers (Pleiades, Rapid Eye...)

 

 

Les noms des niveaux de produits, comment ça marche ?

=>

Simulations des produits Sentinel-2 à partir d'images Formosat-2

 

Vous êtes nombreux à ne pas retenir les noms des produits d'observation de la terre, et si je n'étais pas tombé dedans quand j'étais petit, je ne ferais pas mieux.  Peut-être qu'en détaillant la logique qui a conduit à leur définition, il sera plus facile de les retenir. Voici donc comment les noms des produits du pôle THEIA ont été définis :

 

  • nous avons décidé d'utiliser la nomenclature de Sentinel-2 : 1C, 2A,  3A, car nous sommes convaincus que Sentinel-2 deviendra rapidement la référence en imagerie spatiale
    • Le produit de Niveau 1C est une image monodate ortho-rectifiée, exprimée en réflectance au sommet de l'atmosphère.
    • Le produit de Niveau 2A est une image monodate ortho-rectifiée, exprimée en réflectance de surface, accompagnée d'un masque de nuages/ombres de nuages/neige/eau
    • le produit de Niveau 3A est une synthèse mensuelle ortho-rectifiée des pixels non nuageux provenant des Niveau 2A.
  • cette nomenclature, définie par l'ESA et le CNES respecte les normes du Comittee on Earth Observation Satellites (CEOS)

 

Les normes du CEOS sont assez difficiles à trouver, je les avais cherchées à plusieurs reprises. Heureusement, j'ai fini par trouver quelques membres du comité travaillant sur l'interopérabilité des systèmes, et deux d'entre eux (Frédéric Baret (INRA), et Kenneth McDonald (NOAA)) ont répondu immédiatement à mes questions.

 

La norme du CEOS reprend en fait les termes d'une norme de la NASA, datant de 1986, qui elle est disponible sur Wikipedia :

 

Data Level NASA-EOSDIS Definition

http://science.nasa.gov/earth-science/earth-science-data/data-processing-levels-for-eosdis-data-products/
Level 0 Reconstructed, unprocessed instrument and payload data at full resolution, with any and all communications artifacts (e.g., synchronization frames, communications headers, duplicate data) removed. (In most cases, the EOS Data and Operations System (EDOS) provides these data to the data centers as production data sets for processing by the Science Data Processing Segment (SDPS) or by a SIPS to produce higher-level products.)
Level 1A Reconstructed, unprocessed instrument data at full resolution, time-referenced, and annotated with ancillary information, including radiometric and geometric calibration coefficients and georeferencing parameters (e.g., platform ephemeris) computed and appended but not applied to Level 0 data.
Level 1B Level 1A data that have been processed to sensor units (not all instruments have Level 1B source data).
Level 2 Derived geophysical variables at the same resolution and location as Level 1 source data.
Level 3 Variables mapped on uniform space-time grid scales, usually with some completeness and consistency.
Level 4 Model output or results from analyses of lower-level data (e.g., variables derived from multiple measurements).

 

Je ne sais pas ce que vous en pensez, mais je trouve cette description assez floue, la notion de "sensor units" n'est pas claire, et surtout, il faut attendre le produit de niveau 3 pour que les données soient rééchantillonnées sur une grille cartographique. Si l'utilisateur ne veut pas avoir à se soucier de rééchantillonnage géométrique, il doit utiliser le produit de Niveau 3.

 

La norme du CEOS (ci dessous), clairement inspirée de celle de la NASA, permet de rééchantillonner les données dès le Niveau 1 et de les exprimer en grandeur physiques et non pas pas en "sensor units". La norme du CEOS ne détaille pas les sous niveaux (1A, 1B). Il me semble que cette norme ne détaille cependant pas bien la différence entre les grandeurs physiques et variables géophysiques (par exemple, pourquoi une réflectance au sommet de l'atmosphère serait -elle une grandeur physique et une réflectance de surface une variable biophysique), et laisse beaucoup de marge d’interprétation.

 

Data Level CEOS Definition 

http://www.ceos.org/images/WGISS/Documents/Handbook.pdf

Level 0 Reconstructed unprocessed instrument data at full space time resolution with all available supplemental information to be used in subsequent processing (e.g., ephemeris, health and safety) appended.
Level 1 Unpacked, reformatted level 0 data, with all supplemental information to be used in subsequent processing appended. Optional radiometric and geometric correction applied to produce parameters in physical units. Data generally presented as full time/space resolution. A wide variety of sub level products are possible.
Level 2 Retrieved environmental variables (e.g., ocean wave height, soil moisture, ice concentration) at the same resolution and location as the level 1 source data.
Level 3 Data or retrieved environmental variables which have been spatially and/or temporally re-sampled (i.e., derived from level 1 or 2 products). Such re-sampling may include averaging and compositing.
Level 4 Model output or results from analyses of lower level data (i.e., variables that are not directly measured by the instruments, but are derived from these measurements).

Ayant eu bien du mal à trouver ces fameuses normes du CEOS, je m'en étais fait ma propre idée, probablement à partir de discussions avec les collègues qui travaillaient avec moi sur le projet POLDER. Voici ma version personnelle de la norme (sachant qu'une norme personnelle ne sert à rien bien sûr...)

 

Data Level La nomenclature des produits selon OH
Level 0 Données reconstruites mais non traitées, fournies à pleine résolution, accompagnées de toutes les informations nécessaires pour les traitements de niveaux supérieurs.
Level 1 Le produit de Niveau 1 est un produit dont tous les pixels ont été acquis à la même date (en quelques instants, au cours d'un passage du satellite), et dont le traitement ne fait pas d'hypothèses sur la nature du paysage observé. Chaque pixel de l'image est traité de la même manière, quelle que soit sa nature (nuage, forêt, mer...). Le produit exprime les données en grandeur physique ou fournit toutes les informations nécessaires pour les convertir. Il peut être rééchantillonné sur une grille cartographique ou doit fournir toutes les informations nécessaires à cette conversion.
Level 2 Le produit de Niveau 2 doit être lui aussi acquis en quelques instants, mais cette fois, des traitements différenciés par type de pixel sont autorisés, et l'on peut faire des hypothèses sur l'atmosphère, l'état de la végétation ou de la mer, et traiter les différentes classes de pixels d'une manière différente.
Level 3 Le produit de Niveau 3 est constitué de données acquises à des dates différentes, souvent avec des emprises différentes, et, comme sur le Niveau 2, les traitements peuvent faire des hypothèses sur ce qui est observé. Les produits de niveau 3 sont en général des synthèses périodiques (hebdomadaires, décadaires, mensuelles) des produits de Niveau 2.

 

 

La norme du CEOS ne définit les sous-niveaux de produits, mais dans ce domaine, la norme de la NASA a une certaine influence. Pour Sentinel-2, les produits de niveau 1A et 1B sont des produits internes assez proche de la norme de la NASA. mais le produit de niveau 1C a fournit des données ortho-rectifiées dans une projection cartographique. Seul le niveau 1C devrait être distribué aux utilisateurs normaux.

 

 

La spécification de mission de Sentinel-2 définit également un produit de Niveau 2A, exprimé en réflectance de surface après correction atmosphérique, et un produit de niveau 2B fournissant des variables biophysiques (LAI, FAPAR...). Aucun de ces produits ne sera cependant fourni par le segment sol de Sentinel-2. Ces produits existeront en revanche dans le centre de traitement de THEIA, et nous les avons déja produits pour SPOT4 (Take5).

 

Enfin, notons que de nombreux produits d'observation de la terre ne respectent pas ces normes, souvent parce que la nomenclature a été définie avant l'adoption de la norme : c'est le cas de SPOT et de ses successeurs, y compris les plus récents (Pleiades, Rapid Eye).