Comparison of Level 3A compositing methods


As said in a previous post, we are testing various methods of level 3A production, using SPOT4 (Take 5). The Theia Land Data Center will the use these methods to process Sentinel 2 data. In case you did not click on the link above, let's recall that the level 3A products are monthly composite products of cloud free reflectances. For each pixel, our method computes the weighted average of the reflectances of the dates when the pixel is cloud free. For more details, you will need to follow this link.


The work of Mohamed Kadiri at CESBIO, which is funded by the CNES budget for Theia, adressed first the definition of quality indexes for composite products (for more details, may I suggest that you follow this link ?). This work showed that our product has nice performance, but we knew some one would ask us to compare them to the classical methods for level 3A products.


Therefore, we compared our product with the famous NDVI Maximum Value Composite (NDVI MVC), developped by our remote sensing ancestors, and used since the most remote antiquity to process AVHRR time series. This method consists in using for each pixel of the level 3A, the reflectances of the date which has the greatest NDVI.  Why ? Mostly because the NDVI of a cloud is very low, often negative, and therefore this method will rather select cloud free pixels. The NDVI MVC comes from a time when the cloud masks were not very accurate.


Example of a monthly synthesis obtained with the NDVI MVC methods Example of a monthly synthesis obtained with the weighted average method

This post uses the SPOT4-Take5 data to show a comparison of the performances obtained on the Versailles site, with the NDVI MVC method on the left, and the weighted average on the right. One can clearly see, on the left, the presence artefacts made of whiter and darker dots which are not seen on the image on the right. These artefacts appear when the selected date changes from one pixel to the other. These artefacts are much less visible on the vegetation covered plots, as, for this composite obtained in spring, the vegetation increases quickly, and all the pixels come from the last cloud free date of the synthesis.


If we have a look at our quality indicators, which were described in our previous post about composite products , it is obvious that the performances obtained by the weighted average method are much better than those of the NDVI MVC method, either as regards the similarity to the central date image of the Level 3A (in yellow, for the 70 % best pixels and in green for the 95% best pixels), and moreover as regards as the amplitude of artefacts (in blue). The abscissa of the plot is the half of the number of days used in the synthesis, and our recommended value is 21.



NDVI Maximum Value Composite Weighted Average Composite

How to estimate Aerosol Optical Thickness


Caution ! This post contains formulas !

Aerosols play a great role in the atmospheric effects. Aerosols are particles suspended in the atmosphere, which can be of several types: sand or dust, soot from combustion, sulfates or sea salt, surrounded by water... Their size ranges between 0.1 micron and a few microns, depending on the type of aerosol or on the air moisture. Their quantity is also extremely variable : rain can suddenly reduce their abundance (known as "aerosol optical thickness"). The abundance variations result in great variations of observable reflectances from one day to the next, and it is therefore necessary to know the quantity and type of aerosols, in order to correct their effects.


Unfortunately, to correct the effects of aerosols, there is no global aerosol observation network, and the only available data are local observations from the few hundred points of Aeronet network. Therefore, this network can not be used operationally to correct the satellite images over large areas.

Weather forecast models just start predicting the amounts of aerosols, based on satellite observations and modeling of sources and sinks and of the transport of aerosols by the winds, but these data do not seem to have sufficient accuracy yet to be used for the atmospheric correction of images.


Our atmospheric correction method, named MACCS, is therefore based on an estimate of aerosol optical depth from the images themselves. To understand how this method works, one must already understand the effects of aerosols on radiation. We have seen in this post, that the effects of diffusion can be modelled as follows (assuming the corrected gas absorption):

ρTOA = ρatm +Td ρsurf

The reflectance at the top of the atmosphere ρTOA (Top of Atmosphere) is the sum of the atmospheric reflectance  ρatm and of the surface reflectance ρsurf transmitted by the atmosphere. We seek to know the surface reflectance, but for each measurement made at the top of the atmosphere, there are three unknowns to be determined. To separate the effects of the atmosphere and surface effects, we must use other information.


Dark pixel method

When the image includes a surface whose surface reflectance is nearly zero, the reflectance observed at the top of the atmosphere becomes ρTOA = ρatm. We can therefore deduce the atmospheric reflectance and using a radiative transfer model, the aerosols optical thickness (AOT). Finally, knowing the AOT, we can compute the diffuse transmission, and finally calculate ρsurf. An even simpler and more approximate version of this method consists in subtracting directly the reflectance of the dark pixel (or ρatm) to the entire image (neglecting the transmission) [Chavez, 1988].


However, this method assumes that there is a very dark area in the image (which is not always the case), and that the reflectance of the dark surface is known. The method also assumes that the amount of aerosols is constant over the image and it neglects the effect of terrain. The results obtained by this method can be quite inaccurate. In our method (MACCS), however, we use the method of black pixel determine the maximum value of the optical thickness in the area.


Multi Spectral Method, called "DDV"

If you know the type of aerosols in the atmosphere, it is possible to deduce the properties of aerosols in a spectral band from the optical properties in another spectral band.


If there are two spectral bands, there are two measures ρsurf and three unknowns (both surface reflectance in these bands, and the amount of aerosols). An additional equation can be obtained if we know the relationship between the surface reflectance of the two bands.


The method named "Dark Dense Vegetation" (DDV) is based on assumptions about relationships between surface reflectances of the dense vegetation exploiting the fact that the spectrum of dense green vegetation is quite constant. The most famous version of this method is that used by NASA for MODIS project [Remer 2005]. It connects the surface reflectance in the blue and red with those in the SWIR. This provides two equations for estimating the type of aerosol optical thickness. This method works well in temperate and boreal zones, but not in arid areas where it is difficult to find the dense vegetation. Early versions used the following equations:


ρBlue = 0.5 ∗ ρSWIR

ρRed = 0.25 ∗ ρSWIR


The following versions of the MODIS DDV algorithm are a bit more complicated but follow the same principle. Our work has shown that using the equation below allows a more accurate determination of the optical thickness, for less dense vegetation cover (NDVI to a 0.2) because bare soil brown also respect this relationship.


ρBlue = 0.5 * ρRed

(the exact value of the coefficient is adjusted according to the spectral bands of the instrument)

This version of the  method, however, does not allow to determine the aerosol model. In the case of SPOT4 (Take5), the absence of a blue band does not allow us to use this equation, resulting in a slight loss in accuracy.

This diagram shows that the correlation between surface reflectance above vegetation is much better for the (blue, red) couple of spectral bands than for couples including using (SWIR).




Multi Temporal Method

In most cases, the reflectance of the land surface changes slowly over time, while the aerosol optical properties vary rapidly from one day to another. We can therefore consider what changes from one image to another (apart from special cases often linked to human intervention) is associated with aerosols, and deduce the properties of aerosols and then correct for atmospheric effects. This method is too complex to be explained in detail here, interested readers can refer to [Hagolle 2008].


So that surface reflectance be nearly constant from one image to another, however, it is required that images be acquired at a constant angle. Indeed, the reflectance depend on the viewing angles: this is what we call directional effects. This method therefore applies only to satellite observations obtained with constant angle. It does not apply to standard SPOT data, but this condition is true for SPOT4 (Take5) data. It also applies to Landsat Venμs and Sentinel-2.


Finally :


Validation of aerosol optical thickness (AOT) from time-series of FORMOSAT-2 images, depending on the method (multi-spectral, multi-temporal, combined), compared with the measurements provided by the Aeronet network of in-situ measurements. The multi-spectral method works best on sites covered with vegetation and is much less accurate on arid sites, while the multi-temporal method performs a little worse on green sites, but much better on dry sites. The combination of the two methods retains the best of the two basic methods.

The MACCS/MAJA method, used for SPOT4 (Take5) experiment, and also for LANDSAT, VENμS and Sentinel-2 data, combines the three methods described above to obtain robust estimates of aerosol optical thickness. These methods work in many cases, but sometimes fail when the assumptions on which they are based prove to be incorrect. They generally tend to work better on vegetated areas rather than in arid areas. for now, they assume the model known aerosol and in the coming years, we will look for reliable ways to identify the type of aerosols.


References :
Chavez Jr, P. S. (1988). An improved dark-object subtraction technique for atmospheric scattering correction of multispectral data. Remote Sensing of Environment, 24(3), 459-479.

Remer, L. A., and Coauthors, 2005: The modis aerosol algorithm, products, and validation. J. Atmos. Sci., 62, 947–973.

Hagolle, O and co-authors, 2008. « Correction of aerosol effects on multi-temporal images acquired with constant viewing angles: Application to Formosat-2 images ». Remote sensing of environment 112 (4)

Hagolle, O.; Huc, M.; Villa Pascual, D.; Dedieu, G. A Multi-Temporal and Multi-Spectral Method to Estimate Aerosol Optical Thickness over Land, for the Atmospheric Correction of FormoSat-2, LandSat, VENμS and Sentinel-2 Images. Remote Sens. 2015, 7, 2668-2691.

Les aérosols jouent un rôle prépondérant dans les effets atmosphériques. Les aérosols sont des particules en suspension dans l'atmosphère, qui peuvent être de plusieurs types : grains de sable ou poussières, suies issues de combustion, sulfates ou sels marins entourés d'eau... Leur taille peut varier de 0.1 µm à quelques microns, en fonction du type d'aérosols ou de l'humidité de l'air. Quant à leur quantité, elle est extrêmement variable, une pluie pouvant réduire brutalement leur abondance (on parle d'"épaisseur optique d'aérosols"). Ils peuvent faire varier fortement d'un jour à l'autre les réflectances observables depuis le sommet de l'atmosphère et il est donc nécessaire de connaître leur quantité et leur type afin de pouvoir corriger leurs effets.


Malheureusement, pour corriger les effets des aérosols, on ne dispose pas de réseau global d'observation des aérosols, seulement d'observations locales, sur les quelques centaines de points du réseau Aeronet. Ce réseau ne peut donc pas être utilisé pour corriger opérationnellement les images de satellites sur de grandes étendues.
Des modèles météorologiques commencent à prédire les quantités d'aérosols, en se basant sur les observations de satellites et la modélisation des sources et du transport des aérosols par les vents, mais ces données ne semblent pas encore avoir une précision suffisante pour être utilisées pour la correction atmosphérique des images.


Notre méthode de correction atmosphérique (MACCS) repose donc sur une estimation de l'épaisseur optique des aérosols à partir des images elles-mêmes. Pour bien comprendre le fonctionnement de cette méthode, il faut déjà comprendre les effets des aérosols sur le rayonnement. On a vu, dans ce billet, que les effets de la diffusion peuvent être modélisés ainsi (on suppose l'absorption gazeuse corrigée) :

ρTOA = ρatm +Td ρsurf

La réflectance au sommet de l'atmosphère ρTOA (Top of Atmosphere) est la somme de la réflectance atmosphérique ρatm et de la réflectance de surface ρsurf transmise par l'atmosphère. On cherche à connaître la réflectance de surface, mais à chaque mesure réalisée au sommet de l'atmosphère, on a trois inconnues à déterminer. Pour séparer les effets de l'atmosphère et les effets de la surface, il faut donc utiliser d'autres informations.


Méthode du pixel noir

Lorsque l'image contient une surface dont la réflectance est quasi nulle, la réflectance observée au sommet de l'atmosphère devient ρTOA= ρatm. On peut donc en déduire la réflectance atmosphérique, et en utilisant un modèle de transfert radiatif, l'épaisseur optique des d'aérosols. On peut enfin en déduire la transmission diffuse, et finalement calculer ρsurf. Une version encore plus simple et plus approximative consiste à soustraire directement la réflectance du pixel sombre (soit ρatm) à toute l'image. [Chavez, 1988]


Cependant, cette méthode revient à supposer qu'il existe bien une surface très sombre dans l'image (ce qui n'est pas toujours le cas), et que la réflectance de cette surface sombre est connue. La méthode suppose aussi que la quantité d'aérosols est constante dans l'image et elle néglige les effets du relief. Les résultats obtenus par cette méthode peuvent donc être assez imprécis. Dans notre méthode (MACCS), nous utilisons cependant la méthode du pixel noir déterminer la valeur maximale de l'épaisseur optique dans la zone.


Méthode Multi Spectrale, dite "DDV"

Si on connaît le type d'aérosols présent dans l'atmosphère, il est possible de déduire les  propriétés des aérosols dans une bande spectrale, à partir des propriétés optiques dans une autre bande spectrale.


Si on dispose de deux bandes spectrales, on dispose de deux mesures ρsurf et de trois inconnues( les deux réflectances de surface dans ces bandes, et la quantité d'aérosols). Une équation supplémentaire peut être obtenue si on connaît la relation entre les réflectances de surface des deux bandes.


La méthode  méthode "Dark Dense Vegetation" (DDV ) est basée sur des hypothèses de relations entre réflectances de surface sur la végétation dense exploitant le fait que le spectre de la végétation dense et verte est un peu toujours le même. La version la plus connue de cette méthode est celle utilisée par la NASA pour le projet MODIS [Remer 2005]. Elle relie les réflectances de surface dans le bleu et dans le rouge avec celles dans le moyen infra-rouge. On dispose ainsi de deux équations qui permettent d’estimer le type d’aérosols et l’épaisseur optique. Cette méthode fonctionne bien en zones tempérées et boréales, mais pas en zones arides, où il est difficile de trouver de la végétation dense. Les premières versions utilisaient les équations suivante

ρBleu = 0.5 ∗ ρSWIR

ρRouge = 0.25 ∗ ρSWIR

Les versions suivantes ont un peu compliqué ces équations, sans en modifier le principe. Nos travaux ont montré que l’utilisation de l'équation ci dessous  (la valeur exacte du coefficient est à ajuster en fonction des bandes spectrales de l'instrument):

ρBleu = 0.5 ∗ ρRouge

permet une détermination plus précise de l’épaisseur optique, pour des couverts végétaux moins denses (jusqu’à un NDVI de 0.2), car les sols nus de couleur marron respectent aussi cette relation. La méthode ne permet pas, par contre, de déterminer le modèle d’aérosols. Dans le cas de SPOT4 (Take5) l'absence d'une bande bleue ne nous permet pas d'utiliser cette dernière équation, d’où une légère perte en précision.

Ce diagramme montre que la corrélation entre réflectances de surface au dessus de la végétation est bien meilleure pour le couple de bandes spectrales (bleu, rouge) que pour les couples incluant le moyen infra rouge. (SWIR)


Méthode Multi Temporelle

On observe dans la plupart des cas que les réflectances de la surface terrestre évoluent lentement avec le temps, alors que le propriétés optiques des aérosols varient très rapidement, d'un jour à l'autre. On peut donc considérer que ce qui change d'une image à l'autre (en dehors de cas particuliers souvent liées à des interventions humaines) est lié aux aérosols, et donc en déduire les propriétés des aérosols pour ensuite corriger les effets atmosphériques. Cette méthode est un peu trop complexe pour être expliquée en détails ici, les lecteurs intéressés pourront se reporter à [Hagolle 2008].


Pour que les réflectances de surface soient quasi constantes d'une image à l'autre, il faut cependant que les images soient acquises sous un angle de vue constant. Les changements d'angles d'observation font en effet varier les réflectances (ce phénomène sera prochainement expliqué dans un autre article). Cette méthode ne s'applique donc qu'aux seuls satellites permettant des observations à angle constant.  Elle ne s'applique donc pas aux données SPOT normales mais par contre convient parfaitement aux données SPOT4 (Take5). Elle s'appliquera aussi à Landsat, Venµs et Sentinel-2.

En résumé :

Performance de l'estimation de l'épaisseur optique des aérosols sur des séries temporelles d'images Formosat-2,, en fonction de la méthode (multi-spectrale, multi-temporelle, combinée), par comparaison avec les mesures fournies par le réseau de mesures in-situ Aeronet. La méthode multi spectrale fonctionne mieux sur des sites couverts de végétation et moins bien sur des sites arides, la méthode multi-temporelle marche un peu moins bien sur les sites verts, mais beaucoup mieux sur les sites arides. La combinaison des deux méthodes garde le meilleur des deux méthodes élémentaires.


Notre méthode MACCS, utilisée pour l'expérience SPOT4 (Take5), et pour les données LANDSAT, VENµS et Sentinel-2, combine les trois méthodes présentées ci-dessus pour obtenir des estimations robustes des épaisseurs optiques d'aérosols. Ces méthodes fonctionnent dans un grand nombre de cas, mais peuvent parfois échouer quand les hypothèses sur lesquelles elles reposent s'avèrent fausses. Elles ont en général tendance à mieux fonctionner sur des zones couvertes de végétation plutôt que dans des zones arides. pour le moment, elles supposent le modèle d'aérosol connu, et dans les prochaines années, nous chercherons des manières fiables d'identifier le type d'aérosols.


References :
Chavez Jr, P. S. (1988). An improved dark-object subtraction technique for atmospheric scattering correction of multispectral data. Remote Sensing of Environment, 24(3), 459-479.

Remer, L. A., and Coauthors, 2005: The modis aerosol algorithm, products, and validation. J. Atmos. Sci., 62, 947–973.

Hagolle, O and co-authors, 2008. « Correction of aerosol effects on multi-temporal images acquired with constant viewing angles: Application to Formosat-2 images ». Remote sensing of environment 112 (4)

Land cover map production: how it works


Land cover and land use maps

Although different, the terms land use and land cover are often used as synonymous. From Wikipedia Land cover is the physical material at the surface of the earth. Land covers include grass, asphalt, trees, bare ground, water, etc. There are two primary methods for capturing information on land cover: field survey and analysis of remotely sensed imagery. and Land use is the human use of land. Land use involves the management and modification of natural environment or wilderness into built environment such as fields, pastures, and settlements. It also has been defined as "the arrangements, activities and inputs people undertake in a certain land cover type to produce, change or maintain it" (FAO, 1997a; FAO/UNEP, 1999).

A precise knowledge of land use and land cover is crucial for many scientific studies and for many operational applications. This accurate knowledge needs frequent information updates, but may also need to be able to go back in time in order to perform trend analysis and to suggest evolution scenarios.


Satellite remote sensing offers the possibility to have a global point of view over large regions with frequent updates, and therefore it is a very valuable tool for land cover map production.


However, for those maps to be available in a timely manner and with a good quality, robust, reliable and automatic methods are needed for the exploitation of the available data.




Classical production approaches

The automatic approaches to land cover map production using remote sensing imagery are often based on image classification methods.


This classification can be:

  • supervised: areas for which the land cover is known are used as learning examples;
  • unsupervised: the image pixels are grouped by similarity and the classes are identified afterwards.

Supervised classification often yields better results, but it needs reference data which are difficult or costly to obtain (field campaigns, photo-interpretation, etc.).




What time series bring

Until recently, fine scale land cover maps have been nearly exclusively produced using a small number of acquisition dates due to the fact that dense image time series were not available.


The focus was therefore on the use of spectral richness in order to distinguish the different land cover classes. However, this approach is not able to differentiate classes which may have a similar spectral signature at the acquisition time, but that would have a different spectral behaviour at another point in time (bare soils which will become different crops, for instance). In order to overcome this problem, several acquisition dates can be used, but this needs a specific date selection depending on the map nomenclature.


For instance, in the left image, which is acquired in May, it is very difficult to tell where the rapeseed fields are since they are very similar to the wheat ones. On the right image, acquired in April, blooming rapeseed fields are very easy to spot.


May image. Light green fields are winter crops, mainly wheat and rapeseed. But which are the rapeseed ones?

April image. Blooming rapeseed fields are easily distinguished in yellow while wheat is in dark green.


If one wants to build generic (independent from the geographic sites and therefore also from the target nomenclatures) and operational systems, regular and frequent image acquisitions have to be ensured. This will soon be made possible by the Sentinel-2 mission, and it is right now already the case with demonstration data provided by Formosat-2 and SPOT4 (Take 5). Furthermore, it can be shown that having a high temporal resolution is more interesting than having a high spectral diversity. For instance, the following figure shows the classification performance results (in terms of  \kappa index, the higher the better) as a function of the number of images used. Formosat-2 images (4 spectral bands) and simulated Sentinel-2 (13 bands) and Venµs (12 bands) data have been used. It can be seen that, once enough acquisitions are available, the spectral richness is caught up by a fine description of the temporal evolution.




What we can expect from Sentinel-2

Sentinel-2 has unique capabilities in the Earth observation systems landscape:

  • 290 km. swath;
  • 10 to 60 m. spatial resolution depending on the bands;
  • 5-day revisit cycle with 2 satellites;
  • 13 spectral bands.

Systems with similar spatial resolution (SPOT or Landsat) have longer revisit periods and fewer and larger spectral bands. Systems with similar temporal revisit have either a lower spatial resolution (MODIS) or narrower swaths (Formosat-2).


The kind of data provided by Sentinel-2 allows to foresee the development of land cover map production systems which should be able to update the information monthly at a global scale. The temporal dimension will allow to distinguish classes whose spectral signatures are very similar during long periods of the year. The increased spatial resolution will make possible to work with smaller minimum mapping units.


However, the operational implementation of such systems will require a particular attention to the validation procedures of the produced maps and also to the huge data volumes. Indeed, the land cover maps will have to be validated at the regional or even at the global scale. Also, since the reference data (i.e. ground truth) will be only available in limited amounts, supervised methods will have to be avoided as much as possible. One possibility consists of integrating prior knowledge (about the physics of the observed processes, or via expert rules) into the processing chains.


Last but not least, even if the acquisition capabilities of these new systems will be increased, there will always be temporal and spatial data holes (clouds, for instance). Processing chains will have to be robust to this kind of artefacts.



Ongoing work at CESBIO


Danielle Ducrot, Antoine Masse and a few CESBIO interns have recently produced a a large land cover map over the Pyrenees using 30 m. resolution multi-temporal Landsat images. This map, which is real craftsmanship, contains 70 different classes. It is made of 3 different parts using nearly cloud-free images acquired in 2010.


70-class land cover map obtained from multi-temporal Landsat data.

In his PhD work, Antoine works on methods allowing to select the best dates in order to perform a classification. At the same time, Isabel Rodes is looking into techniques enabling the use of all available acquisitions over very large areas by dealing with both missing data (clouds, shadows) and the fact that all pixels are not acquired at the same dates.


These 2 approaches are complementary: one allows to target very detailed nomenclatures, but needs some human intervention, and the other is fully automatic, but less ambitious in terms of nomenclature.


A third approach is being investigated at CESBIO in the PhD work of Julien Osman: the use of prior knowledge both quantitative (from historical records) and qualitative (expert knowledge) in order to guide the automatic classification systems.


We will give you more detailed information about all those approaches in coming posts on this blog.

La production de cartes d'occupation du sol, comment ça marche?


Les cartes d'occupation du sol

D'après Wikipédia, l'occupation du sol désigne pour la FAO (1998) "la couverture (bio-)physique de la surface des terres émergées" et donc le type d'usage (ou de non-usage) fait des terres par l'Homme. La mosaïque paysagère est cartographiée en identifiant les types homogènes de milieux (ex : zones artificialisées, zones agricoles, forêts ou landes, zones humides, etc.).

La connaissance précise de cette occupation du sol est un enjeu crucial pour beaucoup de travaux de recherche et pour de nombreuses applications opérationnelles. Une connaissance précise demande une mise à jour fréquente de ces informations, mais peut aussi nécessiter de remonter dans le temps pour faire une analyse des tendances et proposer des scénarios d'évolution.


La possibilité offerte par la télédétection spatiale d'accéder à une vue d'ensemble de grandes régions de façon récurrente constitue donc un atout majeur pour la production de cartes d'occupation du sol.


Cependant, pour que ces cartes soient disponibles dans des délais raisonnables et avec une qualité suffisante, il est nécessaire de disposer de méthodes automatiques robustes et fiables, capables d'exploiter de façon efficace les données disponibles.



Les approches classiques de production

Les approches automatiques de production de cartes d'occupation du sol à partir d'images de télédétection sont souvent basées sur des méthodes de classification d'images.


Cette classification peut être :

  • supervisée : on utilise des zones pour lesquelles on connaît l'occupation du sol comme des exemples pour un apprentissage;
  • non supervisée : on regroupe les pixels de l'image par similarité et on reconnait les classes ensuite.

La classification supervisée fournit souvent de meilleurs résultats, mais elle nécessite des données de référence pour l'apprentissage qui sont coûteuses à obtenir (campagnes sur le terrain, photo-interprétation, etc.). C'est cependant cette approche qui est utilisée dans les travaux actuels du CESBIO, comme par exemple l'édition d'une carte d'occupation des sols annuelle sur la France (avec LANDSAT 8, en attendant Sentinel-2).



L'apport du multi-temporel

Jusqu'à récemment, les cartes d'occupation du sol à échelle cartographique fine ont été presque exclusivement produites à partir d'un petit nombre de dates et ceci principalement à cause du manque de séries multi-temporelles denses fournies par des capteurs à haute résolution spatiale. L'accent était donc mis sur la richesse spectrale des images pour distinguer les différentes classes d'occupation du sol.


Cependant, cette approche "monodate" ne permet pas de distinguer des classes qui auraient la même signature spectrale à une date d'acquisition donnée, mais une signature différente à une autre date (des sols nus qui deviendront des cultures différentes plus tard). Pour pallier à cette difficulté, plusieurs dates peuvent être utilisées, mais cela demande une sélection spécifique de dates en fonction de la nomenclature visée.


Par exemple, dans l'image de gauche, acquise au mois de mai, il est très difficile de dire où sont les parcelles de colza et quelles sont les parcelles de blé. Sur l'image de droite, acquise au mois d'avril, les parcelles de colza en fleur sont très faciles à distinguer des parcelles de blé bien vert.



Image du mois d'avril. Les parcelles de colza en pleine floraison sont parfaitement visibles, elles apparaissent en jaune Image du mois de mai. Les parcelles vert clair sont des cultures d'hiver, blé ou colza principalement. Où sont les champs de Colza ?


Si l'on souhaite mettre en place des systèmes opérationnels et génériques (indépendants des sites cartographiés et donc des nomenclatures visées), il faut assurer une acquisition d'images fréquente et régulière. Ceci sera rendu possible par la mission Sentinel-2, et déjà, sur les données de démonstration issues de Formosat-2 et SPOT4 (Take 5). En plus, on peut montrer que le fait de disposer d'une haute résolution temporelle peut être plus intéressant que de disposer d'une grande diversité spectrale. Par exemple, la figure suivante montre des résultats de performances de classification (indice  \kappa ; plus il est élevé, mieux c'est) en fonction du nombre de dates utilisées pour la classification. On a utilisé des images Formosat-2 (4 bandes spectrales) et des simulations Vénµs (12 bandes) et Sentinelle-2 (13 bandes). On constate qu'à partir d'un nombre suffisant de dates utilisées, la richesse spectrale de Vénµs et Sentinelle-2 est rattrapée par une description fine du comportement temporel obtenu avec le simple capteur Formosat-2.




Ce qui peut être attendu de Sentinelle-2

Sentinelle-2 a des caractéristiques uniques dans le paysage des systèmes d'observation de la Terre :

  • fauchée de 290 km.;
  • résolution spatiale de 10 à 60 m. en fonction des bandes spectrales;
  • revisite de 5 jours (avec 2 satellites);
  • 13 bandes spectrales.

Les systèmes de résolution spatiale comparable (SPOT ou Landsat) ont des revisites plus faibles et moins de bandes spectrales. Les systèmes de revisite similaire, ont une résolution spatiale plus faible (MODIS) ou des fauchées réduites (Formosat-2).


Avec le type de données fournies par Sentinelle-2 il est possible d'envisager le développement de systèmes de production de cartes d'occupation du sol capables d'actualiser les informations une fois par mois à l'échelle globale. La dimension temporelle, permettra de distinguer des classes dont les signatures spectrales sont très proches pendant une grande partie de l'année. La résolution spatiale améliorée permettra de travailler avec des unités minimales de cartographie plus fines.


Cependant, la mise en oeuvre opérationnelle de tels systèmes nécessitera une attention particulière aux besoins de validation des produits générés et aux énormes volumes de données à traiter.


Les cartes d'occupation produites par un tel système devront suivre une validation à échelle régionale, voire globale. De plus, comme les données de référence seront limitées, il faudra se passer au maximum de techniques d'apprentissage et essayer d'intégrer des connaissances a priori (physiques ou expertes) dans les chaînes de traitement.


Enfin, même si la capacité d'acquisition des nouveaux systèmes spatiaux sera améliorée, il y aura toujours des trous dans les données (nuages, par exemple). Les chaînes de traitement devront donc savoir combler ces trous, ou en tout cas y être robustes.



Les travaux du CESBIO

Danielle Ducrot, Antoine Masse et de nombreux stagiaires du CESBIO ont fabriqué récemment une grande carte d'occupation des sols sur la chaîne des Pyrénées à partir de données multi-temporelles de LANDSAT à 30 mètres de résolution. Cette carte, qui représente un vrai travail d'orfèvre, contient 70 classes. Elle a été réalisée en trois parties à partir des images peu nuageuses collectées par les satellites Landsat au cours de l'année 2010.



Carte d'occupation des sols à 70 classes obtenue à partir de séries temporelles d'images LANDSAT.

Dans sa thèse, Antoine travaille sur les méthodes qui permettent de sélectionner les meilleures dates pour réaliser une classification. De son côté, Isabel Rodes s'intéresse aux méthodes qui permettent d'utiliser toutes les images disponibles sur des zones très étendues tout en gérant les données manquantes (nuages, ombres) et le fait que tous les pixels ne sont pas vus aux mêmes dates. Ces 2 approches sont complémentaires : l'une permet de travailler avec des nomenclatures très détaillées, mais demande l'intervention d'opérateurs humains, l'autre est complètement automatique, mais moins ambitieuse en termes de détails de la classification.


Une troisième approche est explorée au CESBIO dans le cadre de la thèse de Julien Osman : l'utilisation de connaissances a priori de type quantitatif (à partir de données historiques) et qualitatif (connaissances d'experts thématiques) pour guider les systèmes de classification automatique.


Nous vous décrirons plus en détails ces différentes approches dans des billets à venir.



SPOT4(Take5) : Cloud statistics after one month


We have now received all the L1A images of the SPOT4(Take5) experiment taken between January the 31st and March the 10th, for which at least some part of the surface is visible. We ortho-rectify these images to obtain level 1C products, but sometimes, the cloud cover is still too high to process the image. We can use all these productions to derive some statistics about cloud cover.


Proportion of images processed at Level 1A and Level 1C for the sites selected by each agency.
Institution Images acquired L1A processed L1C processed % L1A % L1C
CNES 324 184 157 56 % 49 %
JRC 54 29 27 53 % 50 %
ESA 84 41 34 49 % 40 %
NASA 48 26 26 54% 54%
CCRS 6 1 1 17 % 17 %


Between 40% and 50% of the images taken are sufficiently clear so that the ortho-rectification is feasible. When the production of all cloud masks (level2A) is finished, we will be able to compute the number of cloud free observations for each pixel.

After having looked at all the images in Europe or North Africa, we can confirm that all the pixels of these sites have been observed at least once without clouds, except for 3 sites : CAlsace, EBelgium and CTunisia (!). For the site in Alsace, we had to wait until the 4th of March, and until the 10th of March for the site in Tunisia. And up to now, only a little part of the site in Belgium has been observed, on the 8th of March.


Number of images acquired in February,
as a function of their cloud cover
Site Clouds < 10% 10% < Clouds < 50% 50% < Clouds < 80% 80% < Clouds
Alpes 2 0 2 2
Alsace 0 0 0 6
Ardèche 1 1 0 4
Loire 1 0 3 2
Bretagne 1 0 1 4
Languedoc 0 2 2 2
Provence 2 3 1 0
SudmipyO 1 1 1 3
SudmipyE 1 1 1 3
VersaillesE 2 0 1 3

In France, despite a very cloudy month of February, the 5 days repetitivity enabled to observe nearly each site at least once. But if SPOT4 had only imaged one out of two overpasses, only the sites in Versailles, Provence and the Alps would have been observed in any case.


This result confirms that it is absolutely necessary to launch both Sentinel-2 satellites with a short time interval, so enable the numerous operational applications that need to rely on a monthly clear observation. And it would be a pity if the recent GMES/Copernicus budget cuts resulted in delaying the Sentinel-2B satellite, reducing the repetitivity to only 10 days for several long years.

SPOT4 (Take5) : statistiques de couverture nuageuse sur un mois


Nous avons reçu d'Astrium Geo toutes les images de niveau 1A de l'expérience SPOT4(Take5), acquises entre le 31/01/2013 et le 10/03/2013, qui ne sont pas entièrement couvertes de nuages. Nous ortho-rectifions ces images pour obtenir des produits de Niveau 1C. Il arrive cependant que la couverture nuageuse soit trop importante pour pouvoir fabriquer un produit de Niveau 1C

Toutes ces productions nous permettent de calculer des statistiques sur la proportion d'images nuageuses.


Proportion d'images produites au niveau 1A et au niveau 1C
Organisme Images acquises N1A produits N1C produits N1A (%) N1C (%)
CNES 324 184 157 56 % 49 %
JRC 54 29 27 53 % 50 %
ESA 84 41 34 49 % 40 %
NASA 48 26 26 54% 54%
CCRS 6 1 1 17 % 17 %


En moyenne, la moitié des images acquises sont inutilisables car entièrement nuageuses ou presque, et l'autre moitié des images (60*60 km2) contient assez de pixels clairs (au moins 15%) pour que l'ortho-rectification soit possible. Lorsque nous aurons produit les masques de nuages au Niveau 2A, nous pourrons en déduire, pour chaque pixel, le nombre d'observations claires par mois.
Nous n'en sommes pas là, mais nous avons constaté visuellement sur les acquisitions en Europe ou en Afrique du Nord,  que la totalité des pixels de ces sites ont été vus sans nuages au moins une fois en février, à l'exception de 3 sites : CAlsace, EBelgium, CTunisie (!). Pour le site Alsacien, il a fallu attendre le 4 mars, et pour le site Tunisien, le 10 mars. Enfin, seule une petite partie du site Belge a été vue, le 8 mars.


Nombre d'images acquises en février en fonction de leur taux de couverture nuageuse
Site nuages<10% 10%<nuages<50% 50%<nuages<80% Nuages>80%
Alpes 2 0 2 2
Alsace 0 0 0 6
Ardèche 1 1 0 4
Loire 1 0 3 2
Bretagne 1 0 1 4
Languedoc 0 2 2 2
Provence 2 3 1 0
SudmipyO 1 1 1 3
SudmipyE 1 1 1 3
VersaillesE 2 0 1 3


Le mois de février 2013 a été très nuageux en France, mais malgré cela, la répétitivité de 5 jours a permis d'observer la quasi totalité des sites au moins une fois en un mois, parfois davantage, mais pas toujours. Si SPOT4 n'était passé qu'une fois sur deux, seuls les sites Provence, Alpes et Versailles auraient été observés entièrement à coup sûr.


Ce résultat montre qu'il est absolument nécessaire de lancer les deux satellites Sentinel-2 à des dates très proches, afin de pouvoir assurer une utilisation opérationnelle et fiable des données. Il ne faudrait pas que les récentes réductions du budget de l'Union Européenne consacré à GMES/Copernicus conduisent à retarder le lancement du second satellite, réduisant la répétitivité de Sentinel-2 à seulement 10 jours pendant de longues années.

Le Pôle Thématique Surfaces Continentales THEIA

(English Version)

Le "Pôle Thématique Surfaces Continentales" THEIA est une structure nationale inter-organismes destinée à valoriser les données satellitaires, en premier lieu au service de la recherche environnementale sur les terres émergées, et en second lieu des politiques publiques de suivi et de gestion des ressources environnementales. Son objectif est de faciliter la mesure de l’impact des pressions anthropiques et du climat sur les écosystèmes et les territoires, observer, quantifier et modéliser les cycles de l’eau et du carbone, de suivre les évolutions des sociétés et de leurs activités, notamment de leurs pratiques agricoles, et de comprendre les dynamiques de la biodiversité.

Au sein de ce Pôle Thématique, le CNES met en place un centre de production MUlti Satellite, multi-CApteurs, pour des données multi-TEmporelles (MUSCATE). Ce centre a pour but de mettre à disposition des utilisateurs des produits prêts à l'emploi issus de séries temporelles d'images acquises sur de grands territoires. La mission Sentinel-2 sera bien sûr le fer de lance de ce centre de production, mais avant le lancement de la constellation, MUSCATE a d'ores et déjà produit les données issues de l'expérience SPOT4 (Take 5). En même temps, le centre de traitement prépare aussi l'exploitation de toutes les données LANDSAT acquises au dessus de la France continentale, de 2009 à 2011.

Le centre de production MUSCATE existe déjà sous la forme d'un prototype développé au CNES avec un fort soutien de la société CAP GEMINI. Ce prototype est déjà capable de traiter les données des satellites LANDSAT, SPOT, Formosat-2, Venµs et Sentinel-2, à partir de chaînes développées au CNES pour le traitement géométrique [1], au CESBIO pour la détection des nuages [2] et pour la correction des effets atmosphériques [3]. En parallèle, le développement d'un centre de production opérationnel est en phase de spécification.

Les produits fournis par le centre MUSCATE sont les suivants :

Simulations des produits SPOT4(Take5) à partir d'images Formosat-2

  • Niveau 1C (Données ortho-rectifiées en réflectance au sommet de l’atmosphère)
  • Niveau 2A (Données ortho-rectifiées en réflectance de surface après correction atmosphérique,  avec un masque des nuages et de leurs ombres, ainsi qu'un masque des surfaces d’eau et de neige).
  • Niveau 3A (Synthèses bi-mensuelles ou mensuelles de réflectances de surface, constituées de la moyenne pondérée des réflectances de surface des pixels non nuageux obtenus au cours de la période). Pour le moment, la chaîne de Niveau 3A n'existe que pour le satellite Venµs.

Les données produites par le centre MUSCATE seront autant que possible distribuées gratuitement aux laboratoires de recherche d'une part, et aux institutions publiques françaises d'autre part. Le PTSC disposera bien sûr, dans les mois qui viennent d'un serveur de distribution des données, dont la première version est en cours de finalisation.

[1]: Baillarin, S., P. Gigord, et O. Hagolle. 2008. « Automatic Registration of Optical Images, a Stake for Future Missions: Application to Ortho-Rectification, Time Series and Mosaic Products ». In Geoscience and Remote Sensing Symposium, 2008, 2:II‑1112‑II‑1115. doi:10.1109/IGARSS.2008.4779194.

[2]: Hagolle, Olivier, Mireille Huc, David Villa Pascual, et Gérard Dedieu. 2010. « A multi-temporal method for cloud detection, applied to FORMOSAT-2, VENµS, LANDSAT and SENTINEL-2 images ». Remote Sensing of Environment 114 (8) (août 16): 1747‑1755. doi:10.1016/j.rse.2010.03.002.

[3]: Hagolle, O, G Dedieu, B Mougenot, V Debaecker, B Duchemin, et A Meygret. 2008. « Correction of aerosol effects on multi-temporal images acquired with constant viewing angles: Application to Formosat-2 images ». REMOTE SENSING OF ENVIRONMENT 112 (4) (avril 15): 1689‑1701. doi:10.1016/j.rse.2007.08.016.


Changing SPOT4 orbit : easy ?

(French Version)

When we submitted the SPOT4(Take 5) experiment to CNES, we knew that CNES would not accept it easily, since a similar proposal made by Gérard Dedieu before SPOT2 de-orbitation had been rejected. But we did not imagine the amount of work we were requesting from our colleagues at CNES. To show the project feasability, our CNES colleagues had to :

  • find a project manager who coordinated the study: Sylvia Sylvander
  • choose the new orbit (2 to 6 days repeat cycle) minimizing fuel consumption : We must keep enough fuel to be able to reduce the altitude of the satellite, so that it burns in the atmosphere after a period of less than 25 years. The finally chosen orbit provides a 5 days repeat cycle, resulting in a very low fuel consumption. This orbit also provides the exact repeatability of the two satellites Sentinel-2.
  • choose the strategy change orbit. The date of optimal maneuver is January 29, but it corresponds to the end of a full moon, and it is prohibited to maneuver SPOT4 during the full moon. It is not due to superstition, but only because of a potential blinding of star sensors used to determine the orientation of the satellite. But a detailed analysis of recent full moons in the same period last year showed that the maneuver could still be executed on January 29 without any risk.
  • check that the ground segment (designed 15 years ago) can handle the new orbit. The ground segment programs the satellite and the acquisitions, manages the old tape recorders, coordinates the data download to the receiving station, while avoiding interference with other satellites. Because the satellite is no longer on its nominal orbit, all the conditions of interference are to be recalculated.
  • check that the ground segment is able to ingest and process products. The products are usually referenced by their orbit number, which will be different...
  • test the system interfaces: a one-week trial on a simulator of the spacecraft and its system showed that everything should work fine
  • the usual programming system at SpotImage will not work on this orbit, we will have to use CNES programming system, more flexible but less automated. It takes one hour and a half to program the 42 sites observed over 5 days, but someone will have to do it every 5 days.
  • find internal and external staff (and budgets) to extend the life of SPOT4 for 5 months.
  • negotiate with SpotImage (Astrium Geo), the cost of producing Level 1A products and maintaining the cloud notation
  • prepare the MUSCATE production center that will provide level 1C and 2A users. This production facility will be implemented within the Land Data Centre.

Many thanks to Didier Roumiguières, Sylvia Sylvander, Laurence Houpert, Jean-Marc Walter, Jordane Sarda (CS-SI), Aurélie Moussy-Soffys, Frédéric Daniaud (CS-SI), Michel Moulin, Benoît Boissin,  Selma Cherchali, Françoise Schiavon, Marc Leroy, Jerôme Bijac (Astrium geo) and to all CNES and Astrium-Geo people who contributed to the acceptation SPOT4(Take5) experiment.

Sentinel-2, Spot-4, Take-5

(English version)

Lors de la fin de vie de chaque satellite, le CNES fait un appel à idées pour des expériences de courte durée se déroulant avant la désorbitation du satellite. Le CESBIO a saisi l'occasion de la fin de vie du satellite SPOT4 pour proposer l'expérience Take 5, qui consiste à faire de SPOT4, pendant 4 mois, un simulateur des séries temporelles que fournira la mission Sentinel-2 de l'ESA.


Le morceau Take 5, écrit par Paul Desmond dans l'album Time Out de Dave Brubeck, a la particularité d'être écrit sur un rythme à 5 temps

Le premier satellite de la mission Sentinel-2 devrait être lancé d'ici deux ans, le deuxième satellite devrait le suivre 18 mois plus tard. A eux deux, ces satellites nous fourniront tous les 5 jours des images à haute résolution de toutes les terres émergées... ou des nuages qui les recouvrent. Malgré ces nuages, les utilisateurs seront assurés d'avoir  accès à des données sans nuages au moins une fois par mois. L'arrivée de ces données devrait donc provoquer une révolution dans l'utilisation des données de télédétection.


Pour ne pas perdre de temps à l'arrivée des Sentinel-2, il est nécessaire de nous préparer dès aujourd'hui à l'utilisation de ces données. Or, il n'existe pas, à l'heure actuelle, de données permettant de simuler parfaitement les caractéristiques de Sentinel-2 :

  • L'ESA s'est attachée à fournir des jeux de données simulant les bandes spectrales de l'instrument, mais ces données, issues de données aéroportées, ne sont pas multi-temporelles.
  • Le CNES et l’Agence Spatiale Israélienne développent le projet Venµs, dont l'objectif est de fournir des séries temporelles à haute répétitivité, mais son lancement est prévu vers la fin de l’année 2014. Les calendriers de lancement de Venµs et Sentinel-2 sont donc très proches.
  • Le CESBIO a fourni des séries temporelles d'images de FORMOSAT-2 et LANDSAT, mais dans le premier cas, les données ne couvrent que des zones de 20*20 km, alors que dans le second cas, la répétitivité des données est très inférieure à celle qu'on attend de Sentinel-2.

Après 6 mois d'études de faisabilité et de recherche de financement, le CNES vient de décider de lancer l'expérience Take 5. Le 29 janvier, l'orbite de SPOT 4 sera abaissée de 3 kilomètres pour lui donner un cycle de 5 jours, ce qui veut dire que le satellite survolera les mêmes endroits sur terre tous les 5 jours. Spot4 restera sur cette orbite jusqu'à fin mai 2013. Pendant cette période, 42 sites vont être observés tous les 5 jours, comme dans le cas de Sentinel-2. Les données seront traitées et distribuées par le PTSC, et distribuées aux utilisateurs vers la fin du mois de juin 2013 ; elles seront fournies aux deux niveaux suivants :

  • Niveau 1C (Données ortho-rectifiées en réflectance au sommet de l'atmosphère)
  • Niveau 2A (Données ortho-rectifiées en réflectance de surface après correction atmosphérique, accompagnées d'un masque des nuages et de leurs ombres, ainsi que d'un masque d'eau et de neige).
Simulations des produits SPOT4(Take5) à partir d'images Formosat-2



Sentinel-2, Spot-4, Take-5 (English)

Paul Desmond's Take 5 jazz standard was written in an unusual 5 beat rythm.

(French version)

At the end of life of each satellite, CNES issues a call for ideas for short-term experiments taking place before de-orbiting the satellite. CESBIO took the opportunity to set up the Take 5 experiment at the end of SPOT4' life : this experiment will use SPOT4 as a simulator to give us a hint of the time series that ESA's Sentinel-2 mission will provide.


The first Sentinel-2 satellite should be launched within the next two years, and the second satellite should follow 18 months later. Together, these satellites will provide us every fifth day with high-resolution images of all land areas... or of the clouds that cover them. Despite these clouds, users will be guaranteed access to cloud-free data at least once per month. The arrival of these data should therefore cause a revolution in the use of remote sensing data.


In order to avoid wasting time when Sentinel-2 is launched, it is necessary to prepare today for the use of these data. However, at present, there are no suitable data to perfectly simulate the features of Sentinel-2:

  • ESA is providing datasets simulating the spectral bands of the instrument, but these airborne data are not multi-temporal, and only cover small areas.
  • -CNES and the Israel Space Agency are developing the VENµS project, whose goal is to provide high repeatability time series, but its launch is only scheduled for late 2014.
  • CESBIO provided time series of FORMOSAT-2 images and LANDSAT, but in the first case, the data only cover areas of 20 * 20 km, whereas in the second case, the repeatability of the data is much lower than expected from Sentinel-2.


After 6 months of feasibility studies, CNES has just decided to launch Take 5 experiment. On January 29, the orbit will be lowered from SPOT4 by 3 kilometers to put it on a 5 day repeat cycle orbit, which means that the satellite will fly the same places on earth every 5 days. Spot4 will follow this orbit until the end of May 2013. During this period, 42 sites will be observed every 5 days, as in the case of Sentinel-2. The data will be processed and distributed by the "Pôle Thématique Surfaces Continentales" (PTSC) and distributed to users by the end of June 2013, they will be provided with the following two levels:

  • Level 1C (data orthorectified reflectance at the top of the atmosphere)
  • Level 2A (Data ortho-rectified surface reflectance after atmospheric correction, along with a mask of clouds and their shadows, as well as a mask of water and snow).