Glossaire

normale (climatologique)

  Curieux  

En un site d'observation ou de mesure précis, correspondant à un point géographique supposé invariable en longitude, latitude, altitude et environnement durant toute l'époque continue d'observation ou de mesure que l'on considère, il est a priori possible de "suivre" une très grande variété de grandeurs météorologiques, ou à tout le moins utiles à la météorologie et à la climatologie, qui produisent chacune des valeurs à des intervalles de temps successifs, régulièrement espacés, au cours de l'époque ainsi étudiée. Ces valeurs peuvent donc identifier des données quantitatives (par exemple la vitesse moyenne du vent toutes les six heures, la température maximale quotidienne chaque jour, l'ensoleillement mensuel...), mais aussi qualitatives (par exemple 1 ou 0 suivant qu'il y a eu ou non orage dans la journée), et ces données sont parfois très éloignées de la panoplie habituelle des grandeurs météorologiques (c'est le cas par exemple de l'épaisseur et de l'aspect des anneaux de croissance annuelle d'une espèce donnée d'arbre, utilisables par définition en  dendroclimatologie ). Étudier le climat du site considéré implique de calculer en priorité les moyennes de ces diverses grandeurs, qui serviront de valeurs de référence relativement à chacune d'elles pour décrire ce climat ; mais sur une époque de quelle durée convient-il de calculer ces moyennes, si l'on désire qu'elles regroupent beaucoup de données et soient donc bien représentatives ? Pareille durée doit clairement se chiffrer en années, et par un nombre entier important, d'autant plus que certaines grandeurs prennent une valeur unique en un mois ou même un an ; mais d'autre part, elle ne peut excéder un trop grand nombre d'années, car le climat évolue lentement, et un calcul des moyennes sur des époques trop amples intégrerait ces changements climatiques de façon erronée dans les résultats (en outre, on souhaite rendre comparables sans avoir à attendre trop d'années les sites déjà existants et ceux créés par la suite). Les climatologues estiment qu'un bon compromis entre ces deux exigences antagonistes consiste à calculer les moyennes sur des époques continues successives, ou "périodes", de 30 années : chaque période commence au 1 er janvier d'une année A finissant par le chiffre 1 et se termine au 31 décembre de l'année A + 29, qui finit par le chiffre 0 ; en un site donné, la valeur moyenne de toute grandeur sur une telle période de 30 ans est alors appelée la normale climatologique de cette grandeur, en ce site et pour ladite période. L'OMM recommande plus précisément de choisir les périodes telles que 1901 à 1930, 1931 à 1960, 1961 à 1990 (la prochaine sera 1991 à 2020), qui définissent la succession des  normales climatologiques standards.

Il arrive souvent que l'on parle de "normale" au sens de "normale climatologique" d'une donnée climatologique ; pareille simplification amplifie le risque de confusion entre ce terme technique — la moyenne d'une grandeur en un site, calculée sur une période de 30 ans — et l'acception usuelle du même mot, qui tend à désigner les valeurs "normales" de la température ou de la hauteur de précipitation, par exemple, comme les valeurs auxquelles on est à peu près en droit de s'attendre lors de l'apparition ou de la prévision d'un type de temps déterminé. Il convient de rester sensible, non seulement à cette différence essentielle entre les significations climatologique et courante de "normale", mais aussi à la distinction entre "normale climatologique" et "distribution normale" (ou distribution gaussienne, du nom de l'astronome, mathématicien et physicien allemand Carl Friedrich Gauss [1777-1855]) : si pour N fixé l'on trace l'histogramme des moyennes de N valeurs extraites au hasard d'une population de valeur moyenne µ (par exemple, l'ensemble des valeurs possibles X d'une grandeur météorologique), alors, plus N est grand et plus cet histogramme se rapproche d'une courbe "en cloche" symétrique par rapport à l'axe X = µ , qui caractérise cette distribution.


  Initié  

Moyennes et climatologie

Lorsqu'on observe ou mesure une grandeur X intéressant la météorologie de telle façon qu'on en a obtenu un échantillon composé d'un nombre N de valeurs mises en ordre et donc notées X i , où l'indice i court de 1 à N , la "moyenne" (arithmétique) de ces valeurs est le nombre m = ( X 1 + X 2 + ... + X i - 1 + X i + X i + 1 + ... + X N - 1 + X N ) / N . Mais ce terme de "moyenne" peut s'appliquer à des situations très différentes : l'une de celles-ci recouvre le cas où les valeurs X i ont été relevées à un même instant en N sites distincts ; la moyenne de ces valeurs est alors une moyenne spatiale à l'instant considéré. Dans ce cas, comme dans d'autres aussi, il se peut que l'on souhaite différencier l'importance de la contribution des diverses valeurs au calcul de la moyenne et qu'à cette fin l'on attribue à chacun des X i un "poids" p i strictement compris entre 0 et 1, avec p 1 + ... + p i + ... + p N = 1 : par exemple, si chaque X i se réfère à un département de la France métropolitaine, on peut calculer la moyenne arithmétique sur les 96 départements, mais aussi conférer à chacun d'eux un "poids" égal au rapport de sa superficie à celle du territoire métropolitain ; la moyenne obtenue est alors une  moyenne pondérée , qui a pour expression p 1 X 1 + p 2 X 2 + ... + p i - 1 X i - 1 + p i X i + p i + 1 X i + 1 + ... + p N - 1 X N - 1 + p N X N . (La moyenne arithmétique est ainsi une moyenne pondérée où tous les p i égalent 1 / N .)

Dans le cas où les valeurs X i ont été relevées sur un même site à N instants successifs t 1 , ..., t i , ..., t N espacés d'un même intervalle de temps, on obtient une "série temporelle" de la grandeur X , dont la moyenne est une moyenne temporelle sur le site considéré. Enfin, on peut considérer le cas de P sites repérés chacun par un des indices 1, ..., j , ..., P et fournissant aux mêmes instants régulièrement espacés t 1 , ..., t k , ..., t Q les valeurs X j, k de la grandeur X ( X j, k correspond à la valeur de X sur le site de numéro j à l'instant t k ) ; la moyenne de ces P Q valeurs est alors une moyenne spatio-temporelle : on vérifie qu'elle est la moyenne spatiale des P moyennes temporelles (relatives respectivement aux sites de numéros 1, ..., j , ..., P ) et tout aussi bien la moyenne temporelle des Q moyennes spatiales (relatives respectivement aux instants t 1 , ..., t k , ..., t Q ). Quand le terme "moyenne" s'utilise pour décrire le climat sur un assez vaste territoire, c'est à une moyenne spatiale ou à une moyenne spatio-temporelle que l'on fait allusion suivant qu'il y a ou non mention précise de date. Par contre, les normales climatologiques, étant affectées chacune à un site déterminé (et, il est vrai, à un territoire plus ou moins restreint entourant ce site), font partie des moyennes temporelles. Leur calcul met en évidence une difficulté constante de la climatologie : comment, sur d'aussi longues durées, prendre en compte en un lieu d'observation et de mesure les altérations systématiques ou accidentelles de la validité et de la précision des données, les biais dus aux changements d'instrument ou à l'évolution de l'environnement, les lacunes ponctuelles ou prolongées dans les résultats ? Seules, parfois, des méthodes sophistiquées permettent de reconstituer, à partir du matériau fourni, des séries homogènes pouvant être par la suite utilisées avec confiance.

La moyenne m est loin de suffire à décrire l'"aspect" d'un échantillon, dont les valeurs, par exemple, peuvent s'écarter plus ou moins fortement de m , s'aplatir d'un côté, se regrouper en fait autour de deux valeurs distinctes... On doit au moins évaluer aussi l'ordre de grandeur de la dispersion des valeurs X i autour de leur moyenne en calculant leur écart-type (ou déviation standard ), qui a même dimension que X et s'obtient comme la racine carrée s (positive) de la variance s 2 de l'échantillon, égale à [( X 1 - m ) 2 + ... + ( X i - m ) 2 + ... + ( X N - m ) 2 ] / ( N - 1).


La représentation des distributions de grandeurs climatologiques

Un moyen élémentaire de représenter graphiquement les propriétés d'une série — que celle-ci soit temporelle ou spatiale — consiste à utiliser des histogrammes. De façon générale, quand un nombre y ( n ) dépend d'un entier n positif, négatif ou nul, on peut prendre un repère plan orthogonal ( x' O x , y' O y ), choisir une longueur (positive) arbitraire δx et associer à tout n le rectangle dont la base est le segment de x' O x ayant pour extrémités les points d'abscisses n δx et ( n + 1) δx et dont les extrémités du sommet, pourvues de ces mêmes abscisses, ont pour ordonnée commune y ( n ) : ce rectangle, dont les côtés sont parallèles à x' O x ou à y' O y , se place au-dessus ou au-dessous de l'axe des abscisses suivant que y ( n ) est positif ou négatif, et son aire est proportionnelle à la valeur absolue de y ( n ) ; il se réduit à un segment de l'axe x' O x si, pour la valeur de n considérée, y ( n ) est nul ou bien non défini. Quand le nombre y ( n ) aide à la description d'une grandeur statistique, et en particulier climatologique, le diagramme ainsi obtenu à partir de rectangles accolés est un histogramme : on représente très couramment en climatologie, par exemple, le comportement "moyen" d'une grandeur météorologique au cours de l'année sur un site donné en dessinant l'histogramme des valeurs prises en ce site par les normales climatologiques des moyennes mensuelles de cette grandeur, ordonnées grâce aux indices 1, 2, ..., n , ..., 12 correspondant aux mois de janvier, février, etc., jusqu'à décembre. Un autre exemple se réfère à un échantillon de N valeurs  X i telles que parmi ces valeurs il en existe N n qui sont à la fois supérieures ou égales à n δx et inférieures (strictement) à ( n + 1) δx : le nombre f n = N n / N , compris entre 0 et 1, est appelé la "fréquence" de l'échantillon relative à la "classe" de numéro n , et la somme des fréquences sur toutes les classes vaut 1 ; l'"histogramme de fréquences" de l'échantillon des X i est alors dessiné en prenant pour ordonnées y ( n ) les fréquences f n de l'échantillon tiré de la grandeur X .

Un tel histogramme, qui décrit une "distribution de fréquences" empirique, dépend des choix de N et de δx : plus N devient grand pour δx fixé et petit, plus le profil de cet histogramme tend à se rapprocher d'une unique courbe continue d'expression y = f ( x ), qui décrit la "densité" de la "distribution de probabilités" théorique de la grandeur X . Alors, la "probabilité" que la valeur tirée pour X soit comprise entre x et x + δx , où δx est extrêmement petit, est pratiquement égale à f ( x ) δx ; simultanément, m et s tendent respectivement vers des valeurs limites qui sont la moyenne µ de cette distribution — appelée son espérance mathématique — et son écart-type σ , racine carrée de sa variance σ 2 . Une distribution normale est entièrement définie par les valeurs qu'y prennent µ et σ , sous la forme

f ( x ) = {1 / [σ(2π) 1/2 ]} exp[- ( x - µ ) 2 / (2 σ 2 )]

qui exprime la loi de Laplace -Gauss dessinant une "courbe en cloche" (exp( u ) désigne la fonction " e puissance u ", où la constante e , telle que ln e = 1, vaut 2,718 28...). Cependant, les expressions mathématiques qualifiant le mieux les nombreuses distributions empiriques que l'on rencontre en climatologie sont loin de répondre toutes à une loi de ce genre. L'étude des échantillons alors obtenus ne se limite d'ailleurs pas à la moyenne et à l'écart-type, mais fait appel à des paramètres diversifiés, comme les M - 1 quantiles d'ordre M , qui divisent l'intervalle [ x 0 , x M ] des valeurs possibles de X par leurs valeurs croissantes x 1 , ..., x h , ..., x M - 1 de telle sorte que dans chaque intervalle [ x h , x h + 1 ] soient rassemblés N / M tirages sur les N de l'échantillon ; ainsi obtient-on respectivement, pour les valeurs 100, 10, 5, 4 et 2 de M , les 99 centiles ou percentiles , les 9 déciles, les 4 quintiles, les 3 quartiles et la médiane.