Vous êtes ici : Accueil / Glossaire / Discrétisation

Discrétisation

Publié le 06/12/2024
PDF

La discrétisation est une opération de simplification de l’information statistique qui consiste à réduire un nombre élevé de modalités (données décrivant un individu dans une variable) en un ensemble limité de plages de valeurs, ou classes. Par exemple, pour cartographier la densité par habitant des 95 départements français, il faut réduire les 95 modalités (la densité de l'Ain, celle de l'Aisne, etc.) à un nombre réduit de classes (moins de 10 habitants par km², de 10 à 50, de 51 à 104, etc.). On transforme une donnée continue (un grand nombre de valeurs) en donnée discrète (un nombre limité de valeurs).

La discrétisation est une opération sensible, parce que le choix qui est fait va influencer la représentation du phénomène. C'est l'une des raisons pour laquelle une carte statistique n'est jamais une représentation neutre de la réalité, mais comporte nécessairement des biais. Dans le document 1, la même donnée (le produit provincial brut en 2017) a été discrétisée selon deux méthodes différentes, et avec un nombre de classes différentes. Si aucune des deux cartes n’est plus vraie ou plus fausse que l’autre, leur apparence visuelle est différente et leur interprétation peut en être influencée.

Document 1. Le produit provincial brut par habitant en Chine selon deux méthodes de discrétisation différentes

Produit intérieur brut par provinces chinoises

La carte de gauche fait plus clairement apparaître le haut de la distribution : Pékin et Shanghaï ressortent beaucoup plus nettement. En revanche la différence de revenu entre le Xinjiang et le Tibet est gommée. Dans la méthode des quantiles, chaque classe comprend le même nombre d’individus, quelle que soit la dispersion de la distribution des valeurs. La discrétisation par la méthode jenks, à droite, souligne davantage le décrochage économique entre le littoral et les autres provinces. Modifier le nombre de classes (4 ou 8 au lieu de 6 par exemple), aurait encore donné un résultat visuel différent.

(SD) janvier 2017, dernière modification (JBB) décembre 2024.


Pour compléter avec Géoconfluences
Affiner les résultats par :