Dispersion

L'indice de dispersion est un indice permettant de savoir si les valeurs observées sont proches ou relativement éloignées de l'indice de tendance centrale. Cet indice est essentiel puisque, par exemple, savoir que la moyenne des notes observées à un examen est 12 sur 20 est insuffisant. En effet, l'ensemble des notes peut être proche de 12 (compris entre 11,5 et 12,5) ou éloignée de 12 (compris par exemple entre 3 et 19). La meilleur prédiction que l'on peut faire pour une personne dont on ne connaît pas la note sera, pour cet examen la note de 12, mais l'erreur faite (l'écart à la note réelle) sur cette prédiction sera d'autant plus grande que la dispersion des scores est grande. Une forte ou faible variabilité des notes (forte ou faible dispersion) autour de l'indice de tendance centrale est donc une information utile et complémentaire à l'information apportée par l'indice de tendance centrale.

Les indices de dispersion sont multiples et sont associés à l'indicateur de tendance centrale utilisé. Par exemple :

-associé au mode : on utilise un indice d'entropie (H) [non présenté ici]

-associé à la médiane : on utilise souvent l'écart inter-quartile ou le demi-inter-quartile (différence ou demi-différence entre le premier et le troisième quartile). Pour information on donne aussi parfois l'étendue de la distribution c'est à dire les deux extrêmes. [rappel le ième quartile est le score dont la fréquence cumulée est i*25%]

-associé à la moyenne : on utilise la variance (moyenne des carrés des écarts à la moyenne) ou l'écart-type (racine carrée de la variance). Si les notes sont toutes identiques la variance (comme l'écart-type) est égale à 0.

La variance et l'écart-type sont dépendants de la mesure et de l'unité de mesure. On peut calculer aussi, pour estimer la dispersion indépendamment de l'unité de mesure, ce qu'on appelle le coefficient de variation (CV). Le CV est le rapport de l'écart-type à la moyenne. Il permet la comparaison de distributions de valeurs dont les échelles de mesure ne sont pas comparables. C'est un indice de dispersion relatif contrairement à la variance et l'écart-type qui sont des dispersions absolues.

Remarques :

■La compréhension de la signification de la notion de dispersion est utile quand on met en relation plusieurs variables. En effet, on admet que les différences interindividuelles (mesurées par la dispersion) sont toujours dues en partie à l'erreur de mesure (erreur aléatoire = ensemble de facteurs indépendants affectant de façon non prévisible la mesure) mais peuvent être aussi dues à un ou plusieurs facteurs (variables latentes) sous-tendant les comportements et à l'origine de ces différences. Ces facteurs qui sont sources de variations (à la base de la dispersion observée) peuvent être communs à plusieurs épreuves. Ces sources de variations sont donc à la base des covariations entre les scores observés (cf. l’analyse corrélationnelle, chap. A §2.4).

■L'indice de dispersion contribue aussi à l'interprétation d'un score observé. Par exemple, si la note obtenue par un enfant est de 10 sur 20 et que la moyenne de la classe est 9, on peut penser que c'est bien. Si l'écart-type observé des notes de la classe est de 0.30, en fait ce score de 10 est à plus de 3 écarts-types de la moyenne* et donc ce score était très peu probable car les scores devaient être tous proches de 9 (entre 8.4 et 9.6)**. Le score de cet enfant est donc le meilleur ou probablement un des meilleurs de la classe.
A l'inverse si l'écart-type est de 3, la note de 10 était une valeur probable*** (à un tiers d'écart-type de la moyenne). La note de 10 est alors une note dans "la moyenne" de la classe. Cet exemple montre que pour interpréter un score, l'écart à la moyenne n'est pas suffisant, et on doit le mettre en relation avec un indice de dispersion comme l'écart-type (sous l'hypothèse d'une distribution normale ou quasi-normale). On pourrait prendre aussi un autre indice comme l'écart inter-quartile.

--------------

(*) Si une distribution est normale, presque toutes les valeurs observées (99,9%) se situent en général entre -3 et +3 écarts-types.

(**) 94,4% des scores se situent entre -2 et +2 écarts-types de la moyenne (sous l'hypothèse d'une distribution normale ou quasi-normale)

(***) Entre le score minimal et 1 écart-type (donc ici entre 0 et 10), si la distribution est normale, on trouve 84,1% des notes (et 68,3% entre 8 et 10). On peut donc alors dire que cette note était probable, ou par abus de langage, dans "la moyenne" des notes observées.