Pour caractériser la forme d'une distribution, c'est-à-dire pour préciser l'allure de la courbe des fréquences, il existe des coefficients permettant d'évaluer l'asymétrie d'une distribution et son aplatissement.
Mesure d'asymétrie (skewness)
Une distribution statistique est symétrique si les observations repérées par leurs fréquences sont également dispersées de part et d'autre d'une valeur centrale. Le coefficient d'asymétrie correspond au moment d'ordre 3* de la variable centrée réduite). En pratique, un utilise un estimateur non biaisé égal à :
Avec : - n le nombre d'observations - xi le score observé pour l'observation i - et des estimateurs non biaisés** de la moyenne et de l'écart-type |
La valeur de ce coefficient est de 0 pour une distribution normale. Un coefficient négatif traduit une asymétrie avec une queue de de distribution plus étendue à gauche. Un coefficient positif traduit une asymétrie avec une queue de de distribution plus étendue à droite.
En général, pour les scores observés dans une épreuve cognitive, un coefficient d'asymétrie positif est en relation avec un effet plancher (tâche difficile) et un coefficient d'asymétrie négatif est en relation avec un effet plafond (tache trop facile).
skewness positif |
skewness négatif |
Figure B-1 : Exemples de courbes asymétriques
Mesure d'aplatissement (= degré de voussure ou kurtosis)
Kurtosis (du grec kurtos signifiant courbe ou arrondi) est une statistique descriptive (moment centré d'ordre 4*) mesurant l'aplatissement de la distribution ou ce qu'on appelle encore son degré de voussure ou parfois sa "kurtose".
Figure B-2 : Exemples de distributions ayant 3 degrés de voussure différents (kurtois)
Pour une distribution normale, la valeur de ce coefficient (moment centré d'ordre 4) est de 3 pour une distribution normale. En pratique, on utilise le plus souvent un coefficient corrigé K (kurtosis normalisé***). La valeur de ce coefficient est alors de 0 pour une distribution normale (courbe dite alors mésokurtique). Un coefficient d'aplatissement négatif indique une distribution plutôt aplatie (platykurtique) et un coefficient d'aplatissement positif, une distribution "pointue" (leptokurtique). La formule de calcul d'un estimateur non biaisé de ce coefficient d'aplatissement corrigé est :
Avec : - n le nombre d'observations - xi le score observé pour l'observation i - et des estimateurs non biaisés** de la moyenne et de l'écart-type |
--------------
(*) Pour ceux qui veulent savoir : Un moment d'ordre r est une moyenne des écarts par rapport à un réel "a" élevés à une puissance "r", r étant un entier naturel. La moyenne et la variance sont des moments d'ordre 1 et 2. Le skewness et le kurtosis des moments d'ordre 3 et 4 (facile à comprendre si on inspecte les formules de calcul de ces indices).
(**) un estimateur non biaisé pour la moyenne et l'écart-type s'obtient en remplaçant n par n-1 dans les formules de la moyenne et de l'écart-type
(***) Le terme excès d'aplatissement dérivé de "kurtosis excess" en anglais est utilisé parfois à la place de kurtosis normalisé mais il est ambigu car un excès d'aplatissement positif est une courbe leptokurtique (distribution pointue) et un excès d'aplatissement négatif à une courbe platykurtique (distribution aplatie).