Variance expliquée

Parent Previous Next

Une corrélation linéaire se traduit par une forme de nuage allongée (ellipse) et traduit (entre autre) le fait que l'on peut prédire le score observé sur une variable si on connaît le score observé sur l'autre variable avec moins de chance de se tromper que si on ne le connaissait pas (ce qui traduit la co-variation ou la co-dépendance entre les mesures) .  

Par exemple, si on ne sait rien sur une variable B, la prédiction que l'on peut faire pour une personne est le score moyen observé pour le groupe de sujets et l'erreur est proportionnelle à la variance des notes observées. Plus celle-ci est grande plus la probabilité de se tromper est forte. Par contre, si on connaît le score du sujet sur autre variable A et qu'il existe une corrélation entre A et B on peut prédire le score sur B avec d'autant moins de chance de se tromper que la corrélation sera forte.

En fait, lorsque deux tests corrèlent, cela signifie qu'une partie de la variance de chacun des tests est "expliquée" par la variance de l'autre test (variance commune), c'est pourquoi l'erreur de pronostic est plus faible. On peut montrer facilement que le pourcentage de la variance expliquée est égal au carré de la corrélation linéaire (r de Bravais Pearson) entre les deux variables multiplié par 100 (le carré de la corrélation linéaire s'appelle le coefficient de détermination).

Exemple