Une statistique descriptive particulière : la corrélation
Lorsque l'on possède pour chaque sujet d'une population deux mesures (variables dépendantes ou VD), on peut et on doit s'intéresser aux relations entre ces deux variables. Pour les échelles d'intervalles, la question que l'on se pose le plus fréquemment est de savoir si la variance observée sur une VD (c'est à dire l'amplitude des différences interindividuelles) est spécifique à chacun des tests ou s'il existe une part de variance commune à ces deux tests. Cette évaluation de la part commune à un ou plusieurs tests, à la base de l'analyse dimensionnelle et à la base de l'analyse factorielle, est réalisée à l'aide du coefficient de corrélation de Bravais Pearson.
Le coefficient de corrélation est donc une mesure qui évalue la conformité des observations avec un modèle général de relations entre les deux mesures. Ce modèle général est le plus souvent un modèle linéaire et le coefficient de corrélation associé est le r de Bravais-Pearson pour les échelles d'intervalles ou de rapports. Pour les autres types d'échelles, il n'y a pas de modèle (comme le modèle linéaire) sous-jacent à la mesure des relations entre deux variables. Pour les échelles nominales on utilise un indice dérivé du Chi carré et pour les échelles ordinales, un indice de corrélation identique à celui de Bravais Pearson et calculé sur les rangs et nommé le coefficient r de Spearman.
Résumé des principaux coefficients évaluant la relation entre deux variables |
|||
Coefficient de corrélation |
Variable A (échelle) |
Variable B (échelle) |
Remarques |
Bravais Pearson |
Intervalle |
Intervalle |
Coefficient de référence. Relation linéaire. |
Spearman |
Ordinale |
Ordinale |
Coefficient équivalent à celui de Bravais Pearson d'un point de vue algébrique mais sur les rangs. |
Polychorique |
Ordinale |
Ordinale |
Coefficient utilisée si la distribution des variables latentes sous-jacentes est normale. |
Bisérial de point (point-biserial) |
Nominale dichotomique |
Intervalle |
Coefficient équivalent à celui de Bravais Pearson d'un point de vue algébrique. Utilisé pour calculer les corrélations item-test le plus souvent. Si la corrélation de Bravais Pearson est la référence, le coefficient point-bisérial à tendance à surestimer la liaison. |
Bisérial |
Intervalle dichotomisé |
Intervalle |
Si la corrélation de Bravais Pearson est la référence, ce coefficient à tendance à sur-estimer la liaison. |
Phi |
Nominale (dichotomique) |
Nominale dichotomique |
Coefficient équivalent à celui de Bravais Pearson d’un point de vue algébrique. |
Tétrachorique |
Intervalle dichotomisé |
Intervalle dichotomisé |
Peu utilisée. Suppose que les deux variables latentes évaluées se distribuent normalement. Cas particulier de la corrélation polychorique. |
Remarques :
■Pour la corrélation de Spearman, le coefficient bisérial de point ou le coefficient Phi, il existe dans tous les manuels des formules de calcul simplifiées. Mais algébriquement, on peut toujours appliquer la formmule de Bravais-Pearson, en sachant qu'avec une échelle ordinale, il faut transformer les scores en rangs et pour le coefficient bisérial de point comme pour le coefficient phi, les variables dicotomiques prennent les valeurs 0 et 1. La formule simplifiée était utile à l'époque ou on effectuait encore de nombreux calculs partiellement à la main. Actuellement, ces formules présentent peu d'intérêt (mais sont toujours présentes dans les manuels dont celui ci !).
■La signification (importance ou non) des valeurs des coefficients de corrélation varie selon la technique utilisée. Par exemple, pour le même jeu de données, le coefficient de corrélation bisérial est plus élevé que le coefficient bisérial de point (cf. cours de statistiques).