Principe. Les compétences réelles des personnes étant inconnues lors de l'élaboration d'un test on détermine l'indice de discriminabilité d'un item (d-index) en calculant la différence de pourcentage de réussite à l'item entre « performants » et « peu performants ». Cela revient à faire la différence entre le pourcentage de personnes ayant réussi l'item parmi celles ayant un score élevé sur l'ensemble des items (les 27% des personnes ayant les scores les plus élevés) et le pourcentage de celles ayant réussi parmi celles ayant un score faible sur l'ensemble des items (parmi les 27% des personnes ayant les scores les plus faibles).
Plus l'indice (le d-index) est proche de 1, plus l'item discrimine les personnes. Plus cet indice est proche de 0, moins il différencie (dans ce cas on ne retient pas l'item). Si l'indice est négatif cela signifie que les "plus efficaces" réussissent moins cet item. Un item ayant un d-index faible ou négatif nuit à l'homogénéité de l'épreuve et on l'élimine.
Exemple. Soit l'administration d'un test composé de 9 items. On calcule le score total au test (nombre de bonnes réponses). Pour chaque item on calcule la proportion de sujets ayant réussi l'item parmi les 27% des meilleurs score au test (p1) et la proportion de sujets ayant réussi parmi les 27% les moins efficaces au test (p2). Remarque : p1 et p2 sont des indices de difficultés pour chaque sous groupe (cf. tableau ci-dessous). Le d-index est simplement la différence entre p1 et p2.
Items |
I1 |
I2 |
I3 |
I4 |
I5 |
I6 |
I7 |
I8 |
I9 |
p1 |
0.85 |
0.92 |
0.99 |
0.55 |
0.30 |
0.37 |
0.86 |
0.92 |
0.60 |
p2 |
0.10 |
0.08 |
0.02 |
0.22 |
0.32 |
0.35 |
0.10 |
0.05 |
0.12 |
d-index |
0.75 |
0.84 |
0.97 |
0.33 |
-.02 |
0.02 |
0.76 |
0.87 |
0.48 |
I5, I6 et dans une moindre mesure I4 nuisent à l'homogénéité de l'instrument.
Attention : Si potentiellement, le d-index peut varier entre -1 et +1, sa valeur maximale pour un item i est directement dépendant du p-index :
avec : pi le p-index de l'item i
Cette formule signifie qu'un item très difficile (p-index inférieur ou très inférieur à .27) ne peut avoir qu'un d-index peu élevé. En effet si 5% des personnes réussissent un item et que ces 5% sont réellement les meilleurs, p1 sera égal à 5/27 donc 0.185 et p2 sera égal à 0 (si on prend la notation du tableau ci-dessus). Le d-index sera alors de 0.185 (ce qui correspond bien à la valeur maximale possible donnée par la formule soit 0.05 * 0.27). Le d-index parait peu donc élevé mais on doit tenir compte que c'est le maximum possible au vu du p-index. De la même façon, si un item est très facile (p-index supérieur ou très supérieur à .73), le d-index ne peut être que faible. On doit donc tenir compte du p-index pour calculer le d-index maximum possible et comparer avec le d-index observé (pour chaque item).
Pour aller plus loin...
Une variante de l'indice de Findley est l'indice B de "discrimination au seuil de maîtrise" (Brennan, 1972) que l'on peut utiliser pour des tests de connaissances (le plus souvent des tests scolaires). Pour calculer cet indice, on se fixe un seuil (niveau de maîtrise du contenu, par exemple réussite à 80% des items) et on constitue 2 groupes, ceux qui réussissent à 80% ou plus et tous les autres. Cet indice se calcule alors comme l'indice de Findley (indice de difficulté pour ceux qui maîtrisent moins indice de difficulté calculé sur ceux qui ne maîtrisent pas). A nouveau cet indice dépend du niveau de difficulté des items et du seuil de maîtrise que l'on se fixe.