Analyse et sélection des items

Un test est constitué d'un ensemble d'items (questions) devant différencier les sujets le plus correctement et le plus efficacement possible. Lorsque l'on construit une épreuve, la subjectivité et/ou les connaissances antérieures des chercheurs ou des psychologues à l'origine de l'épreuve jouent un rôle important. Ensuite, lors de la sélection des items, les définitions implicites et/ou explicites de la dimension que l'on souhaite « mesurer » peuvent contribuer ou non à l'élimination d'un item mais la sélection des items repose essentiellement sur une analyse plus technique (étude des propriétés de chaque question en fonction des objectifs).

Pour rappel, plusieurs étapes sont donc nécessaires pour la construction d'une épreuve. L'élaboration d'un premier ensemble d'items constitue une version provisoire du test qui est administrée à un échantillon de personnes. Cet ensemble d'items est remanié en fonction des premiers résultats observés (analyse des items) ou de l'avis d'experts du domaine (lorsqu'il s'agit de questionnaires). On ne se contentera pas de supprimer des items, le plus souvent il peut être nécessaire soit d'en revoir certains soit d'en construire de nouveaux. Par exemple, pour les items à choix multiples une analyse des distracteurs (réponses fausses proposées) peut conduire à modifier un ou plusieurs distracteurs.

Lors de la sélection des items de nombreux critères rentrent en ligne de compte (longueur de l'épreuve, homogénéité de l'épreuve, difficulté souhaitée, etc.). Pour les épreuves d'évaluation de « performances » cognitives, on prend en compte la difficulté des items et leur discriminabilité. Pour les épreuves de personnalité ou des tests qui ne sont pas des épreuves de performances, c'est l'homogénéité interne ou la structure interne (en lien avec la validation) de l'épreuve qui sera aussi pris en compte. On peut aussi appliquer des techniques qui ne feront pas référence à la théorie classique des test (TCT) mais aux modèles de réponses à l'item.

Il n'est pas possible de présenter toutes ces méthodes et l'objectif est de comprendre et d'illustrer les différents critères pouvant être pris en compte lors de la sélection d'item. Cette présentation qui est une sensibilisation est donc partielle. Nous illustrerons les principes utilisés en nous concentrant sur quelques exemples d'indicateurs classiques pouvant être utilisés avec des échelles de performance (mais pas uniquement). Le principe général de sélection reste similaire lorsque l'on utilise d'autres techniques.