Caluler un IC pour un score observé

Dans le cadre de la théorie classique des tests deux méthodes de calcul de l'intervalle de confiance existe :

•La première, centrée sur le score observé, peut être considérée comme la méthode classique (la plus fréquente).

•La seconde méthode centre l'intervalle de confiance non pas sur le score observé mais sur un score vrai estimé.

Ces deux méthodes utilisent l'erreur standard de mesure (ESM ou SEM en anglais) pour évaluer l'intervalle de confiance et sont encore largement utilisées. Elles supposent cependant que l'ESM est constant quel que soit le score observé, ce qui est faux généralement. En effet l'erreur standard de mesure pourrait doubler aux extrémités de la distribution. Les recommandations du "Standards for Educational and Psychological Testing" (2014) aux éditeurs de tests indiquent que normalement, on devrait calculer une erreur standard de mesure conditionnelle (C-ESM ou CSEM) pour chaque valeur observée, ou pour des intervalles de valeurs : "The standard error of measurement, both overall and conditional (if reported), should be provided in units of each reported score." (standard 2.13, p.45).

Les méthodes d'estimations de l'erreur standard de mesure conditionnelle (C-SEM) ne sont cependant pas développées dans ce cours. Ces méthodes sont nombreuses et donnent des résultats proches. Pour ceux que cela intéresse, une présentation claire de ces méthodes est celle de Tong & Kolen (2005) dans "Encyclopedia of Statistics in Behavioral Science". Il existe aussi une méthode faisant référence à la théorie de la généralisabilité (pour une introduction, cf. Laveault et Grégoire, 2014) mais cette méthode est essentiellement réservée à l'évaluation dans le cadre des sciences de l'éducation même si sa mise en œuvre peut concerner les tests mentaux.

Remarque : un outil de calcul de l'intervalle de confiance est à votre disposition <Téléchargement ICI> . Il s'inspire fortement des outils proposés par J. W. Schneider (https://wjschne.github.io)