La théorie classique des tests (TCT) est ce qu'on peut appeler la "théorie du score vrai". L'hypothèse initiale de la TCT (premier postulat, Spearman, 1904b) est qu'il est impossible d'obtenir une mesure complètement exempte d'erreurs. Cet aspect est illustré par l'équation :
X = T + ε
où X correspond au score observé à un test ;
T est le vrai score du sujet;
ε est l'erreur non-systématique qui s'ajoute au vrai score du sujet et
ε suit une loi gaussienne de moyenne 0 et d'écart-type σ.
Cette équation simple signifie que le score observé à un test n'est pas nécessairement le score vrai. Les scores qui s'éloignent du score observé sont cependant moins probables et plus on s'éloigne de ce score vrai, plus cette probabilité est faible. La variable X est une variable aléatoire qui se distribue normalement et l'écart-type de la variable aléatoire X (de l'erreur de mesure ε) correspond à l'erreur standard de mesure. Cette hypothèse concernant la relation entre score vrai et score observé permet de calculer des intervalles de confiance dont l'importance (la taille) dépend de cette erreur standard de mesure. Plus l'erreur (ε) est faible, plus la mesure sera précise (= plus le score observé à de très forte chance d'être proche du score vrai).
Cette conception est à la base de la construction des tests. Il est important de noter :
®qu'un des problèmes les plus importants ou les plus connus de la TCT, concerne le fait que les caractéristiques de l'échantillon normatif et les caractéristiques du test ne peuvent pas être séparées.
®que l'erreur standard dans le cadre de la TCT (important dans le cadre de l'évaluation de la fidélité) est supposée la même pour tous les participants quel que soit leur position sur la dimension examinée alors que cette hypothèse est hautement improbable.
®que la TCT est "test oriented" et qu'il n'est pas possible de faire des prédictions sur la façon dont une personne ou un groupe réussit un item particulier du test. En d'autre terme, la TCT ne nous permet pas de savoir quelle est la probabilité pour un individu particulier de répondre correctement à un item donné.
®que les statistiques sur les items sont aussi dépendantes de l'échantillon normatif. Les caractéristiques des items et des tests peuvent changer selon l'échantillon étudié. Il est par conséquent difficile de comparer des items dont les caractéristiques sont obtenues en utilisant des groupes différents de sujets.