Certains instruments psychométriques ont pour objectif le dépistage d’une caractéristique spécifique mesurée de manière dichotomique du type présence/absence (ex : être à risque d’abandon scolaire, avoir ou non un trouble de santé mentale, etc.). Dans un tel cas, on s’attend d’un bon instrument qu’il soit en mesure de détecter correctement les cas qui possèdent effectivement cette caractéristique (sensibilité), ainsi que d’être en mesure d’identifier adéquatement les individus ou les cas qui ne possèdent pas la caractéristique (spécificité). On cherchera donc à établir la probabilité qu’un instrument psychométrique remplisse correctement ces deux fonctions et ce sont les indices de sensibilité et de spécificité, deux indices indépendants l’un de l’autre, qui fournissent ces informations.
Les indices de sensibilité et de spécificité s’expriment par une valeur comprise entre 0 et 1. Alors qu’une valeur de 0 traduirait une complète incapacité à détecter correctement la présence ou l’absence de la caractéristique mesurée, une valeur de 1 se traduirait par une parfaite capacité de détection ou de discrimination (Guédon et al., 2011). Cette notation décimale des indices est habituellement rapportée en pourcentage dans les textes scientifiques pour faciliter la lecture.
La spécificité n’est pas garante de sensibilité et inversement. Ainsi, un instrument psychométrique peut avoir une bonne sensibilité mais une mauvaise spécificité; on dira alors qu’il a une bonne capacité à détecter les individus évalués ayant une caractéristique donnée, mais qu’il identifie comme tel plusieurs individus ne l’ayant pas. Un instrument de classement, par exemple, doit viser à maximiser à la fois sa sensibilité et sa spécificité.
Bien que certains auteurs considèrent la sensibilité et la spécificité comme des propriétés psychométriques distinctes de la fidélité et de la validité (p. ex. Bernaud, 2007), d’autres auteurs (p. ex. Hogan, 2007) les considèrent comme des indices de validité. En effet, la sensibilité et la spécificité peuvent être calculées dans le cadre de l’étude de la validité de critère d’un instrument. Elles peuvent également servir à évaluer la capacité d’un test critérié à identifier correctement la présence du construit mesuré chez les personnes évaluées, auquel cas il s’agit d’une évaluation de la validité de construit de l’instrument.
La sensibilité
La sensibilité d’un instrument psychométrique mesure sa capacité à identifier correctement, dans une population ciblée, les personnes ayant vraiment la caractéristique recherchée (les « cas »), (une aptitude particulière ou une maladie, par exemple). Le degré de sensibilité indique donc la probabilité que l’instrument psychométrique identifie correctement un « cas » ou la probabilité qu’un « cas » donné soit identifié correctement par l’instrument. La notion de sensibilité se rapporte donc à la capacité de détection. Par exemple, il est souhaitable qu’un instrument servant à détecter l’épuisement professionnel soit sensible; on souhaite identifier le maximum des personnes qui souffrent d’épuisement pour intervenir rapidement (capacité à identifier correctement les cas).
La sensibilité est évaluée par la proportion de personnes identifiées par l’outil comme ayant la caractéristique donnée (résultat positif) parmi les personnes possédant réellement cette caractéristique (« cas »). C’est ce que l’on appelle les vrais-positifs. Un instrument présente un problème de sensibilité lorsqu’une bonne partie des personnes possédant réellement la caractéristique donnée (« cas ») sont identifiées par l’outil comme n’ayant pas cette caractéristique (résultat négatif). Ces cas identifiés incorrectement/à tort sont appelés faux-négatifs.
La spécificité
La spécificité d’un instrument psychométrique mesure sa capacité à identifier, dans une population ciblée, les personnes n’ayant pas une caractéristique spécifique donnée (les « non-cas »). Le degré de spécificité d’un instrument indique donc la probabilité que ce dernier identifie correctement un « non-cas » ou la probabilité qu’un « non-cas » donné sera prédit correctement par l’instrument. La notion de spécificité se rapporte donc à sa capacité de discrimination. En poursuivant avec l’exemple précédent, on souhaitera que l’instrument de dépistage ait une spécificité élevée, c’est-à-dire une très bonne capacité à identifier correctement les « non-cas » afin d’éviter d’intervenir inutilement auprès de gens qui n’ont pas de problème d’épuisement professionnel.
La spécificité est déterminée par la proportion de personnes identifiées par l’outil comme n’ayant pas une caractéristique donnée (résultat négatif) parmi les personnes n’ayant réellement pas cette caractéristique (« non-cas »). C’est ce que l’on appelle les vrais-négatifs. Un instrument psychométrique ayant un problème de spécificité identifie des sujets qui ne possèdent pas réellement une caractéristique donnée comme ayant la caractéristique. Ces erreurs de discrimination sont appelées les faux-positifs.
Calculs de la sensibilité et de la spécificité
Le tableau croisé suivant représente les possibilités de classement des cas et des non-cas selon le résultat donné par l’instrument. En colonne, on trouve le statut réel des sujets, à savoir si ces derniers présentent effectivement (cas) ou non (non-cas) la caractéristique à l’étude. En rangée, les deux résultats possibles donnés par l’instrument. Ce dernier prédit donc l’appartenance à un groupe ou à l’autre en fonction des réponses données aux items. L’instrument peut donc sur cette base identifier un sujet comme ayant la caractéristique (positif) ou n’ayant pas la caractéristique (négatif). Il est facile de comprendre que la situation idéale est lorsque que la diagonale VP-VN du tableau croisé contient la plupart des observations. Les cellules hors-diagonale (FP et FN) représentent les erreurs de prédiction (classement) commises par l’instrument.
Le calcul de l’indice de sensibilité est simple. Il s’agit de faire le rapport arithmétique des « vrais » cas correctement identifiés par l’instrument (VP) avec l’ensemble des cas réels soit VP + FN.
Le calcul de l’indice de spécificité est basé sur le même principe. Il représente la proportion des « vrais » non-cas correctement identifiés par l’instrument (VN) avec l’ensemble des non-cas réels soit VN + FP.