Coefficient de Corrélation Intraclasse ICC
Principe du coefficient de corrélation Intraclasse ICC
Avant de pouvoir utiliser des mesures d’évaluation ou des instruments de mesure à des fins d’applications cliniques ou de recherche, il est essentiel d’établir leur fiabilité. C’est-à-dire la capacité des mesures à être reproduites avec précision. En d’autres termes, établir la fiabilité des mesure revient à évaluer non seulement la corrélation entre les mesures, mais aussi leur cohérence ou leur concordance.
CONTENUS
Le Coefficient de Corrélation Intraclasse ICC permet donc de mesurer cette fiabilité ou le degré de similitude entre ces observations. Ces mesures doivent être dépendantes ou appariées. C’est-à-dire prises de manière répétée chez le même sujet. L’ICC est aussi un indicateur de la répétabilité ou la reproductibilité des mesures réalisées par un même instrument ou un même évaluateur. Il est généralement déterminé lorsque les mesures sont à échelle quantitative ou semi-quantitative.
L’ICC, comme tout coefficient (Pearson ou Spearman) est compris entre 0 et 1. Un ICC proche de 1 indique une forte concordance entre les mesures, ce qui suggère une grande fiabilité entre évaluateurs. En revanche, un ICC proche de 0 indique une faible concordance et une faible fiabilité entre évaluateurs.
Cependant, il existe plusieurs types ou formes d’ICC, chacun adapté au contexte spécifique de l’étude et ses applications. Ceci dit, il faut bien choisir le type d’ICC adapté aux objectifs de l’étude, des caractéristiques des données et des hypothèses sous-jacentes sur les évaluations à tester. La différence entre les différents types réside principalement dans la façon dont ils modélisent et évaluent la concordance ou la cohérence entre les mesures.
Les différents types d’ICC

Les types d’ICC selon le type d’étude de fiabilité
Fiabilité inter-évaluateurs (Inter-rater reliability en anglais)
Fiabilité test-retest
Une première mesure (Test) est réalisée sur tous les sujets de l’échantillon pour la première fois. Après une période d’attente, le même évaluateur ou instrument réalise une deuxième mesure (Retest) sur les mêmes sujets et dans les mêmes conditions. Ensuite, nous pouvons calculer le coefficient de corrélation intraclasse ICC pour évaluer la fiabilité test-retest. Il est aussi possible de calculer le coefficient de corrélation de Pearson, pour mesurer cette reproductibilité.
Une fiabilité test-retest élevée indique une cohérence que l’instrument ou l’évaluation est stable dans le temps et produit des résultats fiables et reproductibles. Cependant, des facteurs inducteurs de biais, tels que la variabilité naturelle des mesures, les changements réels dans la condition des sujets et les effets de la mémoire peuvent affecter la fiabilité test-retest. Par conséquent, il est important de prendre en compte ces facteurs lors de l’interprétation des résultats de la fiabilité test-retest.
Le calcul de l’ICC utilise généralement le modèle adapté aux mesures répétées effectuées par les mêmes évaluateurs sur les mêmes sujets à deux moments différents. La variance entre les sujets représente la variation des moyennes des mesures entre les différents sujets (Voir Calcul de l’ICC).
La fiabilité intra-évaluateur (Intra-rater reliability en anglais)
Comme son nom l’indique, la fiabilité intra-évaluateur mesure la cohérence des évaluations effectuées par un même évaluateur. Elle est utilisée pour évaluer la constance des scores ou des mesures similaires réalisées par un évaluateur à plusieurs reprises.
Par exemple, lors d’une étude clinique évaluant la gravité des symptômes d’une maladie chez des patients à l’aide de scores de gravité. Le clinicien effectue une première série de scores de gravité sur l’ensemble des patients de l’échantillon. Puis, une deuxième évaluation est réalisée dans les mêmes conditions, mais après une période d’attente. Une période d’attente est nécessaire pour minimiser les biais d’évaluation, par exemple les effets de la mémoire. Nous pouvons ensuite calculer le Coefficient de Concordance Intraclasse ICC de la fiabilité intra-évaluateur.
Une fiabilité intra-évaluateur élevée indique que l’évaluateur est cohérent dans ses mesures. Il donne des résultats similaires lorsqu’il évalue les sujets à différents moments. Cependant, des facteurs tels que la fatigue, les variations dans l’interprétation des critères d’évaluation ou les changements dans l’état des sujets, peuvent influencer la fiabilité intra-évaluateur. Il est donc important de prendre en compte ces facteurs lors de l’interprétation des résultats de la fiabilité intra-évaluateur. Le modèle d’ICC doit être généralement adapté aux mesures répétées sur les mêmes sujets à deux moments différents.
Calcul du Coefficient de Corrélation Intraclasse ICC
Formune générale

ICC évalue la proportion de la variance totale des mesures qui est attribuable à la variance entre les sujets (évaluateurs ou mesures) par rapport à la variance totale. Cette dernière mesure à la fois la variance entre les sujets (inter-sujet) et la variance à l’intérieur des sujets (variance résiduelle).

Calculs des différents types de ICC
Calcul de l’ICC(2,1) pour évaluer la faisabilité inter-évaluateur (Inter-rater )

En résumé, en adaptant la formule de l’ICC en fonction du contexte spécifique de l’étude, nous pouvons obtenir une mesure de la fiabilité qui est pertinente et appropriée pour les objectifs fixés par la recherche.
Koo et Li (2016) expliquent en détail les différents types ou modèles d’ICC selon les objectifs de l’étude de fiabilité et la structure des données. Ils donnent des indications très précises sur le choix de l’ICC et son interprétation.
Interprétation du Coefficient de Corrélation Intraclasse ICC
La valeur ICC obtenu est standard quelque soit le modèle d’ICC mentionné. Cette valeur varie de 0 à 1.
Un ICC proche de 1 indique une forte concordance entre les évaluateurs ou les mesures. Ceci suggère une bonne fiabilité inter-évaluateur. En revanche, un ICC proche de 0 indique une faible concordance. Ce qui indique des divergences significatives entre les évaluateurs. Toujours selon les indications de Koo et Li (2016) :
Une valeur ICC en dessous de 0,50 a un faible degrès de faisabilité
Entre 0,50 et 0,75 , la faisabilité est moyenne
Entre 0,75 et 0,90, le degré de faisabilité est bon
Enfin, au-dessus de 0,90, la faisabilité est excellente.
Classification des types d’ICC selon la nature des données
En complément des trois grands types d’ICC classés selon le type d’étude de Faisabilité, d’autres type d’ICC sont décrits en fonction de la nature des mesures réalisées :
- ICC à mesure unique, lorsqu’une seule mesure est prise sur chaque sujet ou objet. C’est e type d’ICC est également connu sous le nom d’ICC de cohérence.
- ICC à effet aléatoire à deux voies, c’est le cas ou chaque sujet présente plusieurs mesures prises par plusieurs évaluateurs. Ce ICC mesure l’accord entre évaluateurs, c’est un ICC d’accord.
- ICC à effet mixte : utilisée lorsque plusieurs mesures sont effectuées sur chaque sujet ou objet et qu’il y a à la fois plusieurs évaluateurs et plusieurs sujets. Cest un ICC de mesure moyenne.
Choix du type de Coefficient de Corrélation Intraclasse ICC
Il est à noter que le calcul des différentes formes d’ICC sur la même base de données donnent des résultats tout à fait différents. Il est donc crucial de choisir le type d’ICC selon la structure des données et du désigne de l’étude. Koo and Li 2016 définissent les types d’ICC en fonction des critères suivants:
Le type de Modèle : Modèle d’ICC adapté à la structure de la base de données permettant de construire le modèle d’analyse. Selon des modèles à effets aléatoires à un facteur, à effets aléatoires à deux facteurs ou effets fixes à deux facteurs.
L’unité de mesure : est-elle basée sur un évaluateur unique ou une moyenne de k évaluateurs.
Le type de relation considéré comme important : cohérence (consistency en anglais) ou accord absolu (absolute agreement).
La détermination de l’ICC implique l’utilisation de modèles d’analyse de variance à effets fixes ou mixtes. Se sont donc des méthodes d’analyses statistiques avancées. Les calculs de ce coefficient par un logiciel statistique est importante. En plus de cela, la majorité des logiciels statistiques permettent de calculer les différents types d’ICC (jusqu’à 6) avec leurs Intervalles de Confiance IC95%. Cependant, il reste tout de même une étape importante du choix de bon type d’ICC à appliquer et de son interprétation.
Tous les logiciels statistiques permettent de calculer les différentes formes d’ICC avec leurs IC95%. IBM SPSS (calcul 6 types). Une macro du logiciel SAS donne les valeurs de 10 types d’ICC en une seules étapes. il est de même pour le logiciel R.
Etude de cas de faisabilité inter-évaluateur et calcul de l’ICC
Calculs de l’ICC (2,1) par le logiciel IBM SPSS.

