Test de Wilcoxon équivalent non paramétrique au test T de Student

Le Test de Wilcoxon est l’alternative non paramétrique indispensable au test T de Student lorsque les conditions de normalité des données ne sont pas respectées. Contrairement aux tests classiques basés sur les moyennes, la méthode de Wilcoxon compare les séries en analysant les rangs des valeurs.

Ce test permet de valider l’homogénéité de deux distributions, qu’il s’agisse de séries indépendantes (comparaison de deux groupes distincts) ou de séries appariées. En calculant la somme des rangs et en la comparant à la valeur critique de la table Z (loi normale centrée réduite), vous déterminez avec précision la p-value et la significativité de vos résultats.

Test de Wilcoxon :
Compare des séries sans condition de normalité

Test de Wilcoxon pour données indépendantes vs appariées

Il existe deux variantes principales de ce test :

Test de Wilcoxon pour séries indépendantes : Pour comparer deux groupes distincts (ex: traités vs non traités).
Test des rangs signés de Wilcoxon pour les séries appariées : Pour comparer des mesures répétées sur les mêmes sujets.

Dans l’exemple ci-dessous, nous aborderons un cas pratique réalisé entièrement sur Microsoft Excel, avec le calcul des rangs pour chaque série de données et leur comparaison pour la détermination de la p-value. »

Principe du test de Wilcoxon

Le test de Wilcoxon compare deux séries ou groupes de données d’une même variable quantitative ou semi-quantitative. Il s’applique lorsque nous ne pouvons pas utiliser le test T de Student car les conditions de normalité des données ne sont pas validées. Contrairement au test T de Student qui compare les données en comparant leurs moyennes, le test de Wilcoxon compare les rangs des valeurs des deux séries.

En effet le test de Wilcoxon range les valeurs des deux séries et leur attribut un RANG. Ensuite il compare la somme des rangs d’une des deux séries et la somme des rangs attendue sous H0.

Ceci veut dire que sous l’hypothèse nulle H0, l’alternance des valeurs des rangs des deux séries est régulière. Ou en d’autres termes, les rangs des valeurs des 2 séries doivent être mélangés d’une façon homogène sous H0.

En posant les hypothèses:

Hypothèse nulle H0 : Les deux distributions sont homogènes ou superposées, versus

Hypothèse alternative H1 bilatérale: Les deux distributions sont décalées. Ce qui revient à dire que les deux séries sont différentes.

Exemple de scores pour application du Test de Wilcoxon

Valeur du test de Wilcoxon pour données indépendantes

Valeur du test en indépendant:

w₁ est la somme des rangs de la série la plus courte;

wa est la somme des rangs attendus sous H0 avec :

s²w1 est la variance de la série w1 qui est égale à

n1 et n2 sont les effectifs de la série1 et de la série2 respectivement et N = n1+n2 est la somme des effectifs des 2 séries.

Significativité du test de Wilcoxon

Comme pour tous les tests statistiques, une fois que nous avons calculé la valeur du test de Wilcoxon W0, nous devons comparer sa valeur à la valeur correspondante au risque alpha. Dans le cas de ce test, cette valeur W0,05 est égale à 1,96 dans la t able de la loi Normale centrée réduite Z.

Et comme à chaque fois deux résultats sont possibles:

Soit W0 < 1,96 et donc on accepte H0. Les deux séries sont Homogènes et donc les deux séries sont égales.

Soit W0 ≥ 1,96 nous devons donc rejeter H0, H1 est vraie. Les deux séries sont décalées ou différentes. Nous pouvons conclure que la moyenne serie1 m1 est ≠ moyenne m2 de la série2.

OU alors nous cherchons directement le degré de significativité du test ou la p-value dans la table Z de la loi centrée réduite.

p-value > 0,05 ; nous acceptons H0 et les deux séries sont Homogènes ou elles sont égales.

p-value ≤ 0,05 ; nous rejetons H0. Les deux séries sont différentes ou les deux moyennes sont différentes m1 ≠ m2.

Un exemple pour comprendre

En effet pour mieux comprendre les étapes de calcul du test de Wilcoxon, quoi de mieux qu’un exemple d’application très simple.

Nous voulons comparer les scores d’amélioration entre deux groupes de patients traités et non traités. Les deux séries de données sont indépendants puisque les patients traités et non traités sont distincts.

En addition, le test de normalité réalisé nous indique que les scores d’amélioration ne suivent pas une distribution Gaussienne. De ce fait nous ne pouvons pas appliquer le test T de Student. Nous allons donc comparer entre les deux séries de données à l’aide du test de Wilcoxon pour données indépendantes.

Nous allons réaliser l’ensemble des calculs de ce test à l’aide de Microsoft Excel. Ce logiciel permet en effet d’effectuer plusieurs tests statistiques de base, comme le test du Khi-deux, directement à partir des fonctions intégrées ou des outils d’analyse de données.

Première étape du test de Wilcoxon, attribution des rangs aux valeurs

Premièrement nous devons trier par ordre croissant la variable scores d’amélioration des deux séries mélangées.

Ensuite dans une autre colonne, nous attribuons un rang à chaque valeur des séries comme montré dans le tableau ci-dessous. Pour les valeurs identiques, nous attribuons des rangs ex-aequo en calculant la moyenne des rangs qu’elles occupent. Ou sous MS Excel appliquer la fonction «rang.moyen» ou «moyenne.rang» selon la version de l’application.

Différentes étapes de calcul du test de Wilcoxon sur Excel

Deuxième étape, calculs de la somme des rangs de l’une des deux séries.

Deuxièmement, nous devons calculer la somme des rangs w1 de la série la plus courte. Ou prendre la valeur la plus faible. Ensuite nous passons aux calculs ci-dessous:

3° Calcul de la somme attendue wa = n1(N+1)/2

4° Calcul de la variance s² de w1 suivant la formule sw1= n1n2(N+1)/12

5° Enfin nous calculons la valeur du test w0 puis la comparer à la valeur de 1,96 (Valeur Z pour un α=5%)

Exemple transformation des valeurs en rangs pour le test de Wilcoxon en Indépendant

Ces différentes étapes ont été réalisées sur Excel.

En conclusion des résultats de cet exemple, W0 est < 1,96 ; il n’y a donc pas de différence d’amélioration entre les groupes traités et non traité.

Test de Wilcoxon : Compare des séries sans condition de normalité