La plupart des modèles statistiques reposent sur des hypothèses concernant la structure des données. Par exemple, les moindres carrés linéaires supposent notamment la linéarité, la normalité et l’indépendance des erreurs. Cependant, en pratique, ces hypothèses ne sont pas toujours vérifiées. Une solution consiste alors à appliquer une transformation mathématique aux données pour qu’elles se conforment mieux aux hypothèses requises. Par exemple, lorsque les données ne suivent pas une distribution normale, une transformation peut aider à « normaliser » la distribution, facilitant ainsi l’application de tests comme les tests t ou l’ANOVA. Il n’existe pas de règles strictes concernant le moment et la manière de transformer les données, et il est souvent nécessaire d’explorer différentes options pour trouver la transformation la plus adaptée. Nous abordons ici quelques transformations de base et leur mise en œuvre dans SPSS. Pour une discussion approfondie, voir Fox (2016).
La Transformation Logarithmique
Le logarithme d’un nombre est l’exposant auquel il faut élever une base pour obtenir ce nombre. Par exemple, le logarithme naturel (base e) de 10 est :
loge(10)=2.302585093 car e2.302585093=10, où e≈2.7183. On peut aussi calculer des logarithmes en base 10 :
log10(10)=1
Pourquoi les logarithmes aident-ils à normaliser une distribution ? Prenons un exemple avec les données hypothétiques suivantes :
2 4 10 15 20 30 100 1000
Les valeurs plus petites sont plus proches les unes des autres que les valeurs extrêmes. Par exemple, le rapport entre 4 et 2 est de 2, tandis que celui entre 100 et 1000 est de 10. Calculons les logarithmes naturels de ces données :
0.69 1.39 2.30 2.71 2.99 3.40 4.61 6.91
Le rapport entre 1.39 et 0.69 reste proche de 2, mais celui entre 6.91 et 4.61 est réduit à 1.49, contre 10 dans les données originales. La transformation logarithmique a ainsi rapproché les valeurs extrêmes du reste de la distribution, atténuant l’asymétrie. Cela rend souvent la distribution plus proche d’une loi normale, ce qui la rend plus adaptée à des tests paramétriques comme les tests t ou l’ANOVA.
Voici un exemple de données avant et après transformation logarithmique :
(a) (b)

(a) : Distribution originale des niveaux d’enzymes]
Distribution après transformation logarithmique]
Autres Transformations
D’autres transformations sont possibles, comme la racine carrée ou l’inverse (1/valeur). Voici comment notre petit jeu de données se comporte sous ces transformations :
| Valeur (Y) | LOG_Y | SQRT_Y | RECIP_Y |
|---|---|---|---|
| 2.00 | 0.69 | 1.41 | 0.50 |
| 4.00 | 1.39 | 2.00 | 0.25 |
| 10.00 | 2.30 | 3.16 | 0.10 |
| 15.00 | 2.71 | 3.87 | 0.07 |
| 20.00 | 3.00 | 4.47 | 0.05 |
| 30.00 | 3.40 | 5.48 | 0.03 |
| 100.00 | 4.61 | 10.00 | 0.01 |
| 1000.00 | 6.91 | 31.62 | 0.00 |
Mise en Œuvre dans SPSS
- Transformation Logarithmique :
- Dans TRANSFORMER → CALCULER LA VARIABLE, sélectionnez la fonction LN (logarithme naturel) sous Functions and Special Variables (groupe Arithmetic).
- Déplacez la variable originale Y sous Numeric Expression pour obtenir LN(Y).
- Autres Transformations :
- Pour la racine carrée, utilisez SQRT(Y).
- Pour l’inverse, utilisez 1/Y.
Quand Utiliser Quelle Transformation ?
- Asymétrie négative : Essayez une transformation par élévation au carré.
- Asymétrie positive : Commencez par une racine carrée ou un logarithme.
Il est souvent utile d’essayer plusieurs transformations pour voir laquelle convient le mieux à vos données. Vous pouvez comparer les résultats des analyses avec et sans transformation pour évaluer son impact.
Un Mot sur les Transformations
Bien que certaines analyses puissent bénéficier de transformations, de nombreuses méthodes paramétriques restent robustes face à de légères déviations par rapport à la normalité. Si une transformation ne change pas significativement les résultats, elle peut être omise. Cependant, une distribution fortement asymétrique peut indiquer la nécessité d’un modèle alternatif (par exemple, une régression de Poisson pour des données de comptage). Dans de tels cas, il peut être judicieux de consulter un expert pour choisir la meilleure approche. Ne transformez pas systématiquement toutes vos données sans réflexion.