\paragraphe{Coefficient de corrélation linéaire} \sparagraphe{Définition} Le {\sl coefficient de corrélation linéaire\/} d'une série statistique double de variables $x$ et $y$ est le nombre $r$ défini par $$\dresultat{ r = {\sigma_{xy} \over \sigma (x) \times \sigma (y)}. }$$ Ce coefficient sert à mesurer la qualité d'un ajustement affine. Par exemple, dans l'exercice précédent, % voir reg_001.tex on avait $[\sigma (y)]^2 = 76, 04$, donc $r \approx 0, 998$. \sparagraphe{Propriétés} \item{$\bullet$} Le coefficient $r$ est un nombre réel. De plus, comme $a = \sigma_{xy} / [\sigma (x)]^2$ et $a' = \sigma_{xy} / [\sigma (y)]^2$, on a la propriété $$\dresultat{ \hbox{$\cov (x, y)$, $r$, $a$ et $a'$ sont de même signe}. }$$ \item{$\bullet$} Le coefficient de corrélation linéaire $r$ vérifie $$\dresultat{ -1 \leq r \leq 1 }$$ \sparagraphe{Interprétation graphique} Dans tout ce paragraphe, on ne considère que les nuages de points \og allongés \fg, qui incitent à ajuster par une droite. Le coefficient de corrélation $r$ est lié, d'une part au coefficient directeur $a$ de $D$, la droite de régression de $y$ en $x$, d'autre part à $1/a'$, le coefficient directeur de $D'$, la droite de régression de $x$ en $y$. Les deux droites passant par le point moyen $G$, le coefficient $r$ donne des indications sur l'angle des deux droites. \ssparagraphe{Ajustement affine parfait} Dans le cas où $r^2 = 1$, on a $aa' = 1$, et donc $a = 1/a'$. Les coefficients directeurs de $D$ et $D'$ sont égaux. Les droites $D$ et $D'$ sont confondues (puisqu'elles ont déjà le point moyen $G$ en commun), et on dit que l'on a un {\sl ajustement affine parfait}. \def \epspath{% $HOME/tex_doc/lycee/database/btsmai/stats/} \epsfxsize = 70mm $$ \legende{\fignum \quad $r = 1$, $a>0$, $a'>0$} \superboxepsillustrate{cour_015a.ps} \qquad \epsfxsize = 70mm \legende{\fignum \quad $r = -1$, $a<0$, $a'<0$} \superboxepsillustrate{cour_015b.ps} $$ \ssparagraphe{Forte corrélation} Dans le cas où $|r|$ est \og proche\fg\ de $1$, alors les droites $D$ et $D'$ sont \og\ proches\fg\ l'une de l'autre. On dit qu'il y a une \og bonne\fg\ corrélation entre les deux caractères. Les termes \og proche\fg\ et \og bonne corrélation\fg\ sont à définir au cas par cas. Dans le bâtiment par exemple, il arrive que l'on se contente de $|r| \approx 0, 5|$, alors que dans la maintenance, on demande fréquemment $0, 999 \leq |r| \leq 1$. Attention~: il ne faut surtout pas confondre forte corrélation et liaison de cause à effet~: $x_i$ et $y_i$ peuvent, par exemple, mesurer deux effets d'une même cause\dots $$ \epsfxsize = 70mm \legende{\fignum \quad $r$ proche de $1$, $a>0$, $a'>0$} \superboxepsillustrate{cour_015c.ps} \qquad \epsfxsize = 70mm \legende{\fignum \quad $r$ proche de $-1$, $a<0$, $a'<0$} \superboxepsillustrate{cour_015d.ps} $$