Retour

cour_015.tex

Télécharger le fichier
\paragraphe{Coefficient de corrélation linéaire}
 
\sparagraphe{Définition}
 
Le {\sl coefficient de corrélation linéaire\/} d'une série statistique
double de variables $x$ et $y$ est le nombre $r$ défini par
$$\dresultat{
   r = {\sigma_{xy} \over \sigma (x) \times \sigma (y)}.
}$$
 
Ce coefficient sert à mesurer la qualité d'un ajustement affine.
Par exemple, dans l'exercice précédent, % voir reg_001.tex
on avait $[\sigma (y)]^2 = 76, 04$, donc $r \approx 0, 998$.
 
\sparagraphe{Propriétés}
 
\item{$\bullet$} Le coefficient $r$ est un nombre réel. De plus, comme
$a = \sigma_{xy} / [\sigma (x)]^2$ et $a' = \sigma_{xy} / [\sigma
(y)]^2$, on a la propriété
$$\dresultat{
   \hbox{$\cov (x, y)$, $r$, $a$ et $a'$ sont de même signe}.
}$$
 
\item{$\bullet$} Le  coefficient de corrélation linéaire $r$ vérifie
$$\dresultat{
   -1 \leq r \leq 1
}$$
 
\sparagraphe{Interprétation graphique}
 
Dans tout ce paragraphe, on ne considère que les nuages de points
\og allongés \fg, qui incitent à ajuster par une droite.
 
Le coefficient de corrélation $r$ est lié, d'une part au coefficient
directeur $a$ de $D$, la droite de régression de $y$ en $x$, d'autre
part à $1/a'$, le coefficient directeur de $D'$, la droite de
régression de $x$ en $y$. Les deux droites passant par le point moyen
$G$, le coefficient $r$ donne des indications sur l'angle des deux
droites.
 
\ssparagraphe{Ajustement affine parfait}
 
Dans le cas où $r^2 = 1$, on a $aa' = 1$, et donc $a = 1/a'$. Les coefficients
directeurs de $D$ et $D'$ sont égaux. Les droites $D$ et $D'$ sont
confondues (puisqu'elles ont déjà le point moyen $G$ en commun), et on
dit que l'on a un {\sl ajustement affine parfait}.
 
\def \epspath{%
   $HOME/tex_doc/lycee/database/btsmai/stats/}
 
 \epsfxsize = 70mm
 
$$
   \legende{\fignum \quad $r = 1$, $a>0$, $a'>0$}
   \superboxepsillustrate{cour_015a.ps}
      \qquad
 \epsfxsize = 70mm
   \legende{\fignum \quad $r = -1$, $a<0$, $a'<0$}
   \superboxepsillustrate{cour_015b.ps}
$$
 
\ssparagraphe{Forte corrélation}
 
Dans le cas où $|r|$ est \og proche\fg\ de $1$, alors les droites $D$
et $D'$ sont \og\ proches\fg\ l'une de l'autre. On dit qu'il y a une
\og bonne\fg\ corrélation entre les deux caractères. 
 
Les termes \og proche\fg\ et \og bonne corrélation\fg\ sont à définir
au cas par cas. Dans le bâtiment par exemple, il arrive
que l'on se contente de $|r| \approx 0, 5|$, alors que dans la
maintenance, on demande fréquemment $0, 999 \leq |r| \leq 1$.
 
Attention~: il ne faut surtout pas confondre forte corrélation et
liaison de cause à effet~: $x_i$ et $y_i$ peuvent, par exemple,
mesurer deux effets d'une même cause\dots
 
 
 
$$
 \epsfxsize = 70mm
   \legende{\fignum \quad $r$ proche de $1$, $a>0$, $a'>0$}
   \superboxepsillustrate{cour_015c.ps}
      \qquad
 \epsfxsize = 70mm
   \legende{\fignum \quad $r$ proche de $-1$, $a<0$, $a'<0$}
   \superboxepsillustrate{cour_015d.ps}
$$