UAA 1

Statistiques à deux variables

La statistique à deux variables étudie la relation entre deux caractères quantitatifs mesurés sur les mêmes individus. L'objectif est de modéliser cette relation par une droite et d'en évaluer la pertinence.

Fiche mémo — Points clés à retenir

  • Nuage de points : représentation des couples \((x_i, y_i)\)
  • Point moyen : \(G = (\bar{x}, \bar{y})\) — toute droite d'ajustement passe par \(G\)
  • Covariance : \(\text{cov}(X,Y) = \frac{1}{n}\sum x_i y_i - \bar{x}\,\bar{y}\)
  • Coefficient de corrélation : \(r = \frac{\text{cov}(X,Y)}{\sigma_X \sigma_Y}\), \(r \in [-1,1]\)
  • \(|r| > 0{,}8\) : corrélation forte ; \(|r| < 0{,}5\) : corrélation faible
  • Droite de Mayer : passe par les points moyens des deux sous-nuages
  • Droite des moindres carrés : \(y = ax + b\) avec \(a = \frac{\text{cov}(X,Y)}{\sigma_X^2}\)
  • Causalité ≠ corrélation : une corrélation forte n'implique pas un lien de cause à effet

Exercices résolus

Ex. 1

Calcul du coefficient de corrélation

On observe les données suivantes pour 5 élèves (heures de travail \(x\) et note \(y\) sur 20) :\n\n| Élève | \(x\) | \(y\) |\n|---|---|---|\n| A | 2 | 8 |\n| B | 4 | 11 |\n| C | 5 | 13 |\n| D | 7 | 16 |\n| E | 7 | 17 |\n\nCalculer \(\bar{x}\), \(\bar{y}\), \(\text{cov}(X,Y)\), \(\sigma_X\), \(\sigma_Y\) et \(r\).
Ex. 2

Droite des moindres carrés

En reprenant les données de l'exercice précédent (\(\bar{x}=5\), \(\bar{y}=13\), \(\text{cov}=6{,}2\), \(\sigma_X^2=3{,}6\)), déterminer l'équation de la droite des moindres carrés, puis estimer la note d'un élève qui travaillerait 6 heures.