Christian MUIR

Deux variables

Dernière modification : 05 décembre 2008

Vous êtes ici : Accueil >> Tableur >> Graphiques >> Deux variables
Graphiques

Il est intéressant d’étudier l’interaction qui peut exister entre plusieurs variables.

Cela peut se faire de deux façons :

  • L’analyse de régression, qui fournit les outils nécessaires à la prédiction du niveau d’une variable au moyen de la valeur connue d’autres variables ;
  • L’analyse de corrélation, qui mesure la force de la relation entre plusieurs variables.

1.  Régression

1.1  Principe

On cherche à étudier la relation qui existe entre deux variables, l’une étant dépendante et l’autre indépendante. Cette relation prend la forme d’une équation du type Y = aX + b.

  • Y est la variable dépendante, puisque sa valeur est obtenue à partir de la valeur de X
  • X est la variable indépendante
  • a est la pente de la droite, et indique dans quelle mesure Y est différent pour chaque valeur de X
  • b est l’ordonnée à l’origine, et correspond à la hauteur de la droite où s’effectue la rencontre avec l’axe des ordonnées

1.2  Représentation graphique

On représente les données à étudier par un diagramme de dispersion ou nuage de points.

Exemple (extrait du livre de Laurence Sapin "Statistique de gestion" Éd. d'Organisation 1987) :
le tableau suivant donne les observations relatives à la photocopie de documents ne comptant qu’une page et indique le nombre de copies et le temps de reproduction pour chaque travail.

Dans cet exemple, Y (variable dépendante) est le temps passé, X (variable indépendante) est le nombre de copies.

Travail n°Nombre de copiesTemps
nécessaire
(minutes)
Travail n°Nombre de copiesTemps
nécessaire
(minutes)
11502,9115004,2
23103,9122003,4
34503,913500,9
411508,1149206,2
58007,1155005,1
62002,6165005,4
73004,1174002,7
82503,3187505,8
99106,1194103,5
101001,9202003,5

Attach:nuage.png Δ

Création du nuages de points avec l'assistant graphique d'Excel

Attach:nuage2.gif Δ

  • Sélection du bloc B1 : C21
  • Type de graphique nuages de points (le plus simple)
  • Plage de données B1 : C21
  • Série en colonnes
  • Valeurs de X B2 : B21
  • Valeurs de Y C2 : C21
  • Titre du graphique Nuage de points
  • Axe des X Nombre de copies
  • Axe des Y Temps nécessaire
  • Quadrillage Aucun
  • Légende Ne pas afficher
  • Étiquettes Aucune
  • Emplacement Sur une nouvelle feuille

1.3  Droite d’ajustement

On voit bien sur le graphique que les points sont regroupés de telle façon qu’une droite pourrait représenter le sens général de la variation.

Cette droite d’ajustement peut être trouvée en utilisant la méthode des moindres carrés. Cette méthode permet de calculer les coefficients a et b avec les formules suivantes : Attach:nuage3.gif Δ

Les coefficients a et b peut être obtenu avec la fonction DROITEREG(plage_des_Y;plage_des_X)

  • Sélectionner un bloc de 2 cellules contiguës horizontalement
  • Entrer la formule avec DROITEREG
  • attention à placer les bonnes plages de cellules aux bons endroits
  • ne pas valider avec la touche ENTRÉE mais avec la combinaison de touches CTRL MAJ ENTRÉE
  • La valeur se trouvant à gauche sera le coefficient a et celle à droite sera le coefficient b.

Attach:nuage4.gif Δ

La droite et son équation peuvent être ajoutées au nuage de points :

  • Sélectionner le graphique
  • Choisir la commande Graphique / Insérer une courbe de tendance
  • Choisir le type Linéaire
  • Choisir l’option Afficher l'équation sur le graphique

On doit obtenir le résultat suivant :

Attach:nuageetdroite.png Δ

2.  Corrélation

2.1  Principe

L’analyse de corrélation mesure la "force" de l’interaction entre X et Y. Elle se fait au travers du calcul d’un coefficient de corrélation (r) dont la valeur donne des informations sur le lien entre les deux variables.

  • Si r est proche de +1, cela signifie que les deux variables sont très fortement corrélées et que si X augmente, Y augmente.
  • Si r est proche de 0, cela signifie qu’il n’existe aucune corrélation entre les deux variables, c’est à dire que les variations de X n’ont pas d’influences sur les variations de Y.
  • Si r est proche de -1, cela signifie que les deux variables sont très fortement corrélées et que si X augmente, Y diminue.

Ce coefficient r est calculé à partir de la formule suivante : Attach:coeffcorr.gif Δ

2.2  Coefficient de corrélation

Le calcul avec Excel se fait avec la fonction COEFFICIENT.CORRELATION

Si l'on reprend l'exemple utilisé pour la régression :

Attach:coeffcorr2.gif Δ

2.3  Représentation graphique

Le coefficient r ne peut pas être ajouté au nuage de points, par contre le coefficient de détermination (r²) peut être affiché :

  • Sélectionner le graphique représentant le nuage de points
  • Choisir la commande Graphique / Insérer une courbe de tendance
  • Choisir l’option Afficher le coefficient de détermination sur le graphique

On obtient alors le résultat ci-dessous :

Attach:nuagedroiter2.png Δ


Powered by PmWiki
Licence Creative Commons