Dans ce tutoriel, vous allez apprendre à créer des tableaux de données, utiliser des
formules pour calculer des moyennes et modéliser vos données et à faire des graphiques avec une ligne de régression.
Connexion à Microsoft Live (sautez cette étape si vous Connexion à Microsoft Live (sautez cette étape si vous avez Excel) avez Excel)
Allez à https://onedrive.live.com/et connectez-vous sur le compte que vous avez créez dans le premier tutoriel.
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Créer un nouveau fichier Créer un nouveau fichier
Cette fois-ci, nous allons créer un fichier vide et y mettre nous-même des données.
Dans OneDrive, cliquez sur Nouveau et sélectionnez "Classeur Excel" pour créer un nouveau fichier.
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Insérer les données Insérer les données
Sélectionnez la première cellule du tableur et écrivez "Ventes de voitures en Inde en fonction du produit national brut".
Pressez sur "Return" ou "Enter" pour aller à la cellule du dessous et écrivez les entêtes des colonnes dans des cellules côte à côte: année, PNB, voitures (en millions). Pour changer de cellule, pressez "Tab".
Continuez de la sorte et recopiez les données du tableau dans limage ci-dessous.
Calculer la moyenne du PNB (1) Calculer la moyenne du PNB (1)
Nous voulons tout d'abord calculer la moyenne du PNB en Inde entre 2011 et 2016.
Pour cela, cliquez dans la cellule B11 et écrivez "=MOYENNE(" (sans les guillemets!).
N'oubliez pas d'écrire le signe "=" au début de la formule.
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Sélectionnez ensuite avec la souris les cellules contenant les PNB. La référence des cellules sélectionnées vient s'afficher dans la cellule. Écrivez ensuite ")" pour fermer la parenthèse. Vous devriez avoir dans la cellule:
=MOYENNE(B3:B8)
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Calculer la moyenne du PNB (2) Calculer la moyenne du PNB (2)
Pressez sur la touche Return ou Enter : la moyenne des nombres sélectionnés est affichée dans la cellule. Cliquez sur la cellule à gauche de celle-ci et écrivez Moyenne pour étiquetter la cellule.
Remarques sur les formules Remarques sur les formules
Quand vous écrivez "=" dans une cellule, vous indiquez au tableur que vous voulez écrire une formule. Les formules vous permettent de faire des calculs avec les cellules du tableur. Par exemple, la formule utilisée dans les deux étapes précédentes vous permet de calculer la moyenne des cellules sélectionnées.
Les choses à savoir pour utiliser les formules sont
1. Il faut écrire = dans une cellule pour entrer dans l'éditeur de formule.
2. Dans ce mode, si vous cliquez sur une cellule, la référence de cette cellule s'affiche dans la formule. Une cellule est dénominée par sa colonne et sa ligne par exemple la cellule B2 est la cellule contenant l'entête "PNB".
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
3. Si vous sélectionnez un groupe de cellules, la référence à ce groupe s'affiche dans la formule.
4. Il y a plus de 100 fonctions à disposition que vous pouvez utiliser dans vos formules.
Pour les découvrir, cliquez sur fx (en haut à gauche de l'écran). Ceci ouvre un dialogue avec la liste des fonctions et des explications pour chaque fonction.
5. Vous pouvez également utiliser les fonctions arithmétiques dans vos formules (+, -, *, /).
6. Si vous avez fait une erreur pendant l'édition d'une formule, vous pouvez annuler vos modifications en cliquant sur la croix tout à droite de la ligne d'édition de formule en haut du tableur.
Consignes:
1. Pour comprendre les formules, le mieux est de les exercer. Amusez-vous donc à créer quelques fonctions dans des cellules quelconques sous le tableau de données.
Par exemple:
Calculer 3*(4+5) =3*(4+5) 27
Nombre total de voitures vendues =SOMME(C3:C8) 16.236
Remarque: La fonction SOMME additionne les cellules sélectionnées.
PNB total - moyenne du PNB * nombre d'années
=SOMME(B3:B8)-B11*NB(B3:B8) 0
Remarque: La fonction NB compte le nombre de cellules sélectionnées.
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Somme des nombres sur la 3ème ligne =SOMME(A3:C3) 2019.
83
Nombre maximal sur la 4ème ligne =MAX(A4:C4) 2012
Remarque: La fonction MAX retourne la valeur de la cellule la plus grande.
2. Cliquez sur fx et explorez toutes les fonctions dans la catégorie "Les plus utilisées"
en cliquant sur les noms de fonction à tour de rôle et en lisant les descriptions.
Sélectionnez également la catégorie "Tout" et regardez la diversité des fonctions à votre disposition.
Copie d'une formule (1) Copie d'une formule (1)
Nous souhaitons maintenant connaître la moyenne du nombre de voitures vendues par année. Pour cela, on veut copier la formule de la moyenne du PNB. Cliquez tout
d'abord sur la cellule contenant la moyenne du PNB. La cellule s'entoure d'un rectangle vert et a un tout petit carré vert dans le coin inférieur droit de la cellule.
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Cliquez sur ce carré et glissez sur la droite de manière à recouvrir la cellule d'à côté.
Remarque: si vous saisissez correctement le petit carré, le curseur de la souris doit changer en une croix fine.
Copie d'une formule (2) Copie d'une formule (2)
Relâchez la souris: la cellule sous la colonne du nombre de voitures affiche maintenant la moyenne du nombre de voitures (2.706).
Remarque: Si vous n'obtenez pas le résultat escompté, vous n'avez probablement pas copié correctement la formule. Répétez l'opération en cliquant exactement sur le petit carré et en vérifiant que le curseur de la souris s'est transformé en une croix fine.
Double-cliquez ensuite sur la cellule C11 pour afficher la formule copiée: les cellules sélectionnées pour faire la moyenne sont les cellules dans la colonne des voitures.
Ainsi, en déplaçant la formule d'une case vers la droite, les cellules référencées par la formule (c'est-à-dire les cellules de la colonne PNB) se sont également déplacées d'une case vers la droite (cellules du nombre de voitures).
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Ceci est un principe important quand vous copiez des formules. Les cellules référencées se déplacent également. On parle de référence relative: la place de la cellule référencée est relative à la place de la formule.
Comparez les formules des deux cases B11 et C11 et prenez note des différences dans les cellules référencées.
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Copie d'une formule sur une colonne (1) Copie d'une formule sur une colonne (1)
Une formule peut également être copiée sur toutes les cellules d'une colonne.
Imaginons qu'on aimerait calculer le rapport du nombre de voitures et du PNB. Écrivez
"voitures/PNB" au haut de la quatrième colonne pour étiquetter la colonne, puis écriver la formule "=C3/B3" dans la cellule au-dessous. Remarque: à la place de taper C3 et B3, vous pouvez cliquer sur les cellules correspondantes du nombre de voiture et du PNB sur la même ligne.
Copie d'une formule sur une colonne (2) Copie d'une formule sur une colonne (2)
Pressez "return" ou "enter" pour afficher le résultat du calcul (0.424194). Copiez ensuite la cellule contenant la formule dans les 5 cellules du dessous de la manière suivante:
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
1. Cliquez sur la cellule contenant la formule pour que le rectangle avec le petit carré vert apparaisse.
2. Cliquez sur le petit rectangle et glissez sur toutes les cellules de la colonnes jusqu'à la ligne 8. Rappel: si vous saisissez correctement le carré, le curseur de la souris doit changer en une croix fine.
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Copie d'une formule sur une colonne (3) Copie d'une formule sur une colonne (3)
Relâchez la souris: le rapport entre le nombre de voitures et le PNB doit être affiché maintenant dans la colonne.
Si vous n'obtenez pas le résultat escompté, vous n'avez probablement pas copié correctement la formule. Répétez l'opération en cliquant exactement sur le petit carré et en vérifiant que le curseur de la souris s'est transformé en une croix fine.
Copie d'une formule sur une colonne avec une Copie d'une formule sur une colonne avec une référence absolue (1) référence absolue (1)
Les références relatives donnent beaucoup de puissance à la manipulation de
formules, car ça nous permet de reproduire le comportement d'une formule rapidement sur toute une colonne de nombre. Cependant, parfois on aimerait qu'une formule fasse toujours référence à la même cellule. Pour cela, il existe des références absolues à des cellules qui ne se déplacent pas avec la formule.
Imaginons qu'on souhaite calculer le nombre de pneus. Pour cela, on veut multiplier le nombre de voitures par 4. On pourrait bien sûr mettre le nombre de pneu directement
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
dans la formule, mais on décide de l'écrire dans une cellule séparée et de multiplier le nombre de voiture par cette cellule.
Écrivez dans la cellule A12 "pneus" et dans la cellule B12 le nombre 4. Étiquettez la colonne E avec "nb pneus", puis écrivez dans la cellule E3 "=D3*B12". Cette formule multiplie le nombre de voitures par le contenu de la cellule B12 (c'est-à-dire 4) pour afficher le nombre de pneus.
Pressez sur return ou enter et vérifiez que vous obtenez 1.696774 .
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Copie d'une formule sur une colonne avec une Copie d'une formule sur une colonne avec une référence absolue (2) référence absolue (2)
Copiez la formule sur toutes les cellules de la colonne. Vérifiez que vous obtenez 0 dans toutes les cellules à la place du nombre de pneus.
Que s'est-il passé? Sélectionnez une des cellules où vous avez copié la cellule
originale. La cellule référencée du nombre de voiture s'est déplacée vers le bas, ce que l'on voulait, mais la cellule du nombre de pneus s'est également déplacée vers le bas, ce qu'on ne voulait pas!
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Copie d'une formule sur une colonne avec une Copie d'une formule sur une colonne avec une référence absolue (3) référence absolue (3)
Pour corriger la formule, entrez dans la cellule E3 la formule suivante "=D3*$B$12". Le signe "$" avant le B et le 12 indique que la colonne et la ligne de la cellule sont fixés quand la formule est copiée. On appelle ça une référence absolue à la cellule B12.
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Copie d'une formule sur une colonne avec une Copie d'une formule sur une colonne avec une référence absolue (4) référence absolue (4)
Copiez la formule sur toutes les cellules de la colonne et vérifiez que cette fois-ci, les cellules affichent correctement le nombre de pneus. Sélectionnez une des cellules où vous avez copié la formule et vérifiez que la référence à la cellule B12 n'a pas été modifiée, bien que la référence au nombre de voiture s'est déplacée.
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Création d'un graphique du nombre de voitures en Création d'un graphique du nombre de voitures en fonction du PNB (1) fonction du PNB (1)
On veut étudier la relation entre le nombre de voitures et le PNB et pour cela, on veut faire un graphique du nombre de voitures en fonction du PNB.
Sélectionnez les colonnes de nombres du PNB et du nombre de voitures, cliquez sur
"Insertion" et sélectionnez Nuage de points avec marqueurs uniquement.
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Création d'un graphique du nombre de voitures en Création d'un graphique du nombre de voitures en fonction du PNB (2) fonction du PNB (2)
Cliquez sur le graphique s'il n'est pas sélectionné. Sélectionnez le menu Graphique pour afficher la barre d'outils, puis cliquez sur Format.
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Création d'un graphique du nombre de voitures en Création d'un graphique du nombre de voitures en fonction du PNB (3) fonction du PNB (3)
Ceci va afficher un dialogue sur la droite de l'écran où vous pouvez modifier les axes du graphique. Cliquez sur "Horizontal Axe" et écrivez "5" dans le champ minimum.
Cliquez ensuite de nouveau sur Horizontal Axe pour fermer le contenu, puis cliquez sur Vertical Axe. Écrivez 2 dans le champ minimum.
Vérifiez maintenant que sur le graphique, l'abscisse va de 5 à 8.5 et l'ordonnée de 2 à 3.2 .
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Création d'un graphique du nombre de voitures en Création d'un graphique du nombre de voitures en fonction du PNB (4) fonction du PNB (4)
Sélectionnez de nouveau graphique, cliquez sur Titre du graphique, puis sélectionnez
"Modifier le titre du graphique".
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Création d'un graphique du nombre de voitures en Création d'un graphique du nombre de voitures en fonction du PNB (5) fonction du PNB (5)
Écrivez dans le dialogue le nouveau titre "Nombre de voitures en fonction du PNB" et cliquez sur OK.
Remarque: si vous ne voyez pas l'option Graphique dans le menu, vous devez cliquez sur le graphique pour le sélectionner.
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Création d'un graphique du nombre de voitures en Création d'un graphique du nombre de voitures en fonction du PNB (6) fonction du PNB (6)
Sélectionnez Graphique -> Titres des axes -> titre de l'axe horizontal principal ->
Modifier le titre de l'axe horizontal et écrivez "Nombre de voiture (en millions)" dans la dialogue. Procédez de même pour l'axe vertical et écrivez "PNB" comme titre de l'axe.
Sélectionnez ensuite Graphique -> Légende -> Aucun (désactiver la légende).
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Création d'un graphique du nombre de voitures en Création d'un graphique du nombre de voitures en fonction du PNB (7) fonction du PNB (7)
Le graphique est terminé. Vérifiez que vous obtenez le résultat ci-dessous.
Facultatif: Modélisation de la relation entre le nombre Facultatif: Modélisation de la relation entre le nombre de voitures et le PNB (1) de voitures et le PNB (1)
Le reste de ce tutoriel est facultatif et montre comment on peut modéliser des données avec une droite. Cette partie n'est pas nécessaire pour faire la fiche d'exercice.
---
Une tâche importante dans l'analyse de données est de modéliser les données. Une bonne modélisation permet de faire des prédictions sur la base des données.
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Dans la nature (en physique, économie, biologie, etc.), on rencontre très souvent des relations linéaires entre des variables. Dans le graphique ci-dessus, on observe également que les données se trouvent approximativement sur une droite.
Pour pouvoir prédire le nombre de voitures qui vont être vendues en fonction du PNB, on veut trouver une droite de "best fit", c'est-à-dire la droite la mieux ajustée aux données.
Deux fonctions d'Excel peuvent nous aider à trouver cette droite: la fonction PENTE et ORDONNEE.ORIGINE qui trouvent la pente et l'ordonnée à l'origine de la meilleure droite passant par une collection de points.
Pour calculer la pente, cliquez sur la cellule B14 sous le tableau de nombre, écrivez
"=PENTE(", puis sélectionnez les nombres dans la colonne du nombre de voiture (c'est-à-dire les nombre correspondant à l'ordonnée du graphique). Écrivez ";" dans la formule, puis sélectionnez les nombres dans la colonne du PNB. Écrivez finalement ")".
La formule finale doit être "=PENTE(C3:C8;B3:B8)" .
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Modélisation de la relation entre le nombre de voitures Modélisation de la relation entre le nombre de voitures et le PNB (2) et le PNB (2)
Pressez la touche return ou enter et vérifiez que vous trouvez une pente de 0.218588 . Procédez de même pour l'ordonnée à l'origine avec la formule
"=ORDONNEE.ORIGINE(C3:C8;B3:B8)" dans la cellule B15 et vérifiez que vous obtenez une ordonnée à l'orogine de 1.25494 .
Étiquettez les cellules pour la pente et l'ordonnée à l'origine en écrivant "pente" et
"ordonnée à l'origine" dans les cellules à gauche.
Remarque: quand vous calculez la pente ou l'ordonnée à l'origine d'un tableau de données, faites attention au fait que vous devez d'abord spécifier les valeurs
correspondant à l'ordonnée (les "y") et après les données correspondant à l'abscisse (les "x"). Il est facile de se tromper!
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Affichage de la droite de régression (1) Affichage de la droite de régression (1)
Quand on trouve la meilleure droite pour modéliser des données, on dit qu'on fait une régression linéaire. La pente et l'ordonnée à l'origine trouvées ci-dessus indiquent qu'on peut modéliser les données avec une fonction affine du type y = 0.219 x + 1.255 , où y représente le nombre de voitures et x représente le PNB.
On voudrait maintenant faire un graphique avec nos données du nombre de voitures sous la forme d'un nuage de points et avec notre droite de régression linéaire. Si vous avez une version payante d'Excel, vous pouvez faire ça facilement en sélectionnant
"Ajouter une courbe de tendance" dans le menu contextuel du graphique qu'on a fait plus haut et en choisissant une courbe linéaire. Vous pouvez trouver des tutoriels sur internet pour cela.
Comme on utilise une version gratuite d'Excel, on va devoir travailler un peu plus.
Tout d'abord, insérez une colonne à la droite de la colonne du nombre de voiture en cliquant sur la colonne D pour la sélectionner, en faisant CTRL-click pour afficher le menu contextuel et en sélectionnant "Insérer des colonnes".
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Affichage de la droite de régression (2) Affichage de la droite de régression (2)
Écrivez l'étiquette "Modèle" dans l'entête de la colonne nouvellement créée, puis écrivez dans la première cellule la formule suivante: "=$B$14 * B3 + $B$15". Ceci représente l'équation de la droite de régression.
Attention aux signes $ à côté dans $B$14 et $B$15 qui indiquent que la référence à ces deux cellules est absolue.
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Affichage de la droite de régression (3) Affichage de la droite de régression (3)
Pressez return ou enter pour entrer la formule, puis copiez-là dans toutes les cellues de la colonne. Vérifiez que vous obtenez le résultat ci-dessous. Remarquez que les valeurs de cette colonne sont très proches des valeurs dans la colonne "nombre de voitures".
Ceci montre que c'est un bon modèle.
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Affichage de la droite de régression (4) Affichage de la droite de régression (4)
Créons maintenant un graphique avec les données et notre modèle. Pour cela,
sélectionnez avec la souris les nombres des trois colonnes PNB, voitures (en million) et modèle. Faites attention de ne pas sélectionner l'entête des colonnes!
Cliquez sur Insertion dans le menu pour afficher la barre d'outils, cliquez sur Nuage de points, puis sélectionnez "Nuage de points avec courbes lissées et marqueurs".
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Affichage de la droite de régression (5) Affichage de la droite de régression (5)
Modifiez le titre du graphique et des axes, désactivez la légende et changez l'échelle des axes de manière similaire à ci-dessus pour obtenir le résultat ci-dessous.
Utiliser Excel pour modéliser des Utiliser Excel pour modéliser des
données données
Affichage de la droite de régression (6) Affichage de la droite de régression (6)
Nous voulons maintenant cacher les points de la droite de régression linéaire et cacher les lignes des données. Pour cela, cliquez sur Graphique et sélectionnez "Format".
Dans le dialogue du format sur la droite de la fenêtre, cliquez sur "Série <<Série 1>>", cliquez sur Contour et sélectionnez le couleur blanche. La ligne que relie les données devrait disparaître.
Sélectionnez ensuite "Série <<Série 2>>", cliquez sur "Options de marqueur" et mettez une taille de marqueur minimale. Sélectionnez ensuite pour la couleur du contour et du remplissage des marqueurs la même couleur que la ligne de régression linéaire (orange sur mon graphique). Vous devriez obtenir le graphique voulu avec les points des
données (en bleu) et la droite de régression (en orange).