Comment exécuter la régression dans Excel
La régression dans Excel est un moyen d’automatiser le processus statistique de comparaison de groupes d’informations pour comprendre comment les modifications des variables indépendantes affectent les modifications des variables dépendantes. Si vous avez toujours voulu trouver une corrélation entre deux choses, l’utilisation de l’analyse de régression dans Excel est l’une des meilleures façons de le faire.
Les instructions de cet article s’appliquent à Excel 2019, Excel 2016, Excel 2013, Excel 2010.
Quel est le point de retour ?
La régression est une méthode de modélisation statistique que les analystes utilisent pour déterminer la relation entre plusieurs variables.
L’analyse de régression commence par la variable unique que vous essayez d’analyser et la variable indépendante que vous testez pour voir si elles affectent cette variable unique. Cette analyse examine les changements de variables indépendantes et tente de corréler ces changements avec les changements d’une seule variable (dépendante).
Cela ressemble à des statistiques avancées, mais Excel rend ce type d’analyse sophistiquée accessible à tous.
Effectuer une régression linéaire dans Excel
La forme la plus simple d’analyse de régression est la régression linéaire. La régression linéaire simple se concentre uniquement sur la relation entre deux variables.
Par exemple, la feuille de calcul suivante affiche des données contenant le nombre de calories qu’une personne consomme par jour et son poids pour la journée.
Étant donné que cette feuille de calcul contient deux colonnes de données et qu’une variable peut avoir un effet sur l’autre, vous pouvez utiliser Excel pour exécuter une analyse de régression sur ces données.
Activer le plug-in Analysis Toolkit
Avant d’utiliser les fonctionnalités d’analyse de régression d’Excel, vous devez activer le complément Analysis ToolPak dans l’écran Options Excel.
-
Dans Excel, sélectionnez document menu et sélectionnez Choix.
-
choisir Modules complémentaires dans le menu de navigation de gauche.Ensuite, assurez-vous Complément Excel sélectionné dans faire en sorte placer.
-
Enfin, choisissez va bouton.
-
dans la fenêtre contextuelle du complément.permettre Boîte à outils d’analyse Ajoutez une coche en cliquant sur la case devant et sélectionnez d’accord.
Maintenant que le ToolPak d’analyse est activé, vous êtes prêt à commencer à effectuer une analyse de régression dans Excel.
Comment effectuer une régression linéaire simple dans Excel
En prenant comme exemple la feuille de calcul du poids et des calories, vous pouvez effectuer l’analyse de régression linéaire suivante dans Excel.
-
choisir Les données menu.Puis dans analyser groupe, sélectionnez l’analyse des données.
-
à l’intérieur l’analyse des données fenêtre, sélectionnez retourner Cliquez dans la liste d’accord.
-
Ce Entrez la plage Y est la plage de cellules qui contient la variable dépendante. Dans cet exemple, c’est le poids.Ce Entrez la plage X est la plage de cellules contenant la variable indépendante. Dans cet exemple, il s’agit de la colonne des calories.
-
choisir Étiqueter Pour les cellules d’en-tête, sélectionnez nouvelle feuille de calcul Envoyez les résultats dans une nouvelle feuille de calcul.choisir d’accord Laissez Excel exécuter l’analyse et envoyer les résultats dans une nouvelle feuille de calcul.
-
Consultez la nouvelle feuille de travail. La sortie d’analyse a de nombreuses valeurs que vous devez connaître pour interpréter les résultats.
Chacun de ces nombres a les significations suivantes :
- plusieurs R: Coefficient de corrélation. 1 signifie qu’il existe une forte corrélation entre les deux variables, tandis que -1 signifie qu’il existe une forte corrélation négative. 0 signifie aucune corrélation.
- R Carré: Coefficient de détermination, qui montre combien de points entre deux variables tombent sur la droite de régression. Statistiquement, c’est la somme des écarts au carré par rapport à la moyenne.
- Carré R ajusté: Une statistique appelée R au carré, ajustée en fonction du nombre de variables indépendantes que vous choisissez.
- erreur standard: la précision des résultats de l’analyse de régression. Si cette erreur est petite, vos résultats de régression seront plus précis.
- Observé: Nombre d’observations dans le modèle de régression.
Les valeurs restantes dans la sortie de régression vous donnent des détails sur les plus petits composants de l’analyse de régression.
- df: Valeur statistique connue sous le nom de degrés de liberté associés à la source de variance.
- SS: somme des carrés. Si la plupart de vos données correspondent à la ligne de régression, le rapport de la somme résiduelle des carrés au total SS devrait être plus petit.
- Mademoiselle: Le carré moyen des données de régression.
- F: statistique F (test F) pour l’hypothèse nulle. D’où l’importance du modèle de régression.
- Signification F: Une statistique appelée valeur P de F.
Les valeurs au bas du résumé n’auront pas beaucoup de sens à moins que vous ne compreniez les statistiques et les modèles de régression informatique. Cependant, Multiple R et R Square sont les deux plus importants.
Comme vous pouvez le constater, les calories sont fortement corrélées au poids total dans cet exemple.
Analyse de régression linéaire multiple dans Excel
Pour effectuer la même régression linéaire mais avec plusieurs variables indépendantes, sélectionnez toute la plage (multi-colonnes et multi-lignes) Entrez la plage X.
Lorsque vous choisissez plusieurs variables indépendantes, il est peu probable que vous trouviez une corrélation aussi forte car il y a tellement de variables.
Cependant, l’analyse de régression dans Excel peut vous aider à trouver des corrélations avec une ou plusieurs variables dont vous ne réalisez peut-être pas qu’elles existent simplement en examinant les données manuellement.
Merci de nous en informer!
Dites-nous pourquoi !
D’autres détails ne sont pas assez difficiles à comprendre