Calculateur de Diagramme de Dispersion

Visualisez la corrélation des données et effectuez une analyse de régression.

Entrez vos points de données pour X et Y pour générer un diagramme de dispersion et calculer les métriques statistiques clés.

Exemples

Cliquez sur un exemple pour charger des données d'exemple et voir comment fonctionne le calculateur.

Corrélation Positive

positive-correlation

Lorsqu'une variable augmente, l'autre variable tend à augmenter.

Valeurs X: 1, 2, 3, 4, 5, 6

Valeurs Y: 2, 3.1, 4.2, 5, 6.1, 7.2

Âge vs Taille chez les Enfants

Corrélation Négative

negative-correlation

Lorsqu'une variable augmente, l'autre variable tend à diminuer.

Valeurs X: 10, 20, 30, 40, 50, 60

Valeurs Y: 100, 85, 70, 60, 45, 30

Vitesse vs Efficacité Énergétique

Aucune Corrélation

no-correlation

Il n'y a pas de relation apparente entre les deux variables.

Valeurs X: 1, 2, 3, 4, 5, 6, 7, 8

Valeurs Y: 5, -2, 8, 1, -5, 4, 0, 6

QI vs Taille de Chaussure

Données du Monde Réel

real-world-data

Un exemple du monde réel montrant une relation avec une certaine variabilité.

Valeurs X: 50, 60, 70, 80, 90, 100, 110, 120

Valeurs Y: 3.5, 4.2, 5.0, 4.8, 5.5, 6.1, 6.5, 7.0

Dépenses Publicitaires vs Revenus de Vente

Autres titres
Comprendre les Diagrammes de Dispersion et la Régression : Un Guide Complet
Un aperçu approfondi de la façon dont les diagrammes de dispersion visualisent les relations de données, permettant une meilleure analyse et prise de décision.

Qu'est-ce qu'un Diagramme de Dispersion ?

  • Définition et Objectif Principal
  • Composants Clés d'un Diagramme de Dispersion
  • Pourquoi Utiliser un Diagramme de Dispersion ?
Un diagramme de dispersion est un type de graphique utilisé pour afficher la relation entre deux variables numériques. Il consiste en une série de points tracés sur un axe horizontal et vertical. Chaque point du graphique représente les valeurs de deux variables pour une seule donnée, en faisant un outil essentiel pour visualiser les motifs et corrélations.
L'Anatomie d'un Diagramme de Dispersion
Un diagramme de dispersion standard a deux axes : l'axe X (horizontal) et l'axe Y (vertical). L'axe X représente généralement la variable indépendante, qui est la variable que vous croyez pourrait influencer l'autre. L'axe Y représente la variable dépendante, qui est la variable que vous mesurez. Le motif formé par la collection de ces points aide à identifier la relation entre les deux variables.

Cas d'Usage Courants

  • Dans la recherche médicale, pour voir s'il y a une relation entre le poids d'un patient et sa tension artérielle.
  • Dans les affaires, pour analyser la corrélation entre les dépenses publicitaires et les chiffres de vente.
  • Dans les sciences environnementales, pour tracer les changements de température contre les niveaux de pollution.

Guide Étape par Étape pour Utiliser le Calculateur de Diagramme de Dispersion

  • Saisir Vos Données
  • Personnaliser Votre Graphique
  • Interpréter les Résultats
1. Saisie des Données
Commencez par entrer vos données dans les champs 'Valeurs de l'Axe X' et 'Valeurs de l'Axe Y'. Vous pouvez séparer vos nombres avec des virgules, des espaces, ou une combinaison des deux. Assurez-vous d'avoir un nombre égal de valeurs X et Y, car chaque point est une paire.
2. Définition des Options de Graphique
Pour une meilleure lisibilité, vous pouvez ajouter un 'Titre du Graphique' et des étiquettes pour l'axe X et l'axe Y. Ce contexte est crucial pour quiconque essaie de comprendre votre graphique.
3. Calcul et Analyse
Une fois vos données saisies, cliquez sur le bouton 'Calculer'. L'outil générera instantanément le diagramme de dispersion et affichera une analyse statistique détaillée, incluant le coefficient de corrélation et l'équation de régression linéaire.

Interpréter la Sortie : Corrélation et Régression

  • Le Coefficient de Corrélation (r)
  • Le Coefficient de Détermination (R²)
  • La Ligne de Meilleur Ajustement
Comprendre le Coefficient de Corrélation (r)
Le coefficient de corrélation, noté 'r', est une valeur entre -1 et +1 qui mesure la force et la direction d'une relation linéaire entre deux variables. Une valeur de +1 indique une relation linéaire positive parfaite, -1 indique une relation linéaire négative parfaite, et 0 indique aucune relation linéaire.
Ce que R-Carré (R²) Vous Dit
R-carré, ou le coefficient de détermination, est la proportion de la variance dans la variable dépendante qui est prévisible à partir de la variable indépendante. Il varie de 0 à 1 (ou 0% à 100%). Un R² de 0,8 signifie que 80% de la variation dans les valeurs Y peut être expliquée par les valeurs X.
La Ligne de Meilleur Ajustement (Équation de Régression Linéaire)
L'équation 'y = mx + b' représente la ligne de meilleur ajustement. Cette ligne est tracée à travers les points de données pour exprimer au mieux leur relation. Le 'm' est la pente de la ligne, indiquant de combien Y change pour un changement d'une unité en X. Le 'b' est l'ordonnée à l'origine, qui est la valeur de Y quand X est 0.

Interprétations d'Exemple

  • r = 0,85 : Corrélation positive forte. Lorsque X augmente, Y tend fortement à augmenter.
  • r = -0,20 : Corrélation négative faible. Lorsque X augmente, il y a une légère tendance pour Y à diminuer.
  • R² = 0,64 : 64% de la variabilité en Y est expliquée par la variabilité en X.

Applications Réelles des Diagrammes de Dispersion

  • Économie et Finance
  • Santé et Médecine
  • Marketing et Ventes
Les diagrammes de dispersion ne sont pas seulement pour les mathématiciens ; ils sont utilisés dans d'innombrables domaines pour prendre des décisions éclairées.
Économie et Finance
Les analystes utilisent les diagrammes de dispersion pour trouver des tendances sur le marché, comme la relation entre la croissance du PIB et les rendements du marché boursier, ou les taux d'intérêt et l'inflation.
Santé et Médecine
Les chercheurs tracent des données pour trouver des corrélations entre les facteurs de mode de vie (comme l'alimentation ou l'exercice) et les résultats de santé (comme les maladies cardiaques ou l'espérance de vie).
Marketing et Ventes
Les entreprises analysent la connexion entre leurs dépenses marketing sur différents canaux et les données de vente correspondantes pour optimiser leurs budgets publicitaires.

Pièges Courants et Bonnes Pratiques

  • Corrélation vs Causalité
  • Le Danger des Valeurs Abérrantes
  • Assurer la Linéarité
La Corrélation n'est Pas la Causalité
C'est la règle la plus importante dans l'analyse statistique. Le fait que deux variables soient corrélées ne signifie pas que l'une cause l'autre. Il pourrait y avoir une troisième variable confuse en jeu. Par exemple, les ventes de crème glacée et les attaques de requins sont corrélées, mais les deux sont causées par une troisième variable : le temps chaud.
L'Impact des Valeurs Abérrantes
Les valeurs abérrantes sont des points de données qui sont loin des autres points de données. Elles peuvent avoir un impact significatif sur le coefficient de corrélation et la ligne de régression, potentiellement faussant vos résultats. Il est important d'identifier les valeurs abérrantes et de décider si les inclure dans votre analyse.
Supposer une Relation Linéaire
Un diagramme de dispersion est parfait pour identifier les relations linéaires. Cependant, si les points de données forment une courbe, une ligne de régression linéaire ne sera pas un bon ajustement. Dans de tels cas, d'autres formes de régression (par exemple, la régression polynomiale) pourraient être plus appropriées. Regardez toujours le graphique visuellement pour évaluer le motif.