Calculateur de Corrélation de Pearson

Analysez la relation linéaire entre deux ensembles de données.

Entrez deux ensembles de données pour calculer le coefficient de corrélation de Pearson (r), une mesure d'association linéaire. La calculatrice fournit également r-carré, covariance et d'autres statistiques clés.

Exemples Pratiques

Explorez différents scénarios pour comprendre comment fonctionne la corrélation de Pearson.

Forte Corrélation Positive

positive

Lorsqu'une variable augmente, l'autre variable tend à augmenter. Cet exemple montre une relation linéaire positive presque parfaite.

Valeurs X: 10, 20, 30, 40, 50

Valeurs Y: 15, 25, 35, 45, 55

Forte Corrélation Négative

negative

Lorsqu'une variable augmente, l'autre variable tend à diminuer. Cet exemple démontre une forte relation linéaire négative.

Valeurs X: 5, 10, 15, 20, 25

Valeurs Y: 50, 40, 30, 20, 10

Faible/Aucune Corrélation

weak

Il n'y a pas de relation linéaire claire entre les variables. Les points sont dispersés aléatoirement.

Valeurs X: 1, 5, 2, 8, 9, 4, 6, 7, 3, 10

Valeurs Y: 7, 2, 9, 4, 5, 1, 8, 3, 10, 6

Monde Réel : Heures d'Étude vs Score d'Examen

real_world

Un exemple éducatif classique explorant la relation entre les heures passées à étudier et les scores d'examen final.

Valeurs X: 2, 3, 5, 6, 8

Valeurs Y: 65, 70, 75, 80, 90

Autres titres
Comprendre le Coefficient de Corrélation de Pearson : Un Guide Complet
Plongez profondément dans l'une des mesures les plus courantes de corrélation linéaire en statistiques.

Qu'est-ce que le Coefficient de Corrélation de Pearson ?

  • Définir la Valeur 'r'
  • Interpréter l'Amplitude et le Signe du Coefficient
  • Hypothèses pour la Corrélation de Pearson
Le Coefficient de Corrélation de Pearson, noté 'r', est une mesure de la corrélation linéaire entre deux ensembles de données. C'est le rapport entre la covariance de deux variables et le produit de leurs écarts-types ; ainsi, c'est essentiellement une mesure normalisée de la covariance, de sorte que le résultat a toujours une valeur comprise entre -1 et 1.
Interpréter la Valeur 'r'
La valeur de 'r' indique à la fois la force et la direction de la relation. Un signe positif (+) signifie que lorsqu'une variable augmente, l'autre tend à augmenter (corrélation positive). Un signe négatif (-) signifie que lorsqu'une variable augmente, l'autre tend à diminuer (corrélation négative). La valeur absolue de 'r' indique la force de la relation. Une valeur de 1 ou -1 représente une relation linéaire parfaite, tandis qu'une valeur de 0 indique aucune relation linéaire.
Hypothèses Clés
Pour que le 'r' de Pearson soit une mesure valide, plusieurs hypothèses doivent être respectées : Linéarité (la relation doit être linéaire), Normalité (les variables doivent être normalement distribuées), et Homoscédasticité (la variance doit être cohérente).

Guide Étape par Étape pour Utiliser la Calculatrice

  • Saisie des Données
  • Calcul et Réinitialisation
  • Lecture des Résultats
Notre calculatrice simplifie le processus en quelques étapes faciles.
1. Saisie des Données
Vous verrez deux boîtes de saisie étiquetées 'Valeurs X' et 'Valeurs Y'. Entrez vos données numériques pour chaque variable dans la boîte correspondante. Assurez-vous que chaque nombre est séparé par une virgule. Il est crucial que les deux ensembles de données aient exactement le même nombre d'entrées.
2. Calcul
Une fois vos données saisies, cliquez sur le bouton 'Calculer'. L'outil traitera instantanément les informations et affichera les résultats ci-dessous.
3. Interpréter la Sortie
La section des résultats fournit une analyse détaillée, incluant le Coefficient de Pearson (r), le Coefficient de Détermination (r²), la taille de l'échantillon, les moyennes, les écarts-types et une interprétation en langage simple de ce que signifie la valeur 'r' pour vos données.

Applications Réelles de la Corrélation de Pearson

  • En Commerce et Économie
  • En Sciences Sociales et Psychologie
  • En Recherche Médicale et Biologique
La corrélation de Pearson est largement utilisée dans divers domaines pour découvrir des relations.
Finance et Économie
Les analystes l'utilisent pour mesurer la corrélation entre les mouvements de prix de deux actions différentes pour la diversification de portefeuille, ou pour voir comment un changement du taux d'intérêt affecte le marché boursier.
Psychologie
Les chercheurs pourraient tester la corrélation entre la quantité de temps d'écran et les niveaux d'anxiété chez les adolescents, ou la relation entre les scores de QI et la performance académique.
Recherche Médicale
Les scientifiques pourraient l'utiliser pour déterminer s'il y a une corrélation entre une dose spécifique de médicament et une réduction de la pression artérielle, ou entre les heures de sommeil et la réponse du système immunitaire.

Idées Fausses Courantes et Méthodes Correctes

  • Corrélation vs Causalité
  • L'Impact des Valeurs Abérrantes
  • Relations Non-Linéaires
La Corrélation N'Implique PAS la Causalité
C'est la règle la plus critique en statistiques. Le fait que deux variables soient fortement corrélées ne signifie pas que l'une cause l'autre. Il pourrait y avoir une troisième variable confuse influençant les deux. Par exemple, les ventes de crème glacée et les attaques de requins sont corrélées, mais la cause est une troisième variable : la chaleur.
L'Influence des Valeurs Abérrantes
Le coefficient de Pearson est sensible aux valeurs abérrantes. Un seul point de données qui est loin des autres peut dramatiquement altérer la valeur 'r', soit en la renforçant ou en l'affaiblissant. C'est toujours une bonne pratique de visualiser vos données avec un nuage de points pour identifier toute valeur aberrante.
Gérer les Relations Non-Linéaires
Le 'r' de Pearson ne mesure que les relations linéaires. Si la relation entre les variables est courbe (par exemple, en forme de U), le coefficient de Pearson pourrait être proche de 0, suggérant de manière trompeuse qu'il n'y a aucune relation. Dans de tels cas, d'autres méthodes de corrélation comme la corrélation de rang de Spearman pourraient être plus appropriées.

Formule Mathématique et Dérivation

  • La Formule de Corrélation d'Échantillon
  • Formule de Calcul
  • Exemple de Calcul Manuel
Pour ceux qui s'intéressent aux mathématiques derrière le calcul, la formule pour le coefficient de corrélation de Pearson d'échantillon (r) est : r = Σ((xi - x̄)(yi - ȳ)) / sqrt(Σ(xi - x̄)² * Σ(yi - ȳ)²).
Où :
'n' est la taille de l'échantillon, 'xi' et 'yi' sont les points d'échantillon individuels, 'x̄' est la moyenne des valeurs x, et 'ȳ' est la moyenne des valeurs y.
Formule de Calcul
Une formule plus directe et computationnellement plus simple est souvent utilisée : r = [n(Σxy) - (Σx)(Σy)] / sqrt([nΣx² - (Σx)²][nΣy² - (Σy)²]). Cette forme évite le besoin de calculer d'abord les moyennes et est souvent moins sujette aux erreurs d'arrondi lors du calcul manuel.