1. Description de la méthode cov()
La méthode cov() de la bibliothèque numpy est utilisée pour calculer la covariance d'un ensemble de données. La covariance mesure la relation linéaire entre deux variables aléatoires.
Syntaxe de la méthode cov()
1 |
numpy.cov(m, y=None, rowvar=True, bias=False, ddof=None, fweights=None, aweights=None) |
- m : tableau des données. Chaque ligne représente une observation et chaque colonne représente une variable.
- y : tableau optionnel. Si y est fourni, il doit avoir la même longueur que m.
- rowvar : booléen optionnel. Si rowvar est True (par défaut), chaque ligne de m représente une variable. Si rowvar est False, chaque colonne de m représente une variable.
- bias : booléen optionnel. Si bias est True (par défaut), la covariance est calculée en divisant par n. Si bias est False, elle est calculée en divisant par n-1.
- ddof : int optionnel. Degré de liberté corrigé dans le calcul de la covariance. Par défaut, ddof est None, ce qui signifie que la correction est basée sur la valeur de bias.
- fweights : tableau optionnel. Poids pour chaque ligne de m. Par défaut, tous les poids sont égaux à 1.
- aweights : tableau optionnel. Poids pour chaque colonne de m. Par défaut, tous les poids sont égaux à 1.
- La méthode cov(): renvoie une matrice de covariance, qui est carrée et symétrique.
- La diagonale de cette matrice: représente la variance de chaque variable, et les éléments hors diagonale représentent les covariances entre chaque paire de variables.
2. Exemples d'usages de la méthode cov()
Voici un exemple simple d'utilisation de la méthode cov() de numpy :
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
import numpy as np # tableau de données data = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) # calcul de la matrice de covariance covariance_matrix = np.cov(data, rowvar=False) print("Matrice de covariance :") print(covariance_matrix) """ output: [[6. 6. 6.] [6. 6. 6.] [6. 6. 6.]] |
Dans cet exemple:
- Nous avons créé un tableau data: de 3 lignes et 3 colonnes.
- Nous avons ensuite appelé la méthode cov(): de numpy pour calculer la matrice de covariance de data.
- Enfin: nous avons affiché la matrice de covariance résultante à l'aide de la fonction print().
Remarque
Le paramètre rowvar est défini sur False pour indiquer que chaque colonne de data représente une variable. Par conséquent, la matrice de covariance renvoyée est également de taille 3x3, où les éléments diagonaux représentent les variances de chaque variable et les éléments hors diagonale représentent les covariances entre chaque paire de variables.
Comme nous avons utilisé des données simples dans cet exemple, la matrice de covariance ne montre pas de relation significative entre les variables. Dans un cas réel, cependant, la matrice de covariance peut être utilisée pour détecter des relations linéaires entre les variables et pour déterminer la direction et la force de ces relations.
Younes Derfoufi
CRMEF OUJDA
1 thought on “La méthode cov() de la bibliothèque numpy”