1. Description de la méthode plt.boxplot() matplotlib
La méthode plt.boxplot() de la bibliothèque Matplotlib en Python est utilisée pour créer des diagrammes en boîte, également connus sous le nom de boîtes à moustaches. Les diagrammes en boîte sont couramment utilisés pour visualiser la distribution des données et pour identifier les valeurs aberrantes (outliers) dans un ensemble de données numériques.
2. Syntaxe et usage de la méthode plt.boxplot()
Voici une description de la méthode plt.boxplot() :
1 2 3 4 5 6 |
plt.boxplot(x, notch=False, sym='b+', vert=True, whis=1.5, positions=None, widths=None, patch_artist=False, bootstrap=None, usermedians=None, conf_intervals=None, meanline=False, showmeans=False, showcaps=True, showbox=True, showfliers=True, boxprops=None, labels=None, flierprops=None, medianprops=None, meanprops=None, capprops=None, whiskerprops=None, manage_ticks=True, autorange=False, zorder=None) |
Les principaux paramètres de la méthode plt.boxplot() sont les suivants :
- x : Il s'agit de l'ensemble de données numériques que vous souhaitez visualiser à l'aide du diagramme en boîte. Vous pouvez fournir une liste, un tableau NumPy ou d'autres structures de données numériques.
- notch : Un booléen qui contrôle si une encoche (notch) est dessinée à la médiane du diagramme en boîte pour indiquer la confiance dans la médiane. Par défaut, il est défini sur False.
- sym : Le symbole utilisé pour représenter les valeurs aberrantes. Par défaut, il est défini sur 'b+'.
- vert : Un booléen qui contrôle l'orientation du diagramme en boîte. Si vert est True, le diagramme en boîte est orienté verticalement (par défaut). Si vert est False, le diagramme en boîte est orienté horizontalement.
- whis : Le facteur d'écart interquartile (IQR) utilisé pour déterminer la longueur des moustaches. Par défaut, il est défini sur 1,5.
- positions : Une liste de positions personnalisées pour placer les diagrammes en boîte le long de l'axe x. Par défaut, les positions sont automatiquement calculées.
- widths : La largeur des boîtes. Vous pouvez spécifier une valeur unique ou une liste de largeurs personnalisées.
- patch_artist : Un booléen qui contrôle si les éléments du diagramme en boîte doivent être représentés en tant qu'artistes (utile pour personnaliser les couleurs et les styles). Par défaut, il est défini sur False.
Plusieurs autres paramètres pour personnaliser l'apparence des éléments du diagramme en boîte, tels que les boîtes, les médianes, les moustaches, etc.
Le diagramme en boîte généré par plt.boxplot() comprend généralement une boîte centrale qui représente le premier quartile (Q1) au troisième quartile (Q3), une ligne médiane à l'intérieur de la boîte représentant la médiane, des moustaches qui s'étendent jusqu'aux valeurs extrêmes non considérées comme des valeurs aberrantes, et des points ou symboles pour indiquer les valeurs aberrantes potentielles.
3. Exemples d'usages de la méthode plt.plobox()
Voici quelques exemples d'utilisation qui illustrent différentes façons d'utiliser plt.boxplot() pour visualiser et comparer des données numériques à l'aide de diagrammes en boîte. Vous pouvez personnaliser davantage ces graphiques en ajustant les paramètres selon vos besoins spécifiques.
Exemple 1 : Diagramme en boîte simple avec des données aléatoires
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
import matplotlib.pyplot as plt import numpy as np """ Ici nous générons des données aléatoires et créons un diagramme en boîte simple pour visualiser leur distribution. """ # Génération de données aléatoires data = np.random.randn(100) # Création du diagramme en boîte plt.boxplot(data) # Affichage du graphique plt.show() |
Exemple 2 : Diagrammes en boîte multiples pour comparer plusieurs ensembles de données
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 |
import matplotlib.pyplot as plt import numpy as np """ Ici nous comparons trois ensembles de données différents en utilisant des diagrammes en boîte multiples. """ # Génération de données aléatoires pour trois groupes data1 = np.random.randn(100) data2 = np.random.randn(100) + 2 data3 = np.random.randn(100) - 2 # Création de diagrammes en boîte multiples plt.boxplot([data1, data2, data3], labels=['Groupe 1', 'Groupe 2', 'Groupe 3']) # Affichage du graphique plt.show() |
Exemple 3 : Diagramme en boîte horizontal avec personnalisation des couleurs
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
import matplotlib.pyplot as plt import numpy as np """ Ici nous créons un diagramme en boîte horizontal avec des boîtes colorées pour les éléments du diagramme en boîte. """ # Génération de données aléatoires data = np.random.randn(100) # Création d'un diagramme en boîte horizontal avec personnalisation des couleurs plt.boxplot(data, vert=False, patch_artist=True, boxprops={'facecolor': 'lightblue'}) # Affichage du graphique plt.show() |
Younes Derfoufi
CRMEF OUJDA