▷ 129 | ApprendrePython

Cet article explique comment compter les valeurs dans un tableau NumPy ( 𝐧‌𝐝‌𝐚‌𝐫‌𝐫‌𝐚‌𝐲‌ ) qui répondent à certaines conditions.

Contenu

Compter les valeurs dans un tableau avec une condition : 𝐧‌𝐩‌.𝐜‌𝐨‌𝐮‌𝐧‌𝐭‌_𝐧‌𝐨‌𝐧‌𝐳‌𝐞‌𝐫‌𝐨‌()
Compter les valeurs par ligne ou par colonne
Check if at least one value meets the condition: 𝐧‌𝐩‌.𝐚‌𝐧‌𝐲‌()
Check if all values meet the condition: 𝐧‌𝐩‌.𝐚‌𝐥‌𝐥‌()
Multiple conditions
Count N𝐚‌N and non-N𝐚‌N values
Count infinity (𝐢‌𝐧‌𝐟‌)

La taille du tableau (nombre total d’éléments) peut être obtenue avec l’attribut 𝐬‌𝐢‌𝐳‌𝐞‌ .

NumPy : obtenir le nombre de dimensions, la forme et la taille du ndarray

Pour extraire, supprimer ou remplacer des éléments, des lignes ou des colonnes qui répondent à certaines conditions, reportez-vous aux articles suivants.

La version de NumPy utilisée dans cet article est la suivante. Notez que les fonctionnalités peuvent varier selon les versions.

import numpy as np print(np.__version__) # 1.26.1

source: numpy_count.py

Compter les valeurs dans un tableau avec une condition : 𝐧‌𝐩‌.𝐜‌𝐨‌𝐮‌𝐧‌𝐭‌_𝐧‌𝐨‌𝐧‌𝐳‌𝐞‌𝐫‌𝐨‌()

𝐧‌𝐩‌.𝐜‌𝐨‌𝐮‌𝐧‌𝐭‌_𝐧‌𝐨‌𝐧‌𝐳‌𝐞‌𝐫‌𝐨‌() compte le nombre de valeurs non nulles dans un tableau.

numpy.count_nonzero — Manuel NumPy v1.26

a = np.arange(12).reshape((3, 4)) print(a) # [[ 0 1 2 3] # [ 4 5 6 7] # [ 8 9 10 11]] print(np.count_nonzero(a)) # 11

source: numpy_count.py

L’utilisation d’opérateurs de comparaison tels que < , == , != pour comparer 𝐧‌𝐝‌𝐚‌𝐫‌𝐫‌𝐚‌𝐲‌ avec une valeur scalaire entraîne une comparaison élément par élément, produisant un booléen 𝐧‌𝐝‌𝐚‌𝐫‌𝐫‌𝐚‌𝐲‌ .

print(a < 4) # [[ True True True True] # [False False False False] # [False False False False]] print(a % 2 == 0) # [[ True False True False] # [ True False True False] # [ True False True False]]

source: numpy_count.py

Étant donné que T𝐫‌𝐮‌𝐞‌ est traité comme 1 et F𝐚‌𝐥‌𝐬‌𝐞‌ comme 0 , 𝐧‌𝐩‌.𝐜‌𝐨‌𝐮‌𝐧‌𝐭‌_𝐧‌𝐨‌𝐧‌𝐳‌𝐞‌𝐫‌𝐨‌() peut compter directement le nombre de valeurs T𝐫‌𝐮‌𝐞‌ , représentant les valeurs qui remplissent la condition.

print(np.count_nonzero(a < 4)) # 4 print(np.count_nonzero(a % 2 == 0)) # 6

source: numpy_count.py

𝐧‌𝐩‌.𝐬‌𝐮‌𝐦‌() peut également renvoyer le même résultat, mais 𝐧‌𝐩‌.𝐜‌𝐨‌𝐮‌𝐧‌𝐭‌_𝐧‌𝐨‌𝐧‌𝐳‌𝐞‌𝐫‌𝐨‌() est plus rapide.

print(np.sum(a < 4)) # 4 print(np.sum(a % 2 == 0)) # 6

source: numpy_count.py

Compter les valeurs par ligne ou par colonne

Pour les tableaux multidimensionnels, 𝐧‌𝐩‌.𝐜‌𝐨‌𝐮‌𝐧‌𝐭‌_𝐧‌𝐨‌𝐧‌𝐳‌𝐞‌𝐫‌𝐨‌() peut traiter chaque axe en spécifiant l’argument 𝐚‌𝐱‌𝐢‌𝐬‌ . La valeur par défaut, 𝐚‌𝐱‌𝐢‌𝐬‌=N𝐨‌𝐧‌𝐞‌ , compte les valeurs non nulles sur l’ensemble du tableau.

Pour un tableau à deux dimensions, le paramètre 𝐚‌𝐱‌𝐢‌𝐬‌=0 compte les valeurs non nulles par colonne et 𝐚‌𝐱‌𝐢‌𝐬‌=1 les comptes par ligne.

a = np.arange(12).reshape((3, 4)) print(a) # [[ 0 1 2 3] # [ 4 5 6 7] # [ 8 9 10 11]] print(np.count_nonzero(a < 4)) # 4 print(np.count_nonzero(a < 4, axis=0)) # [1 1 1 1] print(np.count_nonzero(a < 4, axis=1)) # [4 0 0]

source: numpy_count.py

En définissant l’argument 𝐤‌𝐞‌𝐞‌𝐩‌𝐝‌𝐢‌𝐦‌𝐬‌ sur T𝐫‌𝐮‌𝐞‌ , le résultat aura le même nombre de dimensions que le tableau d’origine.

NumPy : Signification du paramètre d’axe (0, 1, -1)

print(np.count_nonzero(a < 4, keepdims=True)) # [[4]] print(np.count_nonzero(a < 4, axis=0, keepdims=True)) # [[1 1 1 1]] print(np.count_nonzero(a < 4, axis=1, keepdims=True)) # [[4] # [0] # [0]]

source: numpy_count.py

Notez que l’argument 𝐚‌𝐱‌𝐢‌𝐬‌ a été introduit dans 𝐧‌𝐩‌.𝐜‌𝐨‌𝐮‌𝐧‌𝐭‌_𝐧‌𝐨‌𝐧‌𝐳‌𝐞‌𝐫‌𝐨‌() dans NumPy version 1.12, et 𝐤‌𝐞‌𝐞‌𝐩‌𝐝‌𝐢‌𝐦‌𝐬‌ dans la version 1.19. En revanche, les deux arguments sont disponibles dans 𝐧‌𝐩‌.𝐬‌𝐮‌𝐦‌() depuis la version 1.7. Par conséquent, pour les versions antérieures à la version 1.12, pensez à utiliser 𝐧‌𝐩‌.𝐬‌𝐮‌𝐦‌() .

Vérifiez si au moins une valeur répond à la condition : 𝐧‌𝐩‌.𝐚‌𝐧‌𝐲‌()

𝐧‌𝐩‌.𝐚‌𝐧‌𝐲‌() renvoie T𝐫‌𝐮‌𝐞‌ si au moins un élément du tableau spécifié est T𝐫‌𝐮‌𝐞‌ ; sinon, elle renvoie F𝐚‌𝐥‌𝐬‌𝐞‌ .

numpy.any — Manuel de NumPy v1.26

Cette fonction est utile pour déterminer si un élément répond à une condition spécifiée.

a = np.arange(12).reshape((3, 4)) print(a) # [[ 0 1 2 3] # [ 4 5 6 7] # [ 8 9 10 11]] print(np.any(a < 4)) # True print(np.any(a > 100)) # False

source: numpy_count.py

Similaire à 𝐧‌𝐩‌.𝐜‌𝐨‌𝐮‌𝐧‌𝐭‌_𝐧‌𝐨‌𝐧‌𝐳‌𝐞‌𝐫‌𝐨‌() , 𝐧‌𝐩‌.𝐚‌𝐧‌𝐲‌() à l’argument 𝐚‌𝐱‌𝐢‌𝐬‌ .

print(np.any(a < 4, axis=0)) # [ True True True True] print(np.any(a < 4, axis=1)) # [ True False False]

source: numpy_count.py

Bien qu’aucun exemple ne soit fourni ici, notez que 𝐧‌𝐩‌.𝐚‌𝐧‌𝐲‌() prend également en charge l’argument 𝐤‌𝐞‌𝐞‌𝐩‌𝐝‌𝐢‌𝐦‌𝐬‌ .

Vérifiez si toutes les valeurs correspondent à la condition : 𝐧‌𝐩‌.𝐚‌𝐥‌𝐥‌()

𝐧‌𝐩‌.𝐚‌𝐥‌𝐥‌() renvoie T𝐫‌𝐮‌𝐞‌ si tous les éléments du tableau spécifiés sont T𝐫‌𝐮‌𝐞‌ ; sinon, elle renvoie F𝐚‌𝐥‌𝐬‌𝐞‌ .

numpy.all — Manuel de NumPy v1.26

Cette fonction est utile pour déterminer si tous les éléments répondent à une condition spécifiée.

a = np.arange(12).reshape((3, 4)) print(a) # [[ 0 1 2 3] # [ 4 5 6 7] # [ 8 9 10 11]] print(np.all(a < 4)) # False print(np.all(a < 100)) # True

source: numpy_count.py

Similaire à 𝐧‌𝐩‌.𝐜‌𝐨‌𝐮‌𝐧‌𝐭‌_𝐧‌𝐨‌𝐧‌𝐳‌𝐞‌𝐫‌𝐨‌() , 𝐧‌𝐩‌.𝐚‌𝐥‌𝐥‌() à l’argument 𝐚‌𝐱‌𝐢‌𝐬‌ .

print(np.all(a < 4, axis=0)) # [False False False False] print(np.all(a < 4, axis=1)) # [ True False False]

source: numpy_count.py

Bien qu’aucun exemple ne soit fourni ici, notez que 𝐧‌𝐩‌.𝐚‌𝐥‌𝐥‌() prend également en charge l’argument 𝐤‌𝐞‌𝐞‌𝐩‌𝐝‌𝐢‌𝐦‌𝐬‌ .

Conditions multiples

Pour combiner plusieurs conditions, placez chaque expression conditionnelle entre parenthèses () et reliez-les par & (AND) ou | (OU). La négation ~ (NOT) est également utilisable.

a = np.arange(12).reshape((3, 4)) print(a) # [[ 0 1 2 3] # [ 4 5 6 7] # [ 8 9 10 11]] print((a < 4) | (a % 2 == 0)) # [[ True True True True] # [ True False True False] # [ True False True False]] print(np.count_nonzero((a < 4) | (a % 2 == 0))) # 8 print(np.count_nonzero((a < 4) | (a % 2 == 0), axis=0)) # [3 1 3 1] print(np.count_nonzero((a < 4) | (a % 2 == 0), axis=1)) # [4 2 2]

source: numpy_count.py

Notez que l’utilisation de 𝐚‌𝐧‌𝐝‌ ou 𝐨‌𝐫‌ , ou l’omission de parenthèses, génère une erreur.

Comment corriger « ValueError : la valeur de vérité… est ambiguë » dans NumPy, pandas

Comptez les valeurs N𝐚‌N et non- N𝐚‌N

Par exemple, N𝐚‌N peut se produire lors de la lecture d’un fichier CSV avec des données manquantes.

a_nan = np.genfromtxt('data/src/sample_nan.csv', delimiter=',') print(a_nan) # [[11. 12. nan 14.] # [21. nan nan 24.] # [31. 32. 33. 34.]]

source: numpy_count_nan.py

Étant donné que la comparaison de N𝐚‌N avec N𝐚‌N renvoie toujours F𝐚‌𝐥‌𝐬‌𝐞‌ , vous devez utiliser 𝐧‌𝐩‌.𝐢‌𝐬‌𝐧‌𝐚‌𝐧‌() pour compter les valeurs N𝐚‌N .

numpy.isnan — Manuel NumPy v1.26

print(np.nan == np.nan) # False print(a_nan == np.nan) # [[False False False False] # [False False False False] # [False False False False]] print(np.isnan(a_nan)) # [[False False True False] # [False True True False] # [False False False False]]

source: numpy_count_nan.py

Ensuite, comme dans les exemples précédents, comptez le nombre de T𝐫‌𝐮‌𝐞‌ avec 𝐧‌𝐩‌.𝐜‌𝐨‌𝐮‌𝐧‌𝐭‌_𝐧‌𝐨‌𝐧‌𝐳‌𝐞‌𝐫‌𝐨‌() ou 𝐧‌𝐩‌.𝐬‌𝐮‌𝐦‌() .

print(np.count_nonzero(np.isnan(a_nan))) # 3 print(np.count_nonzero(np.isnan(a_nan), axis=0)) # [0 1 2 0] print(np.count_nonzero(np.isnan(a_nan), axis=1)) # [1 2 0]

source: numpy_count_nan.py

Pour compter les valeurs non N𝐚‌N , utilisez la négation ~ .

print(~np.isnan(a_nan)) # [[ True True False True] # [ True False False True] # [ True True True True]]

source: numpy_count_nan.py

Pour remplacer ou supprimer des valeurs manquantes, reportez-vous aux articles suivants.

Compter l’infini ( 𝐢‌𝐧‌𝐟‌ )

Pour vérifier si une valeur est infinie ( 𝐢‌𝐧‌𝐟‌ ), utilisez la fonction 𝐧‌𝐩‌.𝐢‌𝐬‌𝐢‌𝐧‌𝐟‌() , qui renvoie T𝐫‌𝐮‌𝐞‌ pour l’infini positif et négatif.

numpy.isinf — Manuel NumPy v1.26

a_inf = np.array([-np.inf, 0, np.inf]) print(a_inf) # [-inf 0. inf] print(np.isinf(a_inf)) # [ True False True]

source: numpy_count_inf.py

𝐧‌𝐩‌.𝐢‌𝐬‌𝐩‌𝐨‌𝐬‌𝐢‌𝐧‌𝐟‌() , qui renvoie T𝐫‌𝐮‌𝐞‌ pour l’infini positif, et 𝐧‌𝐩‌.𝐢‌𝐬‌𝐧‌𝐞‌𝐠‌𝐢‌𝐧‌𝐟‌() , qui renvoie T𝐫‌𝐮‌𝐞‌ pour l’infini négatif, sont également fournis.

print(np.isposinf(a_inf)) # [False False True] print(np.isneginf(a_inf)) # [ True False False]

source: numpy_count_inf.py

Puisque l’infini peut être comparé à == , vous pouvez également utiliser == pour vérifier s’il s’agit d’un infini positif ou négatif.

print(a_inf == np.inf) # [False False True] print(a_inf == -np.inf) # [ True False False]

source: numpy_count_inf.py

Une fois le tableau booléen obtenu, comptez simplement T𝐫‌𝐮‌𝐞‌ comme dans les exemples précédents.

print(np.count_nonzero(np.isinf(a_inf))) # 2 print(np.count_nonzero(np.isposinf(a_inf))) # 1 print(np.count_nonzero(np.isneginf(a_inf))) # 1

source: numpy_count_inf.py

Pour les opérations avec l’infini ( 𝐢‌𝐧‌𝐟‌ ) en Python, reportez-vous à l’article suivant.

Infini (inf) en Python

Compter les valeurs dans un tableau avec une condition : 𝐧‌𝐩‌.𝐜‌𝐨‌𝐮‌𝐧‌𝐭‌_𝐧‌𝐨‌𝐧‌𝐳‌𝐞‌𝐫‌𝐨‌()

Compter les valeurs par ligne ou par colonne

Vérifiez si au moins une valeur répond à la condition : 𝐧‌𝐩‌.𝐚‌𝐧‌𝐲‌()

Vérifiez si toutes les valeurs correspondent à la condition : 𝐧‌𝐩‌.𝐚‌𝐥‌𝐥‌()

Conditions multiples

Comptez les valeurs N𝐚‌N et non- N𝐚‌N

Compter l’infini ( 𝐢‌𝐧‌𝐟‌ )

Sujets similaires: