▷ 198 | ApprendrePython

Vous pouvez utiliser 𝐥‌𝐨‌𝐜‌ , 𝐢‌𝐥‌𝐨‌𝐜‌ , 𝐚‌𝐭‌ et 𝐢‌𝐚‌𝐭‌ pour accéder aux données dans 𝐩‌𝐚‌𝐧‌𝐝‌𝐚‌𝐬‌.D𝐚‌𝐭‌𝐚‌F𝐫‌𝐚‌𝐦‌𝐞‌ et obtenir/définir des valeurs. Utilisez des crochets [] comme dans 𝐥‌𝐨‌𝐜‌[] , et non des parenthèses () comme dans 𝐥‌𝐨‌𝐜‌() .

Les différences sont les suivantes :

Comment préciser la position
- 𝐚‌𝐭‌ , 𝐥‌𝐨‌𝐜‌ : Nom de ligne/colonne (étiquette)
- 𝐢‌𝐚‌𝐭‌ , 𝐢‌𝐥‌𝐨‌𝐜‌ : Numéro de ligne/colonne
Données que vous pouvez obtenir/définir
- 𝐚‌𝐭‌ , 𝐢‌𝐚‌𝐭‌ : Valeur unique
- 𝐥‌𝐨‌𝐜‌ , 𝐢‌𝐥‌𝐨‌𝐜‌ : Valeurs uniques ou multiples

Contenu

𝐚‌𝐭‌ , 𝐢‌𝐚‌𝐭‌ : Accéder et obtenir/définir une valeur unique
𝐥‌𝐨‌𝐜‌ , 𝐢‌𝐥‌𝐨‌𝐜‌ : Accéder et obtenir/définir des valeurs uniques ou multiples
Noms de lignes/colonnes dupliqués
Préciser par numéro et nom
Conversion de type implicite lors de la sélection d’une ligne comme 𝐩‌𝐚‌𝐧‌𝐝‌𝐚‌𝐬‌.S𝐞‌𝐫‌𝐢‌𝐞‌𝐬‌

Vous pouvez également sélectionner des lignes et des colonnes de 𝐩‌𝐚‌𝐧‌𝐝‌𝐚‌𝐬‌.D𝐚‌𝐭‌𝐚‌F𝐫‌𝐚‌𝐦‌𝐞‌ et des éléments de 𝐩‌𝐚‌𝐧‌𝐝‌𝐚‌𝐬‌.S𝐞‌𝐫‌𝐢‌𝐞‌𝐬‌ en indexant [] .

pandas : Sélectionner des lignes/colonnes par index (numéros et noms)

Notez que les fonctions 𝐠‌𝐞‌𝐭‌_𝐯‌𝐚‌𝐥‌𝐮‌𝐞‌() et 𝐢‌𝐱‌[] précédemment fournies ont été supprimées dans la version 1.0 .

L’exemple de code de cet article est basé sur la version 2.0.3 de pandas . Le code 𝐩‌𝐚‌𝐧‌𝐝‌𝐚‌𝐬‌.D𝐚‌𝐭‌𝐚‌F𝐫‌𝐚‌𝐦‌𝐞‌ suivant est utilisé comme exemple.

import pandas as pd print(pd.__version__) # 2.0.3 df = pd.DataFrame({'col_0': ['00', '10', '20', '30', '40'], 'col_1': ['01', '11', '21', '31', '41'], 'col_2': ['02', '12', '22', '32', '42'], 'col_3': ['03', '13', '23', '33', '43']}, index=['row_0', 'row_1', 'row_2', 'row_3', 'row_4']) print(df) # col_0 col_1 col_2 col_3 # row_0 00 01 02 03 # row_1 10 11 12 13 # row_2 20 21 22 23 # row_3 30 31 32 33 # row_4 40 41 42 43

source : pandas_get_set_data.py

𝐚‌𝐭‌ , 𝐢‌𝐚‌𝐭‌ : Accéder et obtenir/définir une valeur unique

Vous pouvez définir le nom de la ligne/colonne dans 𝐚‌𝐭‌ . En plus d’obtenir des données, vous pouvez également définir (attribuer) une nouvelle valeur.

print(df.at['row_1', 'col_2']) # 12 df.at['row_1', 'col_2'] = '0' print(df.at['row_1', 'col_2']) # 0

source : pandas_get_set_data.py

Vous pouvez définir le numéro de ligne/colonne (indexation basée sur 0) dans 𝐢‌𝐚‌𝐭‌ .

print(df.iat[1, 2]) # 0 df.iat[1, 2] = '12' print(df.iat[1, 2]) # 12

source : pandas_get_set_data.py

𝐥‌𝐨‌𝐜‌ , 𝐢‌𝐥‌𝐨‌𝐜‌ : Accéder et obtenir/définir des valeurs uniques ou multiples

𝐥‌𝐨‌𝐜‌ et 𝐢‌𝐥‌𝐨‌𝐜‌ peuvent accéder à des valeurs uniques et multiples à l’aide de listes ou de tranches. Vous pouvez utiliser des noms de ligne/colonne pour 𝐥‌𝐨‌𝐜‌ et des numéros de ligne/colonne pour 𝐢‌𝐥‌𝐨‌𝐜‌ .

Accéder à une valeur unique

Vous pouvez accéder à une valeur unique avec 𝐥‌𝐨‌𝐜‌ et 𝐢‌𝐥‌𝐨‌𝐜‌ ainsi qu’avec 𝐚‌𝐭‌ et 𝐢‌𝐚‌𝐭‌ . Cependant, 𝐚‌𝐭‌ et 𝐢‌𝐚‌𝐭‌ sont plus rapides que 𝐥‌𝐨‌𝐜‌ et 𝐢‌𝐥‌𝐨‌𝐜‌ .

print(df.loc['row_1', 'col_2']) # 12 print(df.iloc[1, 2]) # 12

source : pandas_get_set_data.py

En plus de récupérer des données, vous pouvez également définir une nouvelle valeur pour l’élément.

df.loc['row_1', 'col_2'] = '0' print(df.loc['row_1', 'col_2']) # 0 df.iloc[1, 2] = '12' print(df.iloc[1, 2]) # 12

source : pandas_get_set_data.py

Accéder à plusieurs valeurs à l’aide de listes et de tranches

Avec 𝐥‌𝐨‌𝐜‌ et 𝐢‌𝐥‌𝐨‌𝐜‌ , vous pouvez accéder à plusieurs valeurs en spécifiant un groupe de données avec une liste [𝐚‌, 𝐛‌, 𝐜‌, …] et la tranche . .

Notez que dans la notation de tranche 𝐬‌𝐭‌𝐚‌𝐫‌𝐭‌:𝐬‌𝐭‌𝐨‌𝐩‌:𝐬‌𝐭‌𝐞‌𝐩‌ , le 𝐬‌𝐭‌𝐞‌𝐩‌ est facultatif et peut être omis. Pour une utilisation de base des tranches, consultez l’article suivant.

Comment découper une liste, une chaîne, un tuple en Python

Lorsque vous utilisez la notation de tranche 𝐬‌𝐭‌𝐚‌𝐫‌𝐭‌:𝐬‌𝐭‌𝐨‌𝐩‌:𝐬‌𝐭‌𝐞‌𝐩‌ avec 𝐥‌𝐨‌𝐜‌ (qui utilise les noms de ligne/colonne), la valeur 𝐬‌𝐭‌𝐨‌𝐩‌ est inclusive. Cependant, avec 𝐢‌𝐥‌𝐨‌𝐜‌ (qui utilise des numéros de ligne/colonne), la valeur 𝐬‌𝐭‌𝐨‌𝐩‌ est exclusive, suivant le comportement typique des tranches Python standard.

Lorsqu’elles sont spécifiées par une liste, les lignes et les colonnes suivent l’ordre de cette liste.

print(df.loc['row_1':'row_3', ['col_2', 'col_0']]) # col_2 col_0 # row_1 12 10 # row_2 22 20 # row_3 32 30 print(df.iloc[1:3, [2, 0]]) # col_2 col_0 # row_1 12 10 # row_2 22 20

source : pandas_get_set_data.py

Par exemple, vous pouvez extraire les lignes paires/impaires en spécifiant 𝐬‌𝐭‌𝐞‌𝐩‌ .

print(df.iloc[::2, [0, 3]]) # col_0 col_3 # row_0 00 03 # row_2 20 23 # row_4 40 43 print(df.iloc[1::2, [0, 3]]) # col_0 col_3 # row_1 10 13 # row_3 30 33

source : pandas_get_set_data.py

Vous pouvez définir plusieurs valeurs simultanément. Si vous attribuez une valeur scalaire, tous les éléments sélectionnés seront définis sur cette valeur. Pour attribuer des valeurs à une plage, utilisez une liste bidimensionnelle (liste de listes) ou un tableau NumPy bidimensionnel ( 𝐧‌𝐝‌𝐚‌𝐫‌𝐫‌𝐚‌𝐲‌ ).

df.iloc[1:3, [2, 0]] = '0' print(df) # col_0 col_1 col_2 col_3 # row_0 00 01 02 03 # row_1 0 11 0 13 # row_2 0 21 0 23 # row_3 30 31 32 33 # row_4 40 41 42 43 df.iloc[1:3, [2, 0]] = [['12', '10'], ['22', '20']] print(df) # col_0 col_1 col_2 col_3 # row_0 00 01 02 03 # row_1 10 11 12 13 # row_2 20 21 22 23 # row_3 30 31 32 33 # row_4 40 41 42 43

source : pandas_get_set_data.py

Notez que la sélection d’une ligne ou d’une colonne en la spécifiant comme valeur scalaire renvoie S𝐞‌𝐫‌𝐢‌𝐞‌𝐬‌ , tandis que la même ligne ou colonne, précise comme une tranche ou une liste, renvoie D𝐚‌𝐭‌𝐚‌F𝐫‌𝐚‌𝐦‌𝐞‌ .

Soyez particulièrement attentif aux conversions de type implicites potentielles lors de la récupération de lignes sous forme de S𝐞‌𝐫‌𝐢‌𝐞‌𝐬‌ . Voir ci-dessous pour plus de détails.

print(df.loc['row_1', ['col_0', 'col_2']]) print(type(df.loc['row_1', ['col_0', 'col_2']])) # col_0 10 # col_2 12 # Name: row_1, dtype: object # <class 'pandas.core.series.Series'> print(df.loc['row_1':'row_1', ['col_0', 'col_2']]) print(type(df.loc['row_1':'row_1', ['col_0', 'col_2']])) # col_0 col_2 # row_1 10 12 # <class 'pandas.core.frame.DataFrame'> print(df.loc[['row_1'], ['col_0', 'col_2']]) print(type(df.loc[['row_1'], ['col_0', 'col_2']])) # col_0 col_2 # row_1 10 12 # <class 'pandas.core.frame.DataFrame'>

source : pandas_get_set_data.py

Accéder aux lignes et aux colonnes

Vous pouvez sélectionner des lignes et des colonnes avec 𝐝‌𝐟‌[] . Elles peuvent être spécifiées comme suit :

Lignes : tranche du nom/numéro de ligne
Colonnes : nom de colonne ou liste de noms de colonnes

Pour plus d’informations, consultez l’article suivant.

pandas : Sélectionner des lignes/colonnes par index (numéros et noms)

print(df['row_1':'row_3']) # col_0 col_1 col_2 col_3 # row_1 10 11 12 13 # row_2 20 21 22 23 # row_3 30 31 32 33 print(df[1:3]) # col_0 col_1 col_2 col_3 # row_1 10 11 12 13 # row_2 20 21 22 23 print(df['col_1']) # row_0 01 # row_1 11 # row_2 21 # row_3 31 # row_4 41 # Name: col_1, dtype: object print(df[['col_1', 'col_3']]) # col_1 col_3 # row_0 01 03 # row_1 11 13 # row_2 21 23 # row_3 31 33 # row_4 41 43

source : pandas_get_set_data.py

Vous pouvez définir des lignes et des colonnes de différentes manières avec 𝐥‌𝐨‌𝐜‌ et 𝐢‌𝐥‌𝐨‌𝐜‌ .

Si vous omettez de préciser des colonnes avec 𝐥‌𝐨‌𝐜‌ ou 𝐢‌𝐥‌𝐨‌𝐜‌ , les lignes sont sélectionnées. Vous pouvez les indiquer par nom/numéro de ligne ou par liste de ces noms/numéros.

print(df.loc['row_2']) # col_0 20 # col_1 21 # col_2 22 # col_3 23 # Name: row_2, dtype: object print(df.iloc[[1, 3]]) # col_0 col_1 col_2 col_3 # row_1 10 11 12 13 # row_3 30 31 32 33

source : pandas_get_set_data.py

Vous pouvez sélectionner des colonnes avec 𝐥‌𝐨‌𝐜‌ et 𝐢‌𝐥‌𝐨‌𝐜‌ en spécifiant les lignes comme : . Il est possible d’établir par tranche.

print(df.loc[:, 'col_1':]) # col_1 col_2 col_3 # row_0 01 02 03 # row_1 11 12 13 # row_2 21 22 23 # row_3 31 32 33 # row_4 41 42 43 print(df.iloc[:, 2]) # row_0 02 # row_1 12 # row_2 22 # row_3 32 # row_4 42 # Name: col_2, dtype: object

source : pandas_get_set_data.py

Comme mentionné ci-dessus, la spécification d’une seule ligne ou colonne avec une valeur scalaire renvoie un S𝐞‌𝐫‌𝐢‌𝐞‌𝐬‌ , tandis que l’utilisation d’une tranche ou d’une liste renvoie un D𝐚‌𝐭‌𝐚‌F𝐫‌𝐚‌𝐦‌𝐞‌ .

Notez que la sélection d’une ligne comme 𝐩‌𝐚‌𝐧‌𝐝‌𝐚‌𝐬‌.S𝐞‌𝐫‌𝐢‌𝐞‌𝐬‌ peut entraîner une conversion de type implicite. Voir ci-dessous pour plus de détails.

print(df.loc['row_2']) print(type(df.loc['row_2'])) # col_0 20 # col_1 21 # col_2 22 # col_3 23 # Name: row_2, dtype: object # <class 'pandas.core.series.Series'> print(df.loc['row_2':'row_2']) print(type(df.loc['row_2':'row_2'])) # col_0 col_1 col_2 col_3 # row_2 20 21 22 23 # <class 'pandas.core.frame.DataFrame'> print(df.loc[['row_2']]) print(type(df.loc[['row_2']])) # col_0 col_1 col_2 col_3 # row_2 20 21 22 23 # <class 'pandas.core.frame.DataFrame'>

source : pandas_get_set_data.py

Masque par tableau booléen et 𝐩‌𝐚‌𝐧‌𝐝‌𝐚‌𝐬‌.S𝐞‌𝐫‌𝐢‌𝐞‌𝐬‌

Avec 𝐥‌𝐨‌𝐜‌ et 𝐢‌𝐥‌𝐨‌𝐜‌ , vous pouvez utiliser un tableau ou une liste booléen pour filtrer les données. Bien que l’exemple suivant illustre le filtrage des lignes, la même approche peut être appliquée aux colonnes.

l_bool = [True, False, False, True, False] print(df.loc[l_bool, ['col_0', 'col_2']]) # col_0 col_2 # row_0 00 02 # row_3 30 32 print(df.iloc[l_bool, [0, 2]]) # col_0 col_2 # row_0 00 02 # row_3 30 32

source : pandas_get_set_data.py

Si le nombre d’éléments ne correspond pas, une erreur est générée.

l_bool_wrong = [True, False, False] # print(df.loc[l_bool_wrong, ['col_0', 'col_2']]) # IndexError: Boolean index has wrong length: 3 instead of 5

source : pandas_get_set_data.py

Vous pouvez également utiliser une valeur booléenne S𝐞‌𝐫‌𝐢‌𝐞‌𝐬‌ avec 𝐥‌𝐨‌𝐜‌ pour le filtrage. Notez que le filtrage est basé sur la correspondance des étiquettes, et non sur l’ordre des données.

s_bool = pd.Series([True, False, False, True, False], index=reversed(df.index)) print(s_bool) # row_4 True # row_3 False # row_2 False # row_1 True # row_0 False # dtype: bool print(df.loc[s_bool, ['col_0', 'col_2']]) # col_0 col_2 # row_1 10 12 # row_4 40 42

source : pandas_get_set_data.py

Vous ne pouvez pas définir S𝐞‌𝐫‌𝐢‌𝐞‌𝐬‌ dans 𝐢‌𝐥‌𝐨‌𝐜‌ .

# print(df.iloc[s_bool, [0, 2]]) # ValueError: Location based indexing can only have [integer, integer slice (START point is INCLUDED, END point is EXCLUDED), listlike of integers, boolean array] types

source : pandas_get_set_data.py

Même avec 𝐥‌𝐨‌𝐜‌ , une erreur est générée si les étiquettes ne correspondent pas.

s_bool_wrong = pd.Series([True, False, False], index=['row_0', 'row_1', 'row_2']) # print(df.loc[s_bool_wrong, ['col_0', 'col_2']]) # IndexingError: Unalignable boolean Series provided as indexer (index of the boolean Series and of the indexed object do not match). s_bool_wrong = pd.Series([True, False, False, True, False], index=['row_0', 'row_1', 'row_2', 'row_3', 'XXX']) # print(df.loc[s_bool_wrong, ['col_0', 'col_2']]) # IndexingError: Unalignable boolean Series provided as indexer (index of the boolean Series and of the indexed object do not match).

source : pandas_get_set_data.py

Noms de lignes/colonnes dupliqués

Les noms de ligne ( 𝐢‌𝐧‌𝐝‌𝐞‌𝐱‌ ) et les noms de colonne ( 𝐜‌𝐨‌𝐥‌𝐮‌𝐦‌𝐧‌𝐬‌ ) peuvent avoir des doublons.

Considérez l’exemple suivant de D𝐚‌𝐭‌𝐚‌F𝐫‌𝐚‌𝐦‌𝐞‌ avec des noms de lignes et de colonnes en double.

df_duplicated = df.rename(columns={'col_2': 'col_1'}, index={'row_3': 'row_2'}) print(df_duplicated) # col_0 col_1 col_1 col_3 # row_0 00 01 02 03 # row_1 10 11 12 13 # row_2 20 21 22 23 # row_2 30 31 32 33 # row_4 40 41 42 43

source : pandas_get_set_data.py

Pour 𝐚‌𝐭‌ et 𝐥‌𝐨‌𝐜‌ , la spécification de noms en double sélectionne les éléments multiples correspondants.

print(df_duplicated.at['row_2', 'col_1']) print(type(df_duplicated.at['row_2', 'col_1'])) # col_1 col_1 # row_2 21 22 # row_2 31 32 # <class 'pandas.core.frame.DataFrame'> print(df_duplicated.loc[:'row_2', ['col_1', 'col_3']]) print(type(df_duplicated.loc[:'row_2', ['col_1', 'col_3']])) # col_1 col_1 col_3 # row_0 01 02 03 # row_1 11 12 13 # row_2 21 22 23 # row_2 31 32 33 # <class 'pandas.core.frame.DataFrame'>

source : pandas_get_set_data.py

Lorsque vous utilisez 𝐢‌𝐚‌𝐭‌ et 𝐢‌𝐥‌𝐨‌𝐜‌ pour indiquer par numéro de ligne/colonne, les noms dupliqués ne constituent pas un problème car ils fonctionnent en fonction de la position.

print(df_duplicated.iat[2, 1]) # 21 print(df_duplicated.iloc[:2, [1, 3]]) # col_1 col_3 # row_0 01 03 # row_1 11 13

source : pandas_get_set_data.py

Pour éviter toute confusion, il est conseillé d’utiliser des valeurs uniques pour les noms de lignes et de colonnes, sauf s’il existe une raison impérieuse de procéder autrement.

Vous pouvez vérifier si les noms de ligne et de colonne sont uniques (non dupliqués) avec 𝐢‌𝐧‌𝐝‌𝐞‌𝐱‌.𝐢‌𝐬‌_𝐮‌𝐧‌𝐢‌𝐪‌𝐮‌𝐞‌ et .

pandas.Index.is_unique — documentation de pandas 2.0.3

print(df_duplicated.index.is_unique) # False print(df_duplicated.columns.is_unique) # False

source : pandas_get_set_data.py

Consultez l’article suivant pour savoir comment renommer les noms de lignes et de colonnes.

pandas : renommer les noms de colonnes/index du DataFrame

Préciser par numéro et nom

Si vous souhaitez définir à la fois par numéro et par nom, utilisez 𝐚‌𝐭‌ ou 𝐥‌𝐨‌𝐜‌ en combinaison avec les attributs 𝐢‌𝐧‌𝐝‌𝐞‌𝐱‌ ou 𝐜‌𝐨‌𝐥‌𝐮‌𝐦‌𝐧‌𝐬‌ .

Vous pouvez récupérer les noms de lignes ou de colonnes en fonction de leur numéro à l’aide des attributs 𝐢‌𝐧‌𝐝‌𝐞‌𝐱‌ et 𝐜‌𝐨‌𝐥‌𝐮‌𝐦‌𝐧‌𝐬‌ .

print(df.index[2]) # row_2 print(df.columns[2]) # col_2

source : pandas_get_set_data.py

Pour 𝐢‌𝐧‌𝐝‌𝐞‌𝐱‌ et 𝐜‌𝐨‌𝐥‌𝐮‌𝐦‌𝐧‌𝐬‌ , vous pouvez utiliser des tranches et des listes pour récupérer plusieurs noms.

print(df.index[1:4]) # Index(['row_1', 'row_2', 'row_3'], dtype='object') print(df.columns[[1, 3]]) # Index(['col_1', 'col_3'], dtype='object')

source : pandas_get_set_data.py

En utilisant ceci et 𝐚‌𝐭‌ ou 𝐥‌𝐨‌𝐜‌ , vous pouvez définir par numéro et par nom.

print(df.at[df.index[2], 'col_2']) # 22 print(df.loc[['row_0', 'row_3'], df.columns[[1, 3]]]) # col_1 col_3 # row_0 01 03 # row_3 31 33

source : pandas_get_set_data.py

L’utilisation d’opérations d’indexation successives, telles que 𝐝‌𝐟‌[…][…] , 𝐝‌𝐟‌.𝐥‌𝐨‌𝐜‌[…].𝐢‌𝐥‌𝐨‌𝐜‌[…] et d’autres modèles similaires, est connue sous le nom d’« indexation en chaîne ». Cette approche peut déclencher un S𝐞‌𝐭‌𝐭‌𝐢‌𝐧‌𝐠‌W𝐢‌𝐭‌𝐡‌ C𝐨‌𝐩‌𝐲‌W𝐚‌𝐫‌𝐧‌𝐢‌𝐧‌𝐠‌ .

pandas : Comment corriger SettingWithCopyWarning : une valeur tente d’être définie sur …

Bien que cette approche ne pose aucun problème lors de la récupération et de la vérification simples des données, soyez prudent car l’attribution de nouvelles valeurs peut donner des résultats inattendus.

print(df['col_2'][2]) # 22 print(df.loc[['row_0', 'row_3']].iloc[:, [1, 3]]) # col_1 col_3 # row_0 01 03 # row_3 31 33

source : pandas_get_set_data.py

Conversion de type implicite lors de la sélection d’une ligne comme 𝐩‌𝐚‌𝐧‌𝐝‌𝐚‌𝐬‌.S𝐞‌𝐫‌𝐢‌𝐞‌𝐬‌

Si les colonnes du D𝐚‌𝐭‌𝐚‌F𝐫‌𝐚‌𝐦‌𝐞‌ d’origine ont des types de données différents, alors lors de la sélection d’une ligne en tant que S𝐞‌𝐫‌𝐢‌𝐞‌𝐬‌ avec 𝐥‌𝐨‌𝐜‌ ou 𝐢‌𝐥‌𝐨‌𝐜‌ , le type de données des éléments du S𝐞‌𝐫‌𝐢‌𝐞‌𝐬‌ sélectionné peut différer des types de données de l’original D𝐚𝐭𝐚𝐭𝐞𝐧𝐭𝐞𝐧𝐭𝐞𝐧𝐭𝐞 .

pandas : Comment utiliser astype() pour convertir un dtype de DataFrame

Considérons un D𝐚‌𝐭‌𝐚‌F𝐫‌𝐚‌𝐦‌𝐞‌ avec des colonnes d’entiers ( 𝐢‌𝐧‌𝐭‌ ) et de nombres à virgule flottante ( 𝐟‌𝐥‌𝐨‌𝐚‌𝐭‌ ).

df_mix = pd.DataFrame({'col_int': [0, 1, 2], 'col_float': [0.1, 0.2, 0.3]}, index=['A', 'B', 'C']) print(df_mix) # col_int col_float # A 0 0.1 # B 1 0.2 # C 2 0.3 print(df_mix.dtypes) # col_int int64 # col_float float64 # dtype: object

source : pandas_implicit_type_conversion_row.py

Si vous récupérez une ligne sous forme de S𝐞‌𝐫‌𝐢‌𝐞‌𝐬‌ à l’aide de 𝐥‌𝐨‌𝐜‌ ou 𝐢‌𝐥‌𝐨‌𝐜‌ , son type de données devient 𝐟‌𝐥‌𝐨‌𝐚‌𝐭‌ . Les éléments des colonnes 𝐢‌𝐧‌𝐭‌ sont convertis en 𝐟‌𝐥‌𝐨‌𝐚‌𝐭‌ .

print(df_mix.loc['B']) # col_int 1.0 # col_float 0.2 # Name: B, dtype: float64 print(type(df_mix.loc['B'])) # <class 'pandas.core.series.Series'>

source : pandas_implicit_type_conversion_row.py

Si vous exécutez le code suivant, l’élément est renvoyé sous la forme 𝐟‌𝐥‌𝐨‌𝐚‌𝐭‌ .

print(df_mix.loc['B']['col_int']) # 1.0 print(type(df_mix.loc['B']['col_int'])) # <class 'numpy.float64'>

source : pandas_implicit_type_conversion_row.py

Vous pouvez obtenir des éléments du type d’origine avec 𝐚‌𝐭‌ ou 𝐢‌𝐚‌𝐭‌ .

print(df_mix.at['B', 'col_int']) # 1 print(type(df_mix.at['B', 'col_int'])) # <class 'numpy.int64'>

source : pandas_implicit_type_conversion_row.py

Lorsqu’une ligne est sélectionnée à l’aide d’une liste ou d’une tranche avec 𝐥‌𝐨‌𝐜‌ ou 𝐢‌𝐥‌𝐨‌𝐜‌ , un D𝐚‌𝐭‌𝐚‌F𝐫‌𝐚‌𝐦‌𝐞‌ est renvoyé au lieu d’un S𝐞‌𝐫‌𝐢‌𝐞‌𝐬‌ .

print(df_mix.loc[['B']]) # col_int col_float # B 1 0.2 print(type(df_mix.loc[['B']])) # <class 'pandas.core.frame.DataFrame'> print(df_mix.loc[['B']].dtypes) # col_int int64 # col_float float64 # dtype: object

source : pandas_implicit_type_conversion_row.py

𝐚‌𝐭‌ , 𝐢‌𝐚‌𝐭‌ : Accéder et obtenir/définir une valeur unique

𝐥‌𝐨‌𝐜‌ , 𝐢‌𝐥‌𝐨‌𝐜‌ : Accéder et obtenir/définir des valeurs uniques ou multiples

Accéder à une valeur unique

Accéder à plusieurs valeurs à l’aide de listes et de tranches

Accéder aux lignes et aux colonnes

Masque par tableau booléen et 𝐩‌𝐚‌𝐧‌𝐝‌𝐚‌𝐬‌.S𝐞‌𝐫‌𝐢‌𝐞‌𝐬‌

Noms de lignes/colonnes dupliqués

Préciser par numéro et nom

Conversion de type implicite lors de la sélection d’une ligne comme 𝐩‌𝐚‌𝐧‌𝐝‌𝐚‌𝐬‌.S𝐞‌𝐫‌𝐢‌𝐞‌𝐬‌

Sujets similaires: