Wyczyść ramkę danych w Pandach

Wyczysc Ramke Danych W Pandach



Usuwanie danych z Pandas DataFrame odbywa się za pomocą funkcji pandas.DataFrame.drop(). Oprócz tej funkcji możemy wybierać wiersze z DataFrame bez uwzględnienia kolumn/wierszy. Można to również zrobić za pomocą nawiasów kwadratowych. W tym przewodniku użyjemy również słowa kluczowego „del” i funkcji pop(), aby usunąć wszystkie wiersze poprzez iterację ramki DataFrame za pomocą pętli „for”.

Korzystanie z Pandas.DataFrame.Drop

Używamy funkcji pandas.DataFrame.drop() do usuwania określonych wierszy lub określonych kolumn z ramki Pandas DataFrame. Użyjmy tej funkcji, aby usunąć wszystkie wiersze i kolumny.

Składnia :







Poniżej przedstawiono składnię funkcji pandas.DataFrame.drop(). Wykorzystujemy tylko trzy parametry i omawiamy tylko te trzy w tym przewodniku. Istnieje szczegółowy samouczek dotyczący tej funkcji:



pandy. Ramka danych . upuszczać ( etykiety , , indeks , kolumny , poziom , w miejscu , błędy )
  1. Musimy przekazać listę indeksów wierszy do parametru „labels”, aby usunąć wszystkie wiersze z DataFrame. Możemy także przekazać atrybut DataFrame.index, który wybiera wszystkie indeksy wierszy. Podobnie musimy przekazać do tego parametru wszystkie nazwy kolumn lub przekazać właściwość DataFrame.columns.
  2. Ustaw parametr „oś” na 1, jeśli przekazujesz kolumny do parametru „etykiety”. Domyślnie oś = 0, która odnosi się do wierszy.
  3. Możemy wykonać operację (Usuń) na istniejącej ramce DataFrame. Ustaw parametr „inplace” na „True”.

Przykład 1:

Rozważ ramkę danych „Kampania 1” z czterema wierszami i dwiema kolumnami. Najpierw usuń wszystkie wiersze, przekazując indeksy wierszy do parametru „labels”, a następnie usuń wszystkie kolumny, przekazując etykiety kolumn do parametru „labels”.



import pandy

# Utwórz ramkę danych - Kampania 1 z 2 kolumnami i 4 rekordami
Kampania 1 = pandy. Ramka danych ( [ [ „obóz Java” , 'Indie' ] , [ „obóz linuksowy” , 'USA' ] , [ „obóz c/c++” , 'Indie' ] , [ „obóz Pythona” , 'USA' ] ] ,
kolumny = [ 'Nazwa kampanii' , 'Lokalizacja' ] )
wydrukować ( Kampania 1 , ' \N ' )

# Usuń wszystkie wiersze
Kampania 1. upuszczać ( etykiety = [ 0 , 1 , 2 , 3 ] , w miejscu = PRAWDA )
wydrukować ( Kampania 1 , ' \N ' )

# Usuń wszystkie kolumny
Kampania 1. upuszczać ( etykiety = [ 'Nazwa kampanii' , 'Lokalizacja' ] , w miejscu = PRAWDA , = 1 )
wydrukować ( Kampania 1 , ' \N ' )

Wyjście :





Po upuszczeniu wierszy wiersze są usuwane, ale kolumny istnieją. Po usunięciu kolumn „Kampania 1” jest pusta.



Przykład 2:

Wykorzystaj poprzednią ramkę danych „Campaign1” i upuść wiersze, przekazując „Campaign1.index” do parametru „labels”, a następnie upuść kolumny, przekazując „Campaign.columns” do parametru „labels”.

import pandy

# Utwórz ramkę danych - Kampania 1 z 2 kolumnami i 4 rekordami
Kampania 1 = pandy. Ramka danych ( [ [ „obóz Java” , 'Indie' ] , [ „obóz linuksowy” , 'USA' ] , [ „obóz c/c++” , 'Indie' ] , [ „obóz Pythona” , 'USA' ] ] ,
kolumny = [ 'Nazwa kampanii' , 'Lokalizacja' ] )
wydrukować ( Kampania 1 , ' \N ' )

# Usuń wszystkie wiersze
Kampania 1. upuszczać ( etykiety = Kampania 1. indeks , w miejscu = PRAWDA )

# Usuń wszystkie kolumny
Kampania 1. upuszczać ( etykiety = Kampania 1. kolumny , w miejscu = PRAWDA , = 1 )
wydrukować ( Kampania 1 )

Wyjście :

Po upuszczeniu wierszy wiersze są usuwane, ale kolumny istnieją. Po usunięciu kolumn „Kampania 1” jest pusta.

Korzystanie z Iloc[]

Właściwość pandas.DataFrame.iloc[] służy do wybierania danych na podstawie pozycji indeksu. Możemy wykorzystać tę właściwość, aby wybrać 0 wierszy i 0 kolumn z ramki DataFrame. Tutaj nie usuwamy rzeczywistej ramki DataFrame, ale wybierzemy 0 rekordów.

Składnia :

Najpierw musimy usunąć kolumny, a następnie wiersze.

  1. Wybierz 0 kolumn – DataFrame.iloc[:,0:0]
  2. Wybierz 0 wierszy – DataFrame.iloc[0:0]

Przykład :

Użyj tej samej ramki danych i wybierz pustą ramkę danych za pomocą właściwości iloc[].

import pandy

# Utwórz ramkę danych - Kampania 1 z 2 kolumnami i 4 rekordami
Kampania 1 = pandy. Ramka danych ( [ [ „obóz Java” , 'Indie' ] , [ „obóz linuksowy” , 'USA' ] , [ „obóz c/c++” , 'Indie' ] , [ „obóz Pythona” , 'USA' ] ] ,
kolumny = [ 'Nazwa kampanii' , 'Lokalizacja' ] )
wydrukować ( Kampania 1 , ' \N ' )

# Usuń wszystkie wiersze
Kampania 1. upuszczać ( etykiety = [ 0 , 1 , 2 , 3 ] , w miejscu = PRAWDA )
wydrukować ( Kampania 1 , ' \N ' )

# Usuń wszystkie kolumny
Kampania 1. upuszczać ( etykiety = [ 'Nazwa kampanii' , 'Lokalizacja' ] , w miejscu = PRAWDA , = 1 )
wydrukować ( Kampania 1 , ' \N ' )

Wyjście :

Używanie słowa kluczowego Del

Całe dane zostaną usunięte z ramki DataFrame za pomocą słowa kluczowego „del” poprzez iterację wszystkich wierszy w pętli „for”.

import pandy

# Utwórz DataFrame - Kampania 1 z 4 kolumnami i 4 rekordami
Kampania 1 = pandy. Ramka danych ( [ [ „obóz Java” , 'Indie' ] , [ „obóz linuksowy” , 'USA' ] , [ „obóz c/c++” , 'Indie' ] , [ „obóz Pythona” , 'USA' ] ] ,
kolumny = [ 'Nazwa kampanii' , 'Lokalizacja' ] )
wydrukować ( Kampania 1 , ' \N ' )

# Używanie słowa kluczowego del
Do I W Kampania 1:
z Kampania 1 [ I ]
wydrukować ( Kampania 1 )

Wyjście :

Teraz ramka danych jest pusta.

Korzystanie z funkcji Pop().

Całe dane zostaną usunięte z DataFrame za pomocą funkcji pop() poprzez iterację wszystkich wierszy wewnątrz pętli „for”. Ta funkcja jest określona wewnątrz pętli „for”.

import pandy

# Utwórz DataFrame - Kampania 1 z 4 kolumnami i 4 rekordami
Kampania 1 = pandy. Ramka danych ( [ [ „obóz Java” , 'Indie' ] , [ „obóz linuksowy” , 'USA' ] , [ „obóz c/c++” , 'Indie' ] , [ „obóz Pythona” , 'USA' ] ] ,
kolumny = [ 'Nazwa kampanii' , 'Lokalizacja' ] )
wydrukować ( Kampania 1 , ' \N ' )

# Używanie pop()
Do I W Kampania 1:
Kampania 1. Muzyka pop ( I )
wydrukować ( Kampania 1 )

Wyjście :

Teraz ramka danych jest pusta.

Wniosek

Dowiedzieliśmy się, jak wyczyścić ramkę danych Pandas, usuwając wiersze i kolumny. Najpierw usunęliśmy wiersze z ramki DataFrame za pomocą funkcji drop(), a następnie usunęliśmy kolumny po wykorzystaniu właściwości iloc[] do wybrania 0 wierszy. Na koniec omówiliśmy sposób usuwania rekordów z ramki DataFrame za pomocą słowa kluczowego „del” i funkcji pop().