Unikalna ramka danych Pandy

Unikalna Ramka Danych Pandy



Najpopularniejszą biblioteką Pythona, która jest wykorzystywana w nauce o danych, jest Pandas. Oferuje programistom Pythona wydajne, przyjazne dla użytkownika narzędzia do analizy danych. Gdy zrozumiesz podstawowe funkcje i jak z nich korzystać, Pandas jest potężnym narzędziem do zmiany danych. W „pandach” standardowymi metodami przechowywania danych w formie tabelarycznej są DataFrames. Możemy wykorzystać niektóre metody „pand”, aby uzyskać unikalne wartości w kolumnie DataFrame „pandy”. Gdy potrzebujemy uzyskać unikalne wartości w kolumnach DataFrame i nie chcemy duplikować wartości w kolumnie DataFrame „pandy”, możemy użyć metod, które zapewnia „pandy”. Przyjrzyjmy się takim metodom w tym przewodniku, wraz z kilkoma przykładami i danymi wyjściowymi, aby uzyskać unikalne wartości w kolumnie DataFrame „pandy”.

Metody uzyskiwania unikalnych wartości w kolumnach DataFrame „pand”

Możemy wykorzystać dwie metody uzyskania unikalnych wartości w kolumnach DataFrame „pand”. Usuwamy zduplikowane wartości i uzyskujemy tylko unikalne wartości w kolumnach DataFrames. Metody, które „pandy” zapewniają do wykonania tego zadania, to:







  • Korzystając z metody unique().
  • Korzystając z metody drop_dupliactes().

Teraz wykorzystamy obie metody w kodach „pand” w celu uzyskania unikalnych wartości w kolumnach DataFrame „pand”.



Przykład # 01

Aplikacja „Spyder” jest tutaj wykorzystywana do generowania tych kodów „pand” w celu wykorzystania tych metod, które pomagają nam uzyskać unikalne wartości w kolumnach DataFrame „pand”. Musimy zaimportować moduły „pand”, które są niezbędne dla kodu „pand”, przed utworzeniem DataFrame. Używając terminu „import” i umieszczając „pandy jako pd”, importujemy te moduły.



Teraz za pomocą „pd” możemy szybko uzyskać funkcje lub metody „pand”. Następnie umieszczamy „Temat_dane”, w którym dodajemy „Imię”, a w „Nazwie” dodajemy dane imienia, które są „Roman, William, Peter, Smith, John, Milli, Thomas i James”. Następnie dodajemy dane tematu w „Temat”, którymi są „Matematyka, Ekonomia, Nauka, Matematyka, Statystyka, Statystyka, Statystyka i Komputer”. Następnie konwertujemy te „Subject_data” na DataFrame „Subject_df” za pomocą metody „pd.DataFrame()”. Umieszczamy „Subject_df” w metodzie „print()”, aby wyświetliła się na terminalu.





Teraz chcemy uzyskać unikalne wartości w kolumnie „Pandy” DataFrame „Subj”. W tym celu używamy tutaj metody „unique()” i dodajemy nazwę kolumny, a także nazwę DataFrame, jak pokazano poniżej. Dodajemy tę metodę w „print()”, aby wynik był również widoczny na terminalu.



Teraz naciskamy „Shift+Enter”, aby uzyskać wynik tego kodu, który renderuje się na terminalu i jest również pokazany tutaj, który zawiera DataFrame ze wszystkimi wartościami. To jest oryginalna ramka DataFrame, którą dodaliśmy w kodzie, a poniżej wyświetla unikalne wartości kolumny „Subj”. Upuszcza zduplikowane wartości i wyświetla unikalne wartości kolumny „Subj” w DataFrame.

Przykład # 02

Tworzymy „Przykładową listę”, która zawiera pewne informacje. Wstawiamy „Layla, 21, 28, 31, 14 i 39”, które pojawią się jako pierwsza kolumna, gdy przekonwertujemy tę listę do DataFrame. Następnie dodajemy „Lusy, 31, 25, 34, 26 i 21” jako drugi wiersz DataFrame. Następnie mamy „Piotr, 38, 20, 20, 35 i 24” oraz „Layla 38, 23, 39 24, 23”, które będą trzecim i czwartym wierszem DataFrame. Wstawiamy jeszcze trzy dane, które są „Stella, 21, 24, 24, 28, 31”, „Layla, 33, 32, 26, 30, 25” oraz „Piotr, 21, 21, 31, 21, 29” .

Teraz konwertujemy 'Sample_list' na 'DF_Sample', która jest nazwą DataFrame tutaj, umieszczając funkcję 'pd.DataFrame()'. Ustawiamy również nazwy kolumn tego DataFrame i te nazwy to „Nazwa, Ass_1, Ass_2, Ass_3, Ass_4 i Ass_5”. Następnie używamy „print()”, która pomaga w wyświetlaniu ramki DataFrame „DF_Sample”. Teraz używamy innej metody w tym przykładzie, aby uzyskać unikalne wartości w kolumnie DataFrame. Ta metoda to metoda „drop_duplicates()” dla „pand”.

W metodzie „drop_duplicates()” ustawiamy nazwę kolumny, w której chcemy uzyskać unikalne wartości w kolumnie DataFrame. Uzyskujemy unikalne wartości kolumny „Nazwa”, upuszczając zduplikowane wartości w tej kolumnie za pomocą metody „drop_duplicates()”, a także renderując te unikalne wartości za pomocą funkcji „print()”.

Zduplikowane nazwy są usuwane, a unikatowe wartości są renderowane po zastosowaniu metody „drop_duplicates()”. Możesz zauważyć, że nazwa „Layla” pojawia się w trzech komórkach kolumny „Nazwa”. Ale po zastosowaniu metody „drop_duplicates()” do tej kolumny wszystkie zduplikowane wartości są usuwane, a na ekranie pojawia się jedna nazwa „Layla”. Po upuszczeniu zduplikowanych wartości pojawiła się nowa DataFrame, która zawiera unikalne wartości w tej kolumnie „Nazwa”. W ten sposób możemy usunąć zduplikowane wartości i uzyskać unikalną wartość w kolumnie DataFrame za pomocą metody „drop_duplicates()”.

Przykład nr 03

Ta sama DataFrame jest ponownie używana, a teraz stosujemy tutaj metodę „unique()”. Za pomocą metody „unique()” umieszczamy nazwę kolumny oraz nazwę DataFrame, na której chcemy zastosować tę metodę „unique()” w celu uzyskania unikalnych wartości. Spowoduje to tylko wyrenderowanie unikalnych wartości tej kolumny i nie spowoduje wyświetlenia tych wartości w postaci DataFrame.

Tutaj DataFrame zawiera siedem wartości w kolumnie „Nazwa”, ale gdy zastosujemy metodę „unique()” do tej kolumny, pojawiły się tylko cztery wartości i są to unikalne wartości tej kolumny. Nie renderuje zduplikowanych wartości.

Przykład # 04

DataFrame, którą tworzymy w tym przykładzie, to „F_G_df”. Wstawiamy „Moje_owoce” i „moje_Warzywa” w tym DataFrame. Kolumna „Moje_owoce” zawiera „Jabłko, Pomarańcza, Jabłko, Gruszka, Liczi, Jabłko, Jabłko, Gruszka i Jabłko”. Następnie mamy „My_Vegs”, który zawiera nazwy warzyw, które są „Chilli, Bringle, Marchew, Ziemniak, Ziemniak, Marchewka, Cebula, Czosnek i Imbir”. Ta ramka DataFrame zawiera tylko dwie kolumny.

Teraz uzyskujemy unikalne wartości w obu kolumnach za pomocą metody „unique()”. Wspominamy o nazwie DataFrame. Następnie wpisz nazwę pierwszej kolumny kolumny. Następnie używamy metody append(). W tym dodatku ponownie umieszczamy nazwę DataFrame i nazwę drugiej kolumny oraz umieszczamy metodę „unique()”. Spowoduje to uzyskanie unikalnych wartości obu kolumn, a następnie dodanie unikalnych wartości obu kolumn i wyświetlenie ich na ekranie.

DataFrame jest renderowana jako pierwsza zawierająca wszystkie wartości. Następnie stosowana jest metoda „unique()”, a poniżej wyświetlane są unikalne wartości obu kolumn. W tym kodzie uzyskujemy unikalne wartości w wielu kolumnach DataFrame za pomocą metody „unique()”.

Wniosek

Pełne wyjaśnienie uzyskiwania unikalnych wartości w kolumnie DataFrame znajduje się w tym przewodniku. Omówiliśmy metody „unique()” i „drop_duplicates()”, które pomagają nam uzyskać unikalne wartości kolumny DataFrame. Zbadaliśmy, jak używać tych metod w kodzie „pand”, używając tych metod w naszych kodach. W tym przewodniku zilustrowaliśmy różne przykłady i pokazaliśmy, jak uzyskać unikalne wartości jednej kolumny za pomocą metody „unique()” oraz metody „drop_duplicates()”. Zbadaliśmy również, jak uzyskać unikalne wartości w wielu kolumnach, korzystając z metody „unique()” w tym przewodniku.