Reindeks Pand

Reindeks Pand



„W „pandach” możemy przechowywać wiele informacji w formie tabelarycznej, znanej również jako DataFrame. „Pandy” ułatwiają nam użycie metody „DataFrame()” do konstruowania DataFrame. DataFrame zawiera indeksy, a my możemy również zmieniać indeksy DataFrame za pomocą funkcji „pandy”. Metodą, której używamy do ponownego indeksowania DataFrame, jest metoda „reindex()”. Ta metoda pomaga w zmianie wartości indeksu wiersza, a także wartości indeksu kolumn. Korzystając z tej metody, możemy zmienić domyślny indeks DataFrame, a także możemy zmienić indeks, który ustawiliśmy podczas tworzenia DataFrame. Użyjemy metody „reindex()” w naszych przykładach „pand” w tym samouczku i szczegółowo wyjaśnimy tę koncepcję tutaj.

Przykład # 01

Narzędzie „Spyder” pomaga nam w tworzeniu kodu „pand” w tym samouczku, a nasz kod zaczynamy od słowa kluczowego „import”, które pomoże w zaimportowaniu funkcji „pandy”. Umieszczamy „pandy jako pd” po wpisaniu „import”. Następnie tworzymy DataFrame, wpisując „pd.DataFrame()”. Piszemy to „pd”, ponieważ „DataFrame()” to metoda „pand”. „value_df” to nazwa zmiennej, w której zapisana jest ramka DataFrame. Dodajemy „RandomName”, która jest nazwą kolumny, a „RandomName” zawiera „Thomas, Oscar, Lilly, Rowan, John, Bromley, Peter, Alexander i Samuel”.







Następnie mamy „Wartość_1”, w której wstawiliśmy „16, 29, 24, 35, 44, 50, 69, 74 i 88”. Następnie pojawia się „Wartość_2” i dodaliśmy „25, 38, 42, 56, 54, 65, 78, 89 i 99”. Teraz „Wartość_3” jest następna i umieszczamy w niej „36, 48, 52, 69, 74, 75, 87, 91 i 69”. Kolumna „Wartość_4” znajduje się po niej, w której wstawiliśmy „52, 64, 72, 88, 82, 95, 97, 21 i 39”. Ostatnia kolumna to kolumna „Wartość_5”, a w tej kolumnie dodane przez nas wartości to „66, 78, 82, 99, 34, 45, 57, 61 i 89”. Następnie używamy funkcji „print()”, w której dodaje się „Values_df”. Zostanie wydrukowany na terminalu.




Po naciśnięciu „Shift+Enter” możemy łatwo uzyskać wynik naszych kodów w aplikacji „Spyder”. W tym przypadku ten kod zwraca ramkę DataFrame z indeksem domyślnym. Teraz zastosujemy metodę „reindex()” do ponownego indeksowania tego DataFrame w „pandach”.




Funkcja „reindex()” jest tutaj używana do ponownego indeksowania wartości indeksu wiersza. W powyższym DataFrame widać, że wyświetlane są domyślne wartości indeksu wiersza, a teraz stosujemy metodę „reindex()” do ponownego indeksowania tych indeksów wiersza. Umieszczamy nazwę DataFrame, a następnie metodę „reindex()”, w której umieszczamy te wartości indeksu, które chcemy dodać do powyższego DataFrame. Wstawiamy „ind_A, ind_B, ind_C, ind_D, ind_E, ind_F, ind_G, ind_H i ind_I” w funkcji „reindex()”. Tak więc indeksy tych wierszy zostaną zaktualizowane w DataFrame, gdy wykonamy ten kod.






Wartości indeksu wiersza są wyświetlane w tym wyniku i można zauważyć, że wartości DataFrame nie są tutaj wyświetlane, a pojawiły się wartości „NaN”. Dzieje się tak, ponieważ nowe wartości indeksów nie pasują do poprzednich wartości indeksów DataFrame. Gdy nowy indeks i stary indeks nie pasują do siebie, wyświetla się tam „Nan”. Te wartości „NaN” pojawiają się domyślnie, gdy zmieniamy indeks i nie są one zgodne z poprzednim indeksem.



Przykład # 02

Zmieniamy teraz wartości indeksu kolumny „Value_df”, które stworzyliśmy wcześniej w przykładzie 1. Po wydrukowaniu „Value_df”, wstawiamy zmienną „columna” i dodajemy do niej pewne wartości. Dodajemy „a_1, b_1, c_1, d_1 i e_1”. Teraz chcemy dostosować te wartości jako indeks kolumn, więc w tym celu używamy metody „reindex()” i umieszczamy nazwę zmiennej „column”, w której przechowywane są nowe wartości indeksu kolumn i ustaw również „oś” na „kolumny”, aby zaktualizować indeks osi kolumny. Wstawiamy metodę „reindex()” w „print()”, więc będzie ona również renderowana na terminalu.


Ponieważ zastosowaliśmy metodę „reindex()”, wartości indeksu kolumn, które są obecne w pierwszym DataFrame są aktualizowane, a nowe wartości są dodawane w zaktualizowanym DataFrame. Możesz również zauważyć, że wszystkie wartości DataFrame są konwertowane na „NaN”, ponieważ obie wartości indeksów kolumn są różne.

Przykład nr 03

„Programming_data” w tym kodzie zawiera „P_Languages”, do którego dodaliśmy „JavaScript, CSS, Web Engineering, OOP, C#, AI, Java i JavaScript”. Następnie mamy „Godziny”, w których umieszczamy „4_godz., 2_godz., 3_godz., 7_godz., 6_godz., 5_godz., 8_godz. i 6_godz.”. Następnie wprowadza się „P_Code” i wstawiamy „11523, 12423, 12321, 11456, 11454, 12267, 13106 i 14123”. Dodajemy zmienną „p_index” i umieszczamy „Pro_A, Pro_B, Pro_C, Pro_D, Pro_E, Pro_F, Pro_G i Pro_H”.

Te wartości będą używane jako wartości indeksów wierszy. Zmieniamy „Programming_data” w DataFrame „Programming_df”. Do tej ramki DataFrame dodajemy również „p_index” za pomocą metody „index”. Wstawiamy metodę „Programming_df”, a następnie „index” i przypisujemy do niej „p_index”. Teraz powyższe wartości indeksu są dodawane jako wartości indeksu wierszy do DataFrame. Drukujemy również „Programming_df”.

Następnie dodajemy kilka nowych wartości indeksu w zmiennej „new_index”, a są to „P_1, P_2, P_3, P_4, P_5, P_6, P_7 i P_8”. Ponieważ chcemy zaktualizować wartości indeksów wierszy, używamy metody „reindex()” i wpisujemy „new_index” jako parametr tej funkcji, a także przechowujemy zaktualizowaną ramkę DataFrame w „newProgramming_df” i umieszczamy „newProgramming_df” w „ print()” do wyświetlania.


Wartości indeksów są aktualizowane i możemy również powiedzieć, że ponownie zindeksowaliśmy utworzony przez nas DataFrame. Wszystkie wartości DataFrame są również konwertowane na „NaN”, ponieważ obie wartości indeksu są różne.

Przykład # 04

Obecnie zmieniamy wartości indeksu „Programming_df” dla kolumn, które wcześniej opracowaliśmy w przykładzie 3. Umieszczamy zmienną „kolumna” i wstawiamy do niej nowe wartości. Zmienne „P_Code, P_Languages, Hours i New” są dodawane do zmiennej „column”. Następnie ponownie używamy metody „reindex()”, w której ustawiamy zmienną „column”, która zaktualizuje poprzednie wartości indeksu kolumny i doda te nowe wartości indeksu kolumny do DataFrame.

Tutaj możesz zauważyć, że nowe wartości, które dodaliśmy w „kolumnie” są takie same, jak dodaliśmy w powyższym DataFrame, ale sekwencja jest inna, więc zmieni kolejność kolumn i dostosuje wszystkie kolumny tak, jak my wymienione w zmiennej „kolumna”. Ponadto dodajemy jeszcze jedną wartość indeksu, której nie ma w powyższym DataFrame, która jest tutaj „Nowa”, więc wartości „NaN” pojawią się w tej kolumnie.


Sekwencja kolumn jest tutaj zmieniana, a wszystkie wartości pojawiają się tak, jak są obecne w oryginalnych kolumnach DataFrame, a kolumna 'Nowa' w zaktualizowanej DataFrame zawiera wszystkie wartości 'NaN', ponieważ ta kolumna nie występuje w oryginalnej DataFrame.

Wniosek

Przedstawiliśmy ten samouczek, który pomaga nam szczegółowo zrozumieć pojęcie „reindeksowania pand”. Omówiliśmy, jak możemy ponownie zindeksować kolumnę DataFrame, a także wartości indeksu wiersza. Wyjaśniliśmy, że do tego służy funkcja „reindex()” pand. Zrobiliśmy różne przykłady, w których zmieniliśmy wartości indeksów wierszy DataFrame, a także wartości indeksów indeksu kolumn DataFrame. Wyrenderowaliśmy wyniki wszystkich kodów, które zrobiliśmy w tym samouczku, a także szczegółowo je wyjaśniliśmy.