Pandy Insert() Kolumna

Pandy Insert Kolumna



„Python zapewnia szeroki zakres struktur danych i operacji do obsługi danych liczbowych i szeregów czasowych. DataFrame, którą stworzyliśmy lub zaimportowaliśmy w Pandas, może być używana do różnych celów. Kolumny w ramce danych można również dostosować wraz ze źródłem danych. Pandas upraszczają wiele żmudnych i czasochłonnych zadań związanych z pracą z danymi. Istnieją cztery sposoby dodania kolumny do DataFrame w Pandas, ale w tym artykule używamy funkcji kolumny pandy „insert()”.

Po zbudowaniu lub załadowaniu naszego DataFrame w Pandas, istnieje wiele rzeczy, które możemy chcieć osiągnąć. Na przykład możemy dalej manipulować danymi, na przykład zmieniając kolumny w ramce danych. Następnie musimy zrozumieć, jak umieszczać kolumny w ramce danych, jeśli większość danych pochodzi od jednego dostawcy danych, ale część danych pochodzi od innego. Kolumnę można łatwo dodać do ramki danych Pandas”.







Pandas insert() Metoda

Ostatnia kolumna ramki danych jest generowana przez inną funkcję. Korzystając z metody DataFrame „insert()”, możesz dodawać kolumny między bieżącymi kolumnami, zamiast dodawać je u dołu ramki DataFrame pandy. Daje nam możliwość dodania kolumny w dowolnym miejscu, a nie tylko na końcu. Dodatkowo oferuje wiele sposobów dodawania wartości dla kolumn. Gdy musisz dodać kolumnę w określonej pozycji lub indeksie, przydatna jest funkcja pandy „insert()”.



Składnia kolumny Pandas insert()



Przykład 1: Wstawianie kolumny do ramki danych za pomocą metody pandy insert()

Zacznij od pierwszego przykładu z artykułu, w którym wyjaśnimy, jak wstawić kolumnę do ramki danych. Korzystając z narzędzia „spyder”, możemy udowodnić ten kod. Najpierw generujemy ramkę danych o nazwie „kurs”. W tej ramce danych mamy dwie kolumny: „tytuł_kursu” i „opłata”. W kolumnie „course_title” mamy listę kursów „python”, „java”, „object_orientated” i „PHP”. W drugiej kolumnie „opłata” mamy listę opłat za kurs, która wynosi „30000”, „25000”, „15000” i „22000”. Wyświetlanie naszego dataFrame, „kurs”, za pomocą „pd. Ramka danych'.





Następnie omówimy główną funkcję kodu, którą jest kolumna pandy „insert()”. Jest to skuteczna metoda umieszczania nowej listy w ramce danych. Możesz dodać nową kolumnę w dowolnym określonym miejscu za pomocą metody wstawiania. Ta metoda pozwala również na ręczne dodanie kolumny do ramki danych, ale jest mniej możliwości dostosowania.

Przez cały czas wstawiania oznacza, że ​​źródłowa ramka DataFrame jest bezpośrednio aktualizowana podczas procesu i nie jest tworzona nowa ramka DataFrame. W tym przypadku dodaliśmy do naszej ramki danych nową kolumnę o nazwie „Czas_czasu trwania” za pomocą funkcji „insert()”. Lista wartości, które mamy w tej kolumnie to „6_miesięcy”, „3_miesięcy”, „3miesięcy” i „6_miesięcy”. W poniższym programie mamy kolumnę „Czas_czasu” z indeksem zdefiniowanym jako „2”. Ponieważ określony indeks zostanie określony, DataFrame otrzyma zakres, który zaczyna się od 0 i zwiększa się w krokach, co oznacza, że ​​ta kolumna jest wyświetlana jako trzecia kolumna w ramce danych. DataFrame dodaje nową kolumnę o nazwie „Time _duration” za pomocą funkcji „pd.insert()”.



A teraz omówmy wyjście programu z góry. Jego dane wyjściowe pokazują ramkę danych, która ma trzy kolumny. Dodatkowa kolumna jest dodawana na końcu ramki danych. Używając metody „pd.DataFrame.insert()”, możesz dodać kolumnę między innymi kolumnami zamiast dodawać je na końcu pandy DataFrame”.Time_ duration” to nowa kolumna, którą dodaliśmy za pomocą „wstawiania” funkcjonować. Pozycja „2” odnosi się do trzeciej kolumny w DataFrame, ponieważ pozycja zaczyna się od 0. Kolumna jest dodawana na ostatnim miejscu w ramce danych.

Przykład 2: Dodawanie kolumn do ramki danych przy użyciu funkcji pandy insert()

Użyjemy metody „insert()”, aby dodać nowe kolumny do ramki danych. Zamiast dodawać dodatkowe kolumny na końcu pand, możesz wstawić je między istniejące kolumny. Aby wygenerować ramkę danych podobną do poprzedniego przykładu, wzięliśmy trzy kolumny i przypisaliśmy im wartości. W pierwszej kolumnie „Imię” mamy listę nazwisk, która zawiera „Emma”, „Ella”, „Kowalski” i „Maxwell”. W drugiej kolumnie „Wiek” listę wartości mamy „29”, „36”, „39” i „33”.

Następnie drukujemy oświadczenie „DataFrame”. Ramkę danych pokażemy pod instrukcją „ramka danych”. Tworzymy jeszcze jedną kolumnę dla ramki danych Pandy za pomocą funkcji „insert()”. Należy utworzyć listę, aby można ją było dodać jako nową kolumnę do naszego podanego zbioru danych. Metoda „assign()” z pandy DataFrame może być również wykorzystana do dodania większej liczby kolumn. Wstawiamy nową kolumnę za pomocą „df. wstawić'. Dodatkowa kolumna o nazwie „Płeć” wyświetla płeć jako „mężczyzna” lub „kobieta”.

Wydrukujmy po prostu kolejne oświadczenie „Nowa ramka danych”. Nowa ramka danych będzie teraz prezentowana pod instrukcją „Nowa ramka danych”, zawierająca dodatkową kolumnę, którą dodaliśmy za pomocą „pd. wstaw()”. Kolumny o podobnej nazwie nie można dodać za pomocą funkcji „insert()”. W przypadku, gdy kolumna już istnieje w ramce danych, domyślnie zgłaszany jest błąd wartości.

W tym wyniku kolumna utworzona za pomocą funkcji „insert()” jest dodawana do ramki danych. Jego dane wyjściowe wyświetlają dwie ramki danych; pierwsza ramka dataFrame została utworzona za pomocą „ramki pd.data”, w której mamy dwie kolumny „Nazwa” i „Wiek”. Nowa kolumna „płeć”, którą dodaliśmy za pomocą funkcji „insert()”, jest wyświetlana w drugiej ramce danych wyświetlanej poniżej. Ta ramka danych pokazuje, że istnieją trzy kolumny z pewnymi danymi. Indeks ma rozmiar „2”, co oznacza, że ​​zawiera wpisy od „0 do 3”. Nowa kolumna, którą przypisaliśmy do tej ramki danych, ma pozycję indeksu „3”.

Wniosek

Często stosowaną operacją analizy i aktualizacji danych jest dodawanie kolumn do DataFrame. Jednak Pandy dają wiele opcji wykonania zadania, oferując cztery różne metody; jednak używamy tylko jednej techniki, którą jest kolumna panadas „insert()” w naszym artykule. Jedną z najtrudniejszych części rozszerzania DataFrame o nowe kolumny jest indeksowanie. Opiszmy szybko oba przykłady. Najpierw utworzyliśmy ramkę danych zatytułowaną kurs i dodaliśmy kolumny „tytuł kursu” i „opłata” oraz przydzieliliśmy do tej kolumny wartości. Używając funkcji „insert()”, dodajemy nową kolumnę do tej samej ramki danych, wskazując jej pozycję jako „2” w indeksie. W drugim przykładzie pokazane są dwie ramki danych. Stworzyliśmy dwie kolumny i wymieniliśmy niektóre wartości w pierwszej ramce danych. Następnie za pomocą funkcji insert() wstawiliśmy nową kolumnę w ramce danych o nazwie „Płeć”, która również została umieszczona w indeksie jako „2”; teraz ponownie wyświetlił tabelę, jak pokazano w powyższym drugim przykładzie.

Po opanowaniu powyższych technik możemy łatwo dodawać nowe kolumny do DataFrame.