Seria Pandy do CSV

Seria Pandy Do Csv



Metoda „Series.to_csv()” w Pandas wyprowadza określony obiekt serii w notacji wartości oddzielonych przecinkami (csv). Ta funkcja po prostu pobiera wartości z serii i modyfikuje ich format, dodając przecinki do rozdzielenia wartości indeksu i kolumny.

Aby skorzystać z tej funkcji, musimy użyć następującej składni:









Ten artykuł dostarczy Ci dwóch różnych technik, aby nauczyć się sposobów wykorzystania tej metody w programie Pythona.



Przykład nr 1: Wykorzystanie metody Series.to_csv() do konwersji serii z DatetimeIndex na wartości oddzielone przecinkami

Aby zmodyfikować serię do formatu CSV, użyjemy funkcji „Series.to_csv()”. Ta ilustracja wygeneruje serię z DatetimeIndex, a następnie przekonwertuje ją na format wartości rozdzielanych przecinkami.





Aby wprowadzić tę metodę w życie, musimy mieć narzędzie obsługujące programowanie w Pythonie. Narzędzie „Spyder” jest wybrane do kompilacji kodów. Aby napisać na nim skrypt, najpierw uruchomiliśmy zainstalowane narzędzie w naszym systemie. Program Pythona potrzebuje biblioteki, aby wykorzystać swoje metody do osiągnięcia wymaganego wyniku. Załadowana przez nas biblioteka to „Pandy”. W tym samym wierszu kodu alias tej biblioteki jest identyfikowany jako „pd”. Tak więc w dowolnym miejscu programu musimy napisać „pandy”, aby uzyskać dostęp do funkcji. Zamiast tego napisalibyśmy „pd”.

Pierwszym krokiem do rozpoczęcia pracy z kodem jest wygenerowanie serii Pand. Musimy napisać „pd”, aby zastosować metodę tworzenia serii z pand. Funkcja „pd.Series()” jest wywoływana w celu skonstruowania serii o określonych wartościach. Wartości, które podaliśmy dla serii to „Stambuł”, „Izmir”, „Ankara”, „Ankara”, „Antalya”, „Konya” i „Bursa”. Jeśli chcesz nadać nazwę tej tablicy wartości, możesz to zrobić za pomocą parametru „nazwa”. W tym miejscu nazwaliśmy tę tablicę wartości „Miasta”, ponieważ zawiera nazwy 6 miast. Do przechowywania tej serii utworzono obiekt serii „Turcja”.



Aby utworzyć DatetimeIndex, wywołaliśmy metodę „pd.date_range()”. W nawiasach tej funkcji przekazaliśmy 4 argumenty, którymi są: „start”, „freq”, „periods” i „tz”.

Argument „start” pobiera datę i godzinę, aby zacząć generować z niego zakres dat. Tutaj podaliśmy datę i godzinę rozpoczęcia jako „2022-03-02 02:30”. Parametr „freq” klasyfikuje częstotliwość dla zakresu dat. Dlatego nadaliśmy mu wartość „D”. Teraz utworzy zakres dat z częstotliwością dzienną. Argument „okres” jest ustawiony na „6”, co oznacza, że ​​wygeneruje zakres dat na 6 dni. Ostatnim parametrem jest „tz”, który określa strefę czasową dla określonego obszaru. Określiliśmy strefę czasową dla „Azja/Stambuł”.

Aby przechowywać ten zakres dat, stworzyliśmy zmienną „Datetime”. Aby ustawić DatetimeIndex, zastosowaliśmy właściwość „Series.index”. Nazwa serii „Turcja” opatrzona jest właściwością „.index” i jest do niej przypisywany zakres dat i czas przechowywany w zmiennej „Datetime”. Zatem właściwość „index” pobierze wartości ze zmiennej „Datetime” i uczyni je listą indeksów serii „Turcja”. Na koniec, aby wyświetlić serię wyjściową, zastosowaliśmy metodę „print()” i przekazaliśmy serię „Turcja” jako dane wejściowe do niej, aby wyświetlić jej zawartość.

Po prostu nacisnęliśmy opcję „Uruchom plik”, aby wykonać skrypt. W związku z tym możemy zobaczyć serię z DatetimeIndex rozpoczynającą się od „2022-03-02 02:30:00+03:00” i kończącą się na „2022-03-07 02:30:00+03:00” tworzącą okres 6 dni. Poniżej serii wymieniono również „Freq :D”, nazwę listy tablicy „Cities” oraz dtype „object”.

Teraz nauczymy się konwertować tę serię, którą właśnie widzieliśmy na powyższym zrzucie ekranu, do formatu CSV. Aby zmodyfikować serię do wartości oddzielonych przecinkami, mamy metodę dostarczoną przez moduł pandas, którą jest „Series.to_csv()”. Ta metoda pobiera wartości podanej serii i dodaje przecinki między wartościami kolumny.

Wywoływana jest funkcja „Series.to_csv()”. Nazwa serii, którą chcemy przekonwertować, jest podana w metodzie jako „Turcja.to_csv()”. Aby zachować wartości oddzielone przecinkami, utworzyliśmy zmienną „Comma_Separated”, a następnie umieściliśmy jej zawartość w oknie wyjściowym, wywołując funkcję „print()”.

Oto nasza seria w formacie csv. Na zrzucie widać, że indeks i wartości serii zostały oddzielone za pomocą zawartych w nich przecinków.

Przykład nr 2: Wykorzystanie metody Series.to_csv() do konwersji serii z wartościami NaN na wartości oddzielone przecinkami

Drugą techniką ćwiczenia metody „Series.to_csv()” jest zastosowanie tej metody do konwersji serii zawierającej niektóre pozycje zerowe na format CSV.

Wstępnie sprowadziliśmy niezbędne pakiety. „pd” jest aliasem dla pand, a „np” jest aliasem dla numpy. Zestaw narzędzi numpy jest ładowany tutaj, ponieważ utworzymy kilka pustych wpisów w naszej serii za pomocą „np.NaN” podczas tworzenia go za pomocą metody pandy „pd.Series()”.

Funkcja „pd.Series()” jest wywoływana w celu zbudowania serii pand o wartościach: „Nile”, „Amazon”, np.NaN, „Ganges”, „Mississippi”, „np.NaN”, „Yangtze”, „Dunaj”, „Mekong”, „np.NaN” i „Wołga”. Łącznie zdefiniowano 21 wartości dla serii, z których 3 wpisy zawierają wartości „np.NaN”, co oznacza, że ​​w serii brakuje 3 wartości. Właściwość „name” określa nazwę tej tablicy wartości, którą podaliśmy „Tytuły”. Właściwość „index” służy do ustawiania listy indeksów zdefiniowanej przez użytkownika zamiast korzystania z listy domyślnej.

Tutaj chcemy listę indeksów z wartościami „10”, „11”, „12”, „13”, „14”, „16”, „17”, „18”, „19”, „20”, i 21”. Teraz nasza seria będzie miała listę indeksów zaczynającą się od „10” zamiast „0”. Teraz zapisz tę serię, abyśmy mogli później użyć jej w programie. Zainicjowaliśmy obiekt serii „Rivers” i przydzieliliśmy mu serię wyjściową wygenerowaną przez wywołanie metody „pd.Series()”. Serię można zobaczyć, wyświetlając ją za pomocą funkcji „print()” w Pythonie.

Wyrenderowany wynik na terminalu wydrukował serię, której lista indeksów zaczyna się od 10 i kończy na 21, co oznacza, że ​​seria ma 21 wartości.

Seria zostanie przekształcona do formatu CSV za pomocą metody „Series.to_csv()”.

Wywołaliśmy metodę „Series.to_csv()” z naszą serią „Turcja”. Dlatego ta metoda pobierze wartości z serii „Turcja” i przekonwertuje je na format wartości oddzielonych przecinkami. Wynik jest zapisywany w zmiennej „Converted_csv”. Ostatecznie przekonwertowana seria jest drukowana za pomocą funkcji „print()”.

Na poniższym zrzucie wyniku widać, że wartości serii są teraz zmienione w taki sposób, że do oddzielenia ich od listy indeksów używa się przecinka. Ponadto w przypadku braku wartości drukowany jest tylko numer indeksu z przecinkiem.

Wniosek

Modyfikacja serii pand do formatu CSV to praktyczne podejście. Można to osiągnąć za pomocą funkcji pandy „Series.to_csv()”. W niniejszym przewodniku wprowadzono w życie dwie techniki zastosowania tej metody. Na pierwszej ilustracji wywołaliśmy tę metodę, aby przekonwertować serię z DatetimeIndex na format wartości rozdzielanych przecinkami. Druga instancja użyła funkcji „Series.to_csv()” , aby zmodyfikować serię z brakującymi wpisami w formacie CSV. Obie techniki zostały praktycznie zaimplementowane za pomocą narzędzia „Spyder” w systemie operacyjnym Windows.