„W „pandach” możemy łatwo odczytać plik tekstowy za pomocą metody „pandy”. „Pandy” dają nam możliwość odczytania pliku tekstowego. „Pandas” udostępnia różne wbudowane metody odczytywania pliku tekstowego. Omówimy tutaj wszystkie metody w tym samouczku wraz ze wszystkimi parametrami i wyjaśnimy je szczegółowo. Ponadto odczytamy plik tekstowy w „pandach” za pomocą metod „pand” w naszych kodach tutaj”.
Metody czytania pliku tekstowego w „pandach”
W „pandach” mamy trzy metody, które pomagają nam w odczytaniu pliku tekstowego. Zrobiliśmy tutaj również kilka przykładów, w których odczytujemy plik tekstowy. Metody oferowane przez „pandy” omówiono poniżej:
-
- Korzystając z metody pd.read_csv().
- Korzystając z metody pd.read_table().
- Korzystając z metody pd.read_fwf().
Teraz wyjaśniamy składnię wszystkich tych metod, a także szczegółowo omawiamy parametry wszystkich metod w tym samouczku.
Składnia read_csv()
pd.read_csv ( „nazwapliku.txt”, wrz =' ', nagłówek =Brak, nazwy = [ „Nazwa_kolumny1”, „Nazwa_kolumny2, „Nazwa_kolumny2”, ………….. ] )
W tej metodzie najpierw dodajemy nazwę pliku tekstowego, którego dane chcemy odczytać i jest to pierwszy parametr tej metody. Następnie umieszczamy „sep”, który jest separatorem w tej metodzie, i umieszczamy tutaj spację jako znak, aby traktował spację jako separator. Po tym mamy parametr header i używana jest wartość „None” tego parametru, więc utworzy domyślny nagłówek, a jeśli nie dodamy tego parametru, rozważy pierwszą linię pliku tekstowego jako nagłówek. W parametrze „nazwy” możemy dodać nazwy kolumn, które musimy dodać jako nagłówek.
Składnia read_table()
pd.read_table ( 'nazwa_pliku.txt' , ogranicznik = ' ' )
W tej metodzie jako pierwszy parametr wstawiamy nazwę pliku tekstowego. W separatorze, gdy umieścimy „ ”, to jako separator przyjmie znak spacji.
Składnia read_fwf()
pd.read_fwf ( 'nazwa_pliku.txt' )
Ta metoda przyjmuje tylko jeden parametr, którym jest nazwa pliku tekstowego.
Teraz użyjemy tych metod do odczytywania plików tekstowych w kodach „pand” i pokazywania danych pliku tekstowego na terminalu.
Przykład # 01
Aplikacja „Spyder” jest tutaj, w której wykonaliśmy wszystkie kody przedstawione w tym samouczku. Poniżej znajduje się plik tekstowy, którego dane chcemy odczytać. Użyjemy metody „read_csv()” do odczytania tego pliku tekstowego w „pandach”.
Najpierw importujemy bibliotekę „pandy”, ponieważ chcemy wykorzystać metodę „read_csv()”, a jest to metoda „pand”. Dostęp do tej metody uzyskujemy tylko wtedy, gdy zaimportowaliśmy bibliotekę „pand”. W tym miejscu wspominamy „pandy jako pd”, więc to „pd” jest umieszczane z nazwą metody jego użycia. Następnie tworzymy tutaj zmienną „df”, która służy do przechowywania danych pliku tekstowego po odczytaniu. Umieszczamy tutaj metodę „pd.read_csv()”, która pomaga w odczytywaniu pliku tekstowego i konwertowaniu danych pliku tekstowego do DataFrame i przechowywaniu go w zmiennej „df”.
Przekazaliśmy nazwę pliku, która brzmi „myData.txt”, tutaj, a następnie używamy „sep” i przypisujemy temu „sep” pusty znak. Tak więc ten pusty znak działa jako separator w pliku tekstowym. Następnie wykorzystaliśmy poniższy „print()”, który służy do drukowania danych z pliku tekstowego. Wyświetli dane pliku tekstowego w formularzu DataFrame.
Aby wykonać ten kod, musimy nacisnąć „Shift + Enter”, a dane wyjściowe zostaną wyrenderowane na terminalu „Spyder”. Wynik powyższego kodu jest wyświetlany na podanym zrzucie ekranu i widać, że dane pliku tekstowego są wyświetlane jako DataFrame, a pierwszy wiersz naszego pliku tekstowego jest tutaj prezentowany jako nazwy kolumn tego DataFrame. Oddziela również dane, w których w pliku tekstowym występuje znak spacji.
Przykład # 02
Plik tekstowy, który odczytamy w tym przykładzie, jest pokazany tutaj i ponownie użyjemy metody „read_csv()”, ale z innymi parametrami.
Wykorzystywana jest metoda „pandy” „pd.read_csv()” i przekazujemy tutaj trzy parametry. Najpierw umieszczamy nazwę pliku, którą jest „Record.txt”. Drugi parametr to parametr „sep” i przypisuje mu pusty znak, a następnie mamy trzeci parametr, w którym ustawiamy „header” i dostosowujemy go na „None”, dzięki czemu utworzy domyślny nagłówek DataFrame kiedy wykonujemy ten kod. Zapisaliśmy to wszystko w zmiennej „My_Record”, a także dodaliśmy „My_Record” w funkcji „print()” do drukowania.
Wszystkie dane są zapisywane w DataFrame i oddziela dane, w których w danych pliku tekstowego występuje znak spacji. Ponadto utworzył tutaj domyślny nagłówek DataFrame, ponieważ dostosowaliśmy parametr „header” do „Brak”.
Przykład nr 03
Wyświetlany jest plik tekstowy tego przykładu i ponownie użyjemy metody „read_csv()” ze zmodyfikowanymi parametrami.
W tym kodzie cztery parametry są przekazywane tutaj do metody „pandy” „pd.read_csv()”. Pierwszym parametrem jest nazwa pliku tekstowego. Parametr „sep” otrzymuje pusty znak w drugim parametrze. Parametr „nagłówek” jest ustawiony na „Brak” w trzecim argumencie, a jako czwarty parametr ustawiliśmy „nazwy”, które pojawią się jako nazwy kolumn DataFrame po odczytaniu pliku tekstowego, a te nazwy kolumn są „COL_1, COL_2, COL_3, COL_4 i COL_5”. Wszystkie te informacje zostały zapisane w zmiennej „My_Record”, a „My_Record” został również dodany do metody „print()”, dzięki czemu będzie drukowany na terminalu.
Wszystkie informacje z pliku tekstowego są tutaj renderowane jako DataFrame, a także oddziela dane, w których spacje są dodawane w pliku tekstowym. Dodaje również odpowiednio nazwy kolumn, które dodaliśmy powyżej w kodzie.
Przykład # 04
Jest to plik tekstowy, który odczytamy w tym przykładzie, korzystając z innej metody, metody „pd.read_table()”.
W tym miejscu dodajemy metodę „pd.read_table()” do odczytu pliku tekstowego i dodajemy „ABC.txt”, czyli nazwę pliku tekstowego. Ta metoda pomaga w odczytywaniu pliku tekstowego, a także dostosowaliśmy parametr „delimiter” do znaku spacji, więc będzie działał również jak separator, który wyjaśniliśmy powyżej. Następnie wszystkie dane pliku tekstowego są zapisywane w zmiennej „My_Data” i również tutaj drukowane.
Początkowy wiersz naszego pliku tekstowego jest tutaj pokazany jako nazwy kolumn DataFrame, a dane z pliku tekstowego są drukowane jako DataFrame. Dodatkowo oddziela dane pliku tekstowego, w którym występuje znak spacji.
Przykład # 05
Teraz plik tekstowy zawiera dane, które są wyświetlane poniżej. Tym razem zastosujemy „read_fwf()” i pokażemy, jak renderuje dane po odczytaniu pliku tekstowego.
Jak wiemy, ta metoda „read_fwf()” przyjmuje tylko jeden parametr, którym jest nazwa pliku, który chcemy odczytać. Dodajemy tutaj „textfile.txt”, co jest nazwą naszego pliku tekstowego i przypisujemy tę metodę pandy do zmiennej „File_Data”, która będzie przechowywać dane tego pliku tekstowego. Następnie wstawiamy „print(File_Data)”, aby również wydrukować te dane.
Tutaj pokazane są wszystkie dane pliku tekstowego. Nie oddzielił danych, w których występują znaki spacji, ponieważ w tej funkcji nie ma parametru takiego jak „Sep” lub „delimiter”.
Wniosek
Ten samouczek wyjaśnia, jak czytać plik tekstowy w „pandach” i jakie metody są używane do czytania pliku tekstowego w „pandach”. Omówiliśmy wszystkie metody, które pomagają nam w odczytywaniu pliku tekstowego w „pandach”. W tym samouczku zbadaliśmy trzy różne metody „pand” do czytania naszych plików tekstowych w „pandach”. Wyjaśniliśmy również szczegółowo składnię wszystkich metod, a także parametry wszystkich metod i przeczytaliśmy wiele plików tekstowych, stosując różne metody ze wszystkimi możliwymi parametrami w tym samouczku.