Jak czytać plik Excel (xlsx) w Pythonie?

How Read Excel File Python



ten .xlsx jest rozszerzeniem dokumentu Excela, który może przechowywać dużą ilość danych w formie tabelarycznej, a wiele rodzajów obliczeń arytmetycznych i logicznych można łatwo wykonać w arkuszu kalkulacyjnym Excela. Czasem wymagane jest odczytanie danych z dokumentu Excela za pomocą skryptu Pythona do celów programistycznych. W Pythonie istnieje wiele modułów do czytania dokumentu Excel. Niektóre z przydatnych modułów są xlrd , openpyxl , oraz pandy . W tym samouczku pokazano sposoby wykorzystania tych modułów do odczytywania pliku Excela w Pythonie.

Warunek wstępny:

Do sprawdzenia przykładów tego samouczka wymagany będzie fikcyjny plik Excela z rozszerzeniem .xlsx. Możesz użyć dowolnego istniejącego pliku Excela lub utworzyć nowy. Tutaj nowy plik Excela o nazwie sprzedaż.xlsx plik został utworzony z następującymi danymi. Ten plik był używany do czytania przy użyciu różnych modułów Pythona w następnej części tego samouczka.







sprzedaż.xlsx



Data sprzedaży Sprzedawca Ilość
05.12.18 Sila Ahmed 60000
12.06.19 ja Hossain 50 000
08/09/20 Sarmin Jahan 45000
04.07.21 Mahmudul Hasan 30000

Przykład-1: Odczytaj plik Excela za pomocą xlrd

Moduł xlrd nie jest domyślnie instalowany w Pythonie. Musisz więc zainstalować moduł przed jego użyciem. Najnowsza wersja tego modułu nie obsługuje pliku Excel z rozszerzeniem .xlsx. Musisz więc zainstalować wersję 1.2.0 tego modułu, aby odczytać plik xlsx. Uruchom następujące polecenie z terminala, aby zainstalować wymaganą wersję xlrd .



$pypećzainstalować xlrd== 1.2.0

Po zakończeniu procesu instalacji utwórz plik Pythona z następującym skryptem, aby przeczytać sprzedaż.xlsx plik za pomocą XLR moduł. open_workbook() funkcja jest używana w skrypcie otwórz plik xlsx do odczytu. Ten plik Excel zawiera tylko jeden arkusz. Więc skoroszyt.sheet_by_index() w skrypcie została użyta funkcja z wartością argumentu 0. Następnie zagnieżdżone 'dla' pętla użyła do odczytania wartości komórek arkusza roboczego przy użyciu wartości wierszy i kolumn. W skrypcie zastosowano dwie funkcje range() do zdefiniowania rozmiaru wiersza i kolumny na podstawie danych arkusza. ten wartość_komórki() funkcja użyła do odczytania określonej wartości komórki arkusza w każdej iteracji pętli. Każde pole w danych wyjściowych będzie oddzielone jedną spacją tabulacji.





# Zaimportuj moduł xlrd
importuj xlrd

# Otwórz skoroszyt
skoroszyt = xlrd.open_workbook('sprzedaż.xlsx')

# Otwórz arkusz roboczy
arkusz roboczy = skoroszyt.sheet_by_index(0)

# Iteruj wiersze i kolumny
dlaiwzasięg(0,5):
dlaJwzasięg(0,3):
# Wydrukuj wartości komórek za pomocą spacji tabulacji
wydrukować(arkusz roboczy.wartość_komórki(ja, ja),kończyć się='T')
wydrukować('')

Wyjście:

Poniższe dane wyjściowe pojawią się po wykonaniu powyższego skryptu.



Przykład-2: Przeczytaj plik Excela za pomocą openpyxl

ten openpyxl to kolejny moduł Pythona do odczytu pliku xlsx, a także domyślnie nie jest instalowany z Pythonem. Uruchom następujące polecenie z terminala, aby zainstalować ten moduł przed jego użyciem.

$pypećzainstalowaćopenpyxl

Po zakończeniu procesu instalacji utwórz plik Pythona z następującym skryptem, aby przeczytać sprzedaż.xlsx plik. Podobnie jak moduł xlrd, openpyxl moduł ma load_workbook() funkcja otwierania pliku xlsx do odczytu. ten sprzedaż.xlsx plik jest używany jako wartość argumentu tej funkcji. Przedmiotem wookbook.aktywny został stworzony w skrypcie do odczytywania wartości max_row i max_kolumna nieruchomości. Te właściwości zostały użyte w zagnieżdżonych pętlach for do odczytywania zawartości sprzedaż.xlsx plik. Funkcja range() została użyta do odczytania wierszy arkusza, a funkcja iter_cols() została użyta do odczytania kolumn arkusza. Każde pole w danych wyjściowych będzie oddzielone dwoma spacjami tabulacji.

# Importuj moduł openyxl
importuj openpyxl

# Zdefiniuj zmienną, aby załadować wookbook
wookbook = openpyxl.load_workbook('sprzedaż.xlsx')

# Zdefiniuj zmienną do odczytu aktywnego arkusza:
arkusz roboczy = wookbook.active

# Iteruj pętlę, aby odczytać wartości komórek
dlaiwzasięg(0, arkusz.max_wiersz):
dla z warkusz roboczy.iter_cols(1, arkusz.max_kolumna):
wydrukować(z[i].wartość,kończyć się='TT')
wydrukować('')

Wyjście:

Poniższe dane wyjściowe pojawią się po wykonaniu powyższego skryptu.

Przykład-3: Przeczytaj plik Excela za pomocą pand

Moduł pandas nie jest instalowany z pythonem, podobnie jak poprzedni moduł. Tak więc, jeśli nie zainstalowałeś go wcześniej, musisz go zainstalować. Uruchom następujące polecenie, aby zainstalować pandy z terminala.

$pypećzainstalowaćpandy

Po zakończeniu procesu instalacji utwórz plik Pythona z następującym skryptem, aby przeczytać sprzedaż.xlsx plik. ten read_excel() funkcja pand służy do odczytu pliku xlsx. Ta funkcja została użyta w skrypcie do odczytania sprzedaż.xlsx plik. ten Ramka danych() funkcja użyła tutaj do odczytania zawartości pliku xlsx w ramce danych i zapisania wartości w zmiennej o nazwie dane . Wartość danych została wydrukowana później.

# Importuj pandy
importuj pandyjakpd

# Załaduj plik xlsx
excel_data = pd.read_excel('sprzedaż.xlsx')
# Odczytaj wartości pliku w ramce danych
dane = pd.DataFrame(dane_excela,kolumny=[„Data sprzedaży”,'Sprzedawca','Ilość'])
# Wydrukuj treść
wydrukować(„Zawartość akt jest: ', dane)

Wyjście:

Poniższe dane wyjściowe pojawią się po wykonaniu powyższego skryptu. Dane wyjściowe tego skryptu różnią się od poprzednich dwóch przykładów. Numery wierszy są drukowane w pierwszej kolumnie, gdzie wartość wiersza liczona jest od 0. Wartości dat są wyrównane centralnie. Nazwiska sprzedawców są wyrównane do prawej. Kwota jest wyrównana do lewej.

Wniosek:

Użytkownicy Pythona muszą pracować z plikami xlsx do różnych celów programistycznych. W tym samouczku pokazano trzy różne sposoby odczytywania pliku xlsx przy użyciu trzech modułów Pythona. Każdy moduł ma inne funkcje i właściwości do odczytywania pliku xlsx. Ten samouczek pomoże użytkownikom Pythona w łatwym odczytaniu pliku xlsx za pomocą skryptu Pythona po przeczytaniu tego samouczka.