Warunek wstępny:
Do sprawdzenia przykładów tego samouczka wymagany będzie fikcyjny plik Excela z rozszerzeniem .xlsx. Możesz użyć dowolnego istniejącego pliku Excela lub utworzyć nowy. Tutaj nowy plik Excela o nazwie sprzedaż.xlsx plik został utworzony z następującymi danymi. Ten plik był używany do czytania przy użyciu różnych modułów Pythona w następnej części tego samouczka.
sprzedaż.xlsx
Data sprzedaży | Sprzedawca | Ilość |
---|---|---|
05.12.18 | Sila Ahmed | 60000 |
12.06.19 | ja Hossain | 50 000 |
08/09/20 | Sarmin Jahan | 45000 |
04.07.21 | Mahmudul Hasan | 30000 |
Przykład-1: Odczytaj plik Excela za pomocą xlrd
Moduł xlrd nie jest domyślnie instalowany w Pythonie. Musisz więc zainstalować moduł przed jego użyciem. Najnowsza wersja tego modułu nie obsługuje pliku Excel z rozszerzeniem .xlsx. Musisz więc zainstalować wersję 1.2.0 tego modułu, aby odczytać plik xlsx. Uruchom następujące polecenie z terminala, aby zainstalować wymaganą wersję xlrd .
$pypećzainstalować xlrd== 1.2.0
Po zakończeniu procesu instalacji utwórz plik Pythona z następującym skryptem, aby przeczytać sprzedaż.xlsx plik za pomocą XLR moduł. open_workbook() funkcja jest używana w skrypcie otwórz plik xlsx do odczytu. Ten plik Excel zawiera tylko jeden arkusz. Więc skoroszyt.sheet_by_index() w skrypcie została użyta funkcja z wartością argumentu 0. Następnie zagnieżdżone 'dla' pętla użyła do odczytania wartości komórek arkusza roboczego przy użyciu wartości wierszy i kolumn. W skrypcie zastosowano dwie funkcje range() do zdefiniowania rozmiaru wiersza i kolumny na podstawie danych arkusza. ten wartość_komórki() funkcja użyła do odczytania określonej wartości komórki arkusza w każdej iteracji pętli. Każde pole w danych wyjściowych będzie oddzielone jedną spacją tabulacji.
# Zaimportuj moduł xlrd
importuj xlrd
# Otwórz skoroszyt
skoroszyt = xlrd.open_workbook('sprzedaż.xlsx')
# Otwórz arkusz roboczy
arkusz roboczy = skoroszyt.sheet_by_index(0)
# Iteruj wiersze i kolumny
dlaiwzasięg(0,5):
dlaJwzasięg(0,3):
# Wydrukuj wartości komórek za pomocą spacji tabulacji
wydrukować(arkusz roboczy.wartość_komórki(ja, ja),kończyć się='T')
wydrukować('')
Wyjście:
Poniższe dane wyjściowe pojawią się po wykonaniu powyższego skryptu.
Przykład-2: Przeczytaj plik Excela za pomocą openpyxl
ten openpyxl to kolejny moduł Pythona do odczytu pliku xlsx, a także domyślnie nie jest instalowany z Pythonem. Uruchom następujące polecenie z terminala, aby zainstalować ten moduł przed jego użyciem.
$pypećzainstalowaćopenpyxlPo zakończeniu procesu instalacji utwórz plik Pythona z następującym skryptem, aby przeczytać sprzedaż.xlsx plik. Podobnie jak moduł xlrd, openpyxl moduł ma load_workbook() funkcja otwierania pliku xlsx do odczytu. ten sprzedaż.xlsx plik jest używany jako wartość argumentu tej funkcji. Przedmiotem wookbook.aktywny został stworzony w skrypcie do odczytywania wartości max_row i max_kolumna nieruchomości. Te właściwości zostały użyte w zagnieżdżonych pętlach for do odczytywania zawartości sprzedaż.xlsx plik. Funkcja range() została użyta do odczytania wierszy arkusza, a funkcja iter_cols() została użyta do odczytania kolumn arkusza. Każde pole w danych wyjściowych będzie oddzielone dwoma spacjami tabulacji.
# Importuj moduł openyxlimportuj openpyxl
# Zdefiniuj zmienną, aby załadować wookbook
wookbook = openpyxl.load_workbook('sprzedaż.xlsx')
# Zdefiniuj zmienną do odczytu aktywnego arkusza:
arkusz roboczy = wookbook.active
# Iteruj pętlę, aby odczytać wartości komórek
dlaiwzasięg(0, arkusz.max_wiersz):
dla z warkusz roboczy.iter_cols(1, arkusz.max_kolumna):
wydrukować(z[i].wartość,kończyć się='TT')
wydrukować('')
Wyjście:
Poniższe dane wyjściowe pojawią się po wykonaniu powyższego skryptu.
Przykład-3: Przeczytaj plik Excela za pomocą pand
Moduł pandas nie jest instalowany z pythonem, podobnie jak poprzedni moduł. Tak więc, jeśli nie zainstalowałeś go wcześniej, musisz go zainstalować. Uruchom następujące polecenie, aby zainstalować pandy z terminala.
$pypećzainstalowaćpandyPo zakończeniu procesu instalacji utwórz plik Pythona z następującym skryptem, aby przeczytać sprzedaż.xlsx plik. ten read_excel() funkcja pand służy do odczytu pliku xlsx. Ta funkcja została użyta w skrypcie do odczytania sprzedaż.xlsx plik. ten Ramka danych() funkcja użyła tutaj do odczytania zawartości pliku xlsx w ramce danych i zapisania wartości w zmiennej o nazwie dane . Wartość danych została wydrukowana później.
# Importuj pandyimportuj pandyjakpd
# Załaduj plik xlsx
excel_data = pd.read_excel('sprzedaż.xlsx')
# Odczytaj wartości pliku w ramce danych
dane = pd.DataFrame(dane_excela,kolumny=[„Data sprzedaży”,'Sprzedawca','Ilość'])
# Wydrukuj treść
wydrukować(„Zawartość akt jest: ', dane)
Wyjście:
Poniższe dane wyjściowe pojawią się po wykonaniu powyższego skryptu. Dane wyjściowe tego skryptu różnią się od poprzednich dwóch przykładów. Numery wierszy są drukowane w pierwszej kolumnie, gdzie wartość wiersza liczona jest od 0. Wartości dat są wyrównane centralnie. Nazwiska sprzedawców są wyrównane do prawej. Kwota jest wyrównana do lewej.
Wniosek:
Użytkownicy Pythona muszą pracować z plikami xlsx do różnych celów programistycznych. W tym samouczku pokazano trzy różne sposoby odczytywania pliku xlsx przy użyciu trzech modułów Pythona. Każdy moduł ma inne funkcje i właściwości do odczytywania pliku xlsx. Ten samouczek pomoże użytkownikom Pythona w łatwym odczytaniu pliku xlsx za pomocą skryptu Pythona po przeczytaniu tego samouczka.