import pandas as pd
# Wczytaj dane z całego pliku Excel
df = pd.read_excel('plik.xlsx')
# Wczytaj dane tylko z arkuszy o nazwach 'Arkusz1' i 'Arkusz2'
df = pd.read_excel('plik.xlsx', sheet_name=['Arkusz1', 'Arkusz2'])
# Wczytaj tylko kolumny o nazwach 'Kolumna1' i 'Kolumna2'
df = pd.read_excel('plik.xlsx', usecols=['Kolumna1', 'Kolumna2'])
# Wczytaj dane z określonego zakresu komórek (od komórki B2 do F7)
df = pd.read_excel('plik.xlsx', usecols='B:F', skiprows=1, nrows=6)
# Wczytaj dane bez pierwszego wiersza (który zawiera nazwy kolumn)
df = pd.read_excel('plik.xlsx', header=None)
# Wczytaj dane z pliku Excel zawierającego kilka arkuszy i zapisz je jako listę dataframe'ów
df_list = pd.read_excel('plik.xlsx', sheet_name=None)
Oto niektóre z dostępnych parametrów funkcji pandas.read_excel
oraz krótki opis każdego z nich:
io
– ciąg znaków lub obiekt typu file-like, zawierający ścieżkę do pliku lub jego zawartość. Może to być plik lokalny, URL lub zawartość pliku przechowywana w zmiennej.sheet_name
– nazwa arkusza lub lista nazw arkuszy, które mają zostać wczytane. Może to być również numer arkusza lub lista numerów arkuszy.header
– określa, który wiersz ma zostać użyty jako nagłówki kolumn. Może być liczbą całkowitą (np.header=0
) lub listą liczb całkowitych (np.header=[0, 1]
).names
– lista nazw kolumn, które mają zostać użyte jako nagłówki. Może być użyta zamiast parametruheader
, jeśli w pliku Excel nie ma wiersza z nagłówkami.index_col
– indeks kolumny lub lista indeksów kolumn, które mają zostać użyte jako indeks DataFrame. Może to być liczba całkowita (np.index_col=0
) lub lista liczb całkowitych (np.index_col=[0, 1]
).usecols
– lista nazw lub indeksów kolumn, które mają zostać wczytane. Może być również ciągiem znaków określającym zakres kolumn (np.usecols='A:D'
).skiprows
– lista wierszy, które mają zostać pominięte podczas wczytywania danych. Może to być lista liczb całkowitych (np.skiprows=[0, 2]
) lub lista list liczb całkowitych (np.skiprows=[[0, 2], [5, 7]]
).nrows
– liczba wierszy, które mają zostać wczytane.
import pandas as pd
# Wczytaj dane z arkusza o nazwie 'Arkusz1' pliku Excel
df = pd.read_excel('plik.xlsx', sheet_name='Arkusz1')
# Wczytaj dane z arkusza o numerze 2 pliku Excel
df = pd.read_excel('plik.xlsx', sheet_name=2)
# Wczytaj dane z arkuszy o numerach 1 i 3 pliku Excel
df = pd.read_excel('plik.xlsx', sheet_name=[1, 3])
# Wczytaj dane z pliku Excel, używając pierwszego wiersza jako nagłówków kolumn
df = pd.read_excel('plik.xlsx', header=0)
# Wczytaj dane z pliku Excel, używając pierwszego i drugiego wiersza jako nagłówków kolumn
df = pd.read_excel('plik.xlsx', header=[0, 1])
# Wczytaj dane z pliku Excel, używając trzeciej kolumny jako indeksu
df = pd.read_excel('plik.xlsx', index_col=2)
# Wczytaj tylko kolumny o nazwach 'Kolumna1' i 'Kolumna2' pliku Excel
df = pd.read_excel('plik.xlsx', usecols=['Kolumna1', 'Kolumna2'])
# Wczytaj tylko kolumny o indeksach 0 i 2 pliku Excel
df = pd.read_excel('plik.xlsx', usecols=[0, 2])
# Wczytaj dane z określonego zakresu komórek (od komórki B2 do F7)
df = pd.read_excel('plik.xlsx', usecols='B:F', skiprows=1, nrows=6)
# Wczytaj dane z pliku Excel, używając nazw kolumn zapisanych w liście ['Kolumna1', 'Kolumna2', 'Kolumna3']
df = pd.read_excel('plik.xlsx', names=['Kolumna1', 'Kolumna2', 'Kolumna3'])
# Wczytaj dane z pliku Excel, pomijając pierwszy wiersz
df = pd.read_excel('plik.xlsx', skiprows=0)
# Wczytaj dane z pliku Excel, pomijając pierwszy i trzeci wiersz
df = pd.read_excel('plik.xlsx', skiprows=[0, 2])
# Wczytaj dane z pliku Excel, wczytując tylko pierwsze 10 wierszy
df = pd.read_excel('plik.xlsx', nrows=10)
# Wczytaj dane z pliku Excel, zamieniając wartości 'brak danych' na NaN
df = pd.read_excel('plik.xlsx', na_values='brak danych')
# Wczytaj dane z pliku Excel, zamieniając wartości 'brak danych' i 'n/a' na NaN
df = pd.read_excel('plik.xlsx', na_values=['brak danych', 'n/a'])