Wczytanie pliku Excel do dataframe Pandas

import pandas as pd

# Wczytaj dane z całego pliku Excel
df = pd.read_excel('plik.xlsx')

# Wczytaj dane tylko z arkuszy o nazwach 'Arkusz1' i 'Arkusz2'
df = pd.read_excel('plik.xlsx', sheet_name=['Arkusz1', 'Arkusz2'])

# Wczytaj tylko kolumny o nazwach 'Kolumna1' i 'Kolumna2'
df = pd.read_excel('plik.xlsx', usecols=['Kolumna1', 'Kolumna2'])

# Wczytaj dane z określonego zakresu komórek (od komórki B2 do F7)
df = pd.read_excel('plik.xlsx', usecols='B:F', skiprows=1, nrows=6)

# Wczytaj dane bez pierwszego wiersza (który zawiera nazwy kolumn)
df = pd.read_excel('plik.xlsx', header=None)

# Wczytaj dane z pliku Excel zawierającego kilka arkuszy i zapisz je jako listę dataframe'ów
df_list = pd.read_excel('plik.xlsx', sheet_name=None)

Oto niektóre z dostępnych parametrów funkcji pandas.read_excel oraz krótki opis każdego z nich:

  • io – ciąg znaków lub obiekt typu file-like, zawierający ścieżkę do pliku lub jego zawartość. Może to być plik lokalny, URL lub zawartość pliku przechowywana w zmiennej.
  • sheet_name – nazwa arkusza lub lista nazw arkuszy, które mają zostać wczytane. Może to być również numer arkusza lub lista numerów arkuszy.
  • header – określa, który wiersz ma zostać użyty jako nagłówki kolumn. Może być liczbą całkowitą (np. header=0) lub listą liczb całkowitych (np. header=[0, 1]).
  • names – lista nazw kolumn, które mają zostać użyte jako nagłówki. Może być użyta zamiast parametru header, jeśli w pliku Excel nie ma wiersza z nagłówkami.
  • index_col – indeks kolumny lub lista indeksów kolumn, które mają zostać użyte jako indeks DataFrame. Może to być liczba całkowita (np. index_col=0) lub lista liczb całkowitych (np. index_col=[0, 1]).
  • usecols – lista nazw lub indeksów kolumn, które mają zostać wczytane. Może być również ciągiem znaków określającym zakres kolumn (np. usecols='A:D').
  • skiprows – lista wierszy, które mają zostać pominięte podczas wczytywania danych. Może to być lista liczb całkowitych (np. skiprows=[0, 2]) lub lista list liczb całkowitych (np. skiprows=[[0, 2], [5, 7]]).
  • nrows – liczba wierszy, które mają zostać wczytane.
import pandas as pd

# Wczytaj dane z arkusza o nazwie 'Arkusz1' pliku Excel
df = pd.read_excel('plik.xlsx', sheet_name='Arkusz1')

# Wczytaj dane z arkusza o numerze 2 pliku Excel
df = pd.read_excel('plik.xlsx', sheet_name=2)

# Wczytaj dane z arkuszy o numerach 1 i 3 pliku Excel
df = pd.read_excel('plik.xlsx', sheet_name=[1, 3])

# Wczytaj dane z pliku Excel, używając pierwszego wiersza jako nagłówków kolumn
df = pd.read_excel('plik.xlsx', header=0)

# Wczytaj dane z pliku Excel, używając pierwszego i drugiego wiersza jako nagłówków kolumn
df = pd.read_excel('plik.xlsx', header=[0, 1])

# Wczytaj dane z pliku Excel, używając trzeciej kolumny jako indeksu
df = pd.read_excel('plik.xlsx', index_col=2)

# Wczytaj tylko kolumny o nazwach 'Kolumna1' i 'Kolumna2' pliku Excel
df = pd.read_excel('plik.xlsx', usecols=['Kolumna1', 'Kolumna2'])

# Wczytaj tylko kolumny o indeksach 0 i 2 pliku Excel
df = pd.read_excel('plik.xlsx', usecols=[0, 2])

# Wczytaj dane z określonego zakresu komórek (od komórki B2 do F7)
df = pd.read_excel('plik.xlsx', usecols='B:F', skiprows=1, nrows=6)

# Wczytaj dane z pliku Excel, używając nazw kolumn zapisanych w liście ['Kolumna1', 'Kolumna2', 'Kolumna3']
df = pd.read_excel('plik.xlsx', names=['Kolumna1', 'Kolumna2', 'Kolumna3'])

# Wczytaj dane z pliku Excel, pomijając pierwszy wiersz
df = pd.read_excel('plik.xlsx', skiprows=0)

# Wczytaj dane z pliku Excel, pomijając pierwszy i trzeci wiersz
df = pd.read_excel('plik.xlsx', skiprows=[0, 2])

# Wczytaj dane z pliku Excel, wczytując tylko pierwsze 10 wierszy
df = pd.read_excel('plik.xlsx', nrows=10)

# Wczytaj dane z pliku Excel, zamieniając wartości 'brak danych' na NaN
df = pd.read_excel('plik.xlsx', na_values='brak danych')

# Wczytaj dane z pliku Excel, zamieniając wartości 'brak danych' i 'n/a' na NaN
df = pd.read_excel('plik.xlsx', na_values=['brak danych', 'n/a'])