Pandas jest biblioteką Python, która umożliwia wczytywanie danych z różnych źródeł do ramki danych (ang. DataFrame). Można wczytywać dane z plików CSV, Excel, HTML, JSON, SQL, czy też z baz danych za pomocą różnych funkcji:
- read_csv: Wczytuje dane z pliku CSV
- read_excel: Wczytuje dane z pliku Excel
- read_html: Wczytuje dane z tabel HTML
- read_json: Wczytuje dane w formacie JSON
- read_xml: Wczytuje dane w formacie XML
- read_sql: Wczytuje dane z bazy danych SQL za pomocą zapytania SQL
- SQL – sqlalchemy
Przykłady:
import pandas as pd
# Wczytanie danych z pliku CSV
df = pd.read_csv("plik.csv")
# Wczytanie danych z pliku Excel
df = pd.read_excel("plik.xlsx")
# Wczytanie danych z tabel HTML
df = pd.read_html("plik.html")[0]
# Wczytanie danych z pliku JSON
df = pd.read_json("plik.json")
# Wczytanie danych z bazy danych SQL
import sqlite3
conn = sqlite3.connect("baza_danych.db")
df = pd.read_sql("SELECT * FROM tabela", conn)
Oprócz tego, istnieją również inne sposoby wczytania danych do ramki danych, takie jak: