Struktury danych Pandas - Baza wiedzy Data Science

W Pandas istnieje kilka głównych struktur danych:

Series – to pojedynczy wektor danych z etykietami (nazwami) indeksów.
DataFrame – to dwuwymiarowa tabela danych z etykietami (nazwami) wierszy i kolumn.
Panel – to trójwymiarowa struktura danych z etykietami (nazwami) osi danych.
Panel4D – to czterowymiarowa struktura danych z etykietami (nazwami) osi danych.
Index – to struktura danych zawierająca indeksy dla innych struktur danych.

Wszystkie te struktury danych są zoptymalizowane do pracy z danymi tabelarycznymi i posiadają wiele funkcji do wybierania, filtrowania, agregowania i innych operacji na danych.

Oprócz głównych struktur danych, Pandas zawiera także kilka innych struktur, które mogą być używane w określonych sytuacjach:

Categorical – służy do przechowywania danych kategorycznych (dane, które mogą być przypisane do określonych kategorii).
SparseArray – służy do przechowywania rzadkich macierzy (macierzy, w których większość elementów jest zerami).
SparseDataFrame – służy do przechowywania rzadkich tabel danych (tabeli, w której większość elementów jest zerami).
SparseSeries – służy do przechowywania rzadkich wektorów danych (wektora, w którym większość elementów jest zerami).