Struktury danych Pandas

W Pandas istnieje kilka głównych struktur danych:

  1. Series – to pojedynczy wektor danych z etykietami (nazwami) indeksów.
  2. DataFrame – to dwuwymiarowa tabela danych z etykietami (nazwami) wierszy i kolumn.
  3. Panel – to trójwymiarowa struktura danych z etykietami (nazwami) osi danych.
  4. Panel4D – to czterowymiarowa struktura danych z etykietami (nazwami) osi danych.
  5. Index – to struktura danych zawierająca indeksy dla innych struktur danych.

Wszystkie te struktury danych są zoptymalizowane do pracy z danymi tabelarycznymi i posiadają wiele funkcji do wybierania, filtrowania, agregowania i innych operacji na danych.

Oprócz głównych struktur danych, Pandas zawiera także kilka innych struktur, które mogą być używane w określonych sytuacjach:

  • Categorical – służy do przechowywania danych kategorycznych (dane, które mogą być przypisane do określonych kategorii).
  • SparseArray – służy do przechowywania rzadkich macierzy (macierzy, w których większość elementów jest zerami).
  • SparseDataFrame – służy do przechowywania rzadkich tabel danych (tabeli, w której większość elementów jest zerami).
  • SparseSeries – służy do przechowywania rzadkich wektorów danych (wektora, w którym większość elementów jest zerami).