Pandas

Pandas to biblioteka Python służąca do analizy danych. Jej głównymi zaletami są wygodne struktury danych oraz narzędzia umożliwiające wczytywanie, przetwarzanie i analizę danych. Pandas składa się głównie z dwóch podstawowych struktur danych: Series i DataFrame. Biblioteka ta jest szeroko stosowana w przemyśle oraz w badaniach naukowych i jest jednym z najważniejszych narzędzi do pracy z danymi w języku Python.

Zastosowania biblioteki Pandas:

  1. Wczytywanie danych z różnych źródeł, takich jak pliki CSV, Excel, JSON, SQL / NoSQL ,plików baz danych oraz API.
  2. Analiza danych – pandas umożliwia wygodne wykonywanie różnego rodzaju operacji na danych, takich jak agregacje, grupowanie czy zastępowanie brakujących danych.
  3. Transformacja danych – pandas umożliwia wygodne przekształcanie danych z jednej postaci do drugiej, np. zamiana kolumn z danymi tekstowymi na kolumny z danymi liczbowymi.
  4. Eksploracja danych – pandas umożliwia szybkie i wygodne wyświetlanie oraz wizualizację danych, co pozwala na szybkie zrozumienie ich struktury oraz znalezienie ciekawych zależności i wzorców.
  5. Przygotowywanie danych do modelowania – pandas umożliwia wygodne przygotowanie danych do użycia w algorytmach uczenia maszynowego, takich jak podział na zbiór treningowy i testowy czy standaryzacja danych.
  6. Przetwarzanie dużych plików danych
  7. Wyodrębnianie informacji z danych tekstowych
  8. Integracja danych z różnych źródeł.