Eksploracja danych z biblioteką Pandas

Oprócz wyświetlania i wizualizacji danych, w bibliotece pandas możliwe jest wykonywanie następujących rodzajów operacji eksploracji danych:

  1. Obliczanie statystyk opisowych – pandas umożliwia obliczanie różnego rodzaju statystyk opisowych dla danych, takich jak średnia, mediana, odchylenie standardowe, kwartyle czy współczynniki korelacji.
  2. Wykrywanie wartości odstających – pandas umożliwia wykrywanie wartości odstających za pomocą różnego rodzaju metod, takich jak metoda różnicy międzykwartylowej (IQR) czy metoda Z-Score.
  3. Eksploracja zależności między zmiennymi – pandas umożliwia wizualizację zależności między poszczególnymi zmiennymi za pomocą różnego rodzaju wykresów, takich jak wykresy punktowe, słupkowe czy linowe.
  4. Testowanie hipotez statystycznych – pandas umożliwia wykonywanie różnego rodzaju testów statystycznych, takich jak test t-Studenta czy test chi-kwadrat, w celu sprawdzenia, czy różnice między poszczególnymi grupami danych są istotne statystycznie.
  5. Klasteryzacja danych – pandas umożliwia przydzielenie danych do różnych grup (klasterów) za pomocą różnego rodzaju algorytmów klasteryzacji, takich jak K-Means czy DBSCAN.