DataFrame – Pandas

DataFrame w Pandas to dwuwymiarowa tabela danych z etykietami (nazwami) wierszy i kolumn. Oto kilka przykładów operacji, które można wykonać na obiekcie DataFrame:

  1. Wybieranie elementów: można wybierać pojedyncze lub wielokrotne elementy za pomocą indeksów, nazw kolumn lub maski logicznej.
  2. Filtracja danych: można odfiltrować wiersze lub kolumny za pomocą maski logicznej lub warunku.
  3. Agregacje: można wykonywać różne agregacje danych, takie jak sum, mean, min, max itp. na poziomie wierszy lub kolumn.
  4. Transformacje: można wykonywać różne transformacje na danych, takie jak zaokrąglanie, konwersja na inny typ danych itp.
  5. Brakujące dane: można obsługiwać brakujące dane w DataFrame za pomocą funkcji takich jak dropna lub fillna.
  6. Indeksowanie: można zmieniać indeksy DataFrame za pomocą funkcji takich jak set_index lub reset_index.
  7. Sortowanie: można sortować DataFrame według wartości lub indeksu za pomocą funkcji sort_values lub sort_index.
  8. Operacje matematyczne: można wykonywać podstawowe operacje matematyczne (dodawanie, odejmowanie, mnożenie itp.) na DataFrame za pomocą standardowych operatorów lub funkcji takich jak add, subtract, multiply itp.
  9. Łączenie: można łączyć DataFrame za pomocą funkcji takich jak concat, join lub merge.
  10. Grupowanie: można grupować dane w DataFrame za pomocą funkcji groupby.
  11. pivot_table: tworzy tabelę przestawną z danych DataFrame
  12. melt: rozpuszcza kolumny DataFrame w wiersze
  13. crosstab: tworzy tabelę przestawną z danych DataFrame, obliczając liczbę wystąpień dla każdej kombinacji kategorii
  14. corr: oblicza wartość korelacji między kolumnami w DataFrame
  15. cov: oblicza macierz kowariancji dla kolumn w DataFrame
  16. diff: oblicza różnicę między kolejnymi elementami w każdej kolumnie
  17. shift: przesuwa elementy w każdej kolumnie o określoną liczbę pozycji
  18. stack: “spłaszcza” DataFrame do postaci serii z jednym poziomem indeksu
  19. unstack: rozkłada serię do postaci DataFrame z jedną kolumną
  20. rolling: tworzy okna przesuwne dla danych w każdej kolumnie
  21. expanding: tworzy okna rozszerzające dla danych w każdej kolumnie
  22. ewm: oblicza rozmytą średnią kroczącą dla danych w każdej kolumnie
  23. resample: zmienia częstotliwość danych w czasie w DataFrame
  24. describe: oblicza podstawowe statystyki opisowe dla danych w każdej kolumnie
  25. nlargest: zwraca n największych elementów z każdej kolumny
  26. nsmallest: zwraca n najmniejszych elementów z każdej kolumny
  27. quantile: oblicza kwantyle dla danych w każdej kolumnie
  28. isin: zwraca maskę logiczną, która określa, które elementy znajdują się w określonej liście
  29. duplicated: zwraca maskę logiczną, która określa, które elementy są duplikatami
  30. drop_duplicates: usuwa duplikaty z DataFrame
  31. where: zwraca elementy DataFrame zgodne z podaną maską logiczną
  32. mask: zwraca elementy DataFrame niezgodne z podaną maską logiczną
  33. clip: ogranicza wartości w DataFrame do określonego zakresu
  34. astype: konwertuje typ danych w DataFrame na inny typ
  35. pct_change: oblicza zmianę procentową między kolejnymi elementami w każdej kolumnie
  36. plot: rysuje wykres dla danych w DataFrame
  37. scatter_matrix: rysuje macierz wykresów punktowych dla danych w DataFrame
  38. boxplot: rysuje wykres pudełkowy dla danych w DataFrame
  39. hist: rysuje histogram dla danych w DataFrame
  40. kurt: oblicza kurtozę dla danych w każdej kolumnie
  41. skew: oblicza skośność dla danych w każdej kolumnie
  42. mad: oblicza średnią arytmetyczną odchyleń dla danych w każdej kolumnie