DataFrame w Pandas to dwuwymiarowa tabela danych z etykietami (nazwami) wierszy i kolumn. Oto kilka przykładów operacji, które można wykonać na obiekcie DataFrame:
- Wybieranie elementów: można wybierać pojedyncze lub wielokrotne elementy za pomocą indeksów, nazw kolumn lub maski logicznej.
- Filtracja danych: można odfiltrować wiersze lub kolumny za pomocą maski logicznej lub warunku.
- Agregacje: można wykonywać różne agregacje danych, takie jak
sum
,mean
,min
,max
itp. na poziomie wierszy lub kolumn. - Transformacje: można wykonywać różne transformacje na danych, takie jak zaokrąglanie, konwersja na inny typ danych itp.
- Brakujące dane: można obsługiwać brakujące dane w DataFrame za pomocą funkcji takich jak
dropna
lubfillna
. - Indeksowanie: można zmieniać indeksy DataFrame za pomocą funkcji takich jak
set_index
lubreset_index
. - Sortowanie: można sortować DataFrame według wartości lub indeksu za pomocą funkcji
sort_values
lubsort_index
. - Operacje matematyczne: można wykonywać podstawowe operacje matematyczne (dodawanie, odejmowanie, mnożenie itp.) na DataFrame za pomocą standardowych operatorów lub funkcji takich jak
add
,subtract
,multiply
itp. - Łączenie: można łączyć DataFrame za pomocą funkcji takich jak
concat
,join
lubmerge
. - Grupowanie: można grupować dane w DataFrame za pomocą funkcji
groupby
. pivot_table
: tworzy tabelę przestawną z danych DataFramemelt
: rozpuszcza kolumny DataFrame w wierszecrosstab
: tworzy tabelę przestawną z danych DataFrame, obliczając liczbę wystąpień dla każdej kombinacji kategoriicorr
: oblicza wartość korelacji między kolumnami w DataFramecov
: oblicza macierz kowariancji dla kolumn w DataFramediff
: oblicza różnicę między kolejnymi elementami w każdej kolumnieshift
: przesuwa elementy w każdej kolumnie o określoną liczbę pozycjistack
: “spłaszcza” DataFrame do postaci serii z jednym poziomem indeksuunstack
: rozkłada serię do postaci DataFrame z jedną kolumnąrolling
: tworzy okna przesuwne dla danych w każdej kolumnieexpanding
: tworzy okna rozszerzające dla danych w każdej kolumnieewm
: oblicza rozmytą średnią kroczącą dla danych w każdej kolumnieresample
: zmienia częstotliwość danych w czasie w DataFramedescribe
: oblicza podstawowe statystyki opisowe dla danych w każdej kolumnienlargest
: zwraca n największych elementów z każdej kolumnynsmallest
: zwraca n najmniejszych elementów z każdej kolumnyquantile
: oblicza kwantyle dla danych w każdej kolumnieisin
: zwraca maskę logiczną, która określa, które elementy znajdują się w określonej liścieduplicated
: zwraca maskę logiczną, która określa, które elementy są duplikatamidrop_duplicates
: usuwa duplikaty z DataFramewhere
: zwraca elementy DataFrame zgodne z podaną maską logicznąmask
: zwraca elementy DataFrame niezgodne z podaną maską logicznąclip
: ogranicza wartości w DataFrame do określonego zakresuastype
: konwertuje typ danych w DataFrame na inny typpct_change
: oblicza zmianę procentową między kolejnymi elementami w każdej kolumnieplot
: rysuje wykres dla danych w DataFramescatter_matrix
: rysuje macierz wykresów punktowych dla danych w DataFrameboxplot
: rysuje wykres pudełkowy dla danych w DataFramehist
: rysuje histogram dla danych w DataFramekurt
: oblicza kurtozę dla danych w każdej kolumnieskew
: oblicza skośność dla danych w każdej kolumniemad
: oblicza średnią arytmetyczną odchyleń dla danych w każdej kolumnie