Dane kategoryczne

Oto przykłady użycia typów kategorycznych w Pandas:

import pandas as pd

# Tworzenie ramki danych z kolumną zawierającą dane kategoryczne
df = pd.DataFrame({'name': ['John', 'Mary', 'Peter', 'Alice'],
                   'gender': ['male', 'female', 'male', 'female'],
                   'age': [25, 30, 35, 40]})

# Konwersja kolumny 'gender' na typ kategoryczny
df['gender'] = df['gender'].astype('category')

# Wyświetlanie ramki danych
print(df)

   name  gender  age
0  John    male   25
1  Mary  female   30
2  Peter    male   35
3  Alice  female   40

Możesz również określić kategorie, do których należą dane w kolumnie z typem kategorycznym, używając parametru “categories”:

import pandas as pd

df = pd.DataFrame({'name': ['John', 'Mary', 'Peter', 'Alice'],
                   'color': ['red', 'green', 'blue', 'red']})

# Konwersja kolumny 'color' na typ kategoryczny z ograniczoną liczbą kategorii
df['color'] = df['color'].astype('category', categories=['red', 'green', 'yellow'])

# Wyświetlanie ramki danych
print(df)
   name   color
0  John     red
1  Mary   green
2  Peter    blue
3  Alice     red

W tym przykładzie kolumna “color” została skonwertowana na typ kategoryczny z ograniczoną liczbą kategorii: “red”, “green” i “yellow”. Wartość “blue” nie należy do żadnej z tych kategorii, więc zostanie oznaczona jako “NaN” (brak wartości).