Oto przykłady użycia typów kategorycznych w Pandas:
import pandas as pd
# Tworzenie ramki danych z kolumną zawierającą dane kategoryczne
df = pd.DataFrame({'name': ['John', 'Mary', 'Peter', 'Alice'],
'gender': ['male', 'female', 'male', 'female'],
'age': [25, 30, 35, 40]})
# Konwersja kolumny 'gender' na typ kategoryczny
df['gender'] = df['gender'].astype('category')
# Wyświetlanie ramki danych
print(df)
name gender age
0 John male 25
1 Mary female 30
2 Peter male 35
3 Alice female 40
Możesz również określić kategorie, do których należą dane w kolumnie z typem kategorycznym, używając parametru “categories”:
import pandas as pd
df = pd.DataFrame({'name': ['John', 'Mary', 'Peter', 'Alice'],
'color': ['red', 'green', 'blue', 'red']})
# Konwersja kolumny 'color' na typ kategoryczny z ograniczoną liczbą kategorii
df['color'] = df['color'].astype('category', categories=['red', 'green', 'yellow'])
# Wyświetlanie ramki danych
print(df)
name color
0 John red
1 Mary green
2 Peter blue
3 Alice red
W tym przykładzie kolumna “color” została skonwertowana na typ kategoryczny z ograniczoną liczbą kategorii: “red”, “green” i “yellow”. Wartość “blue” nie należy do żadnej z tych kategorii, więc zostanie oznaczona jako “NaN” (brak wartości).