Zmiana skali danych - Baza wiedzy Data Science

Pandas to biblioteka Python używana do przetwarzania i analizy danych. Może ona służyć do zmiany skali danych w różny sposób. Oto kilka przykładów:

Aby znormalizować dane, można użyć metody DataFrame.apply() z funkcją, która dzieli każdy element przez maksymalną wartość w kolumnie.

import pandas as pd

# Tworzymy przykładowy DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})

# Normalizujemy dane przez dzielenie przez maksymalną wartość w kolumnie
df_normalized = df.apply(lambda x: x / x.max())
print(df_normalized)

          A         B
0  0.166667  0.666667
1  0.333333  0.833333
2  0.500000  1.000000

Aby zmienić skalę danych na logarytmiczną, można użyć funkcji numpy.log() z metodą apply().

import numpy as np

# Tworzymy przykładowy DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})

# Zmieniamy skalę na logarytmiczną
df_log = df.apply(lambda x: np.log(x))
print(df_log)

          A         B
0  0.000000  1.386294
1  0.693147  1.609438
2  1.098612  1.791759

Te to tylko niektóre z możliwości zmiany skali danych za pomocą biblioteki Pandas. Więcej informacji można znaleźć w dokumentacji tej biblioteki.