Interpolacja

Interpolacja danych to proces wypełniania brakujących wartości w ciągu danych za pomocą określonej metody przybliżania. W pandas interpolacja danych jest zwykle wykonywana za pomocą metody interpolate, która jest dostępna w obiektach typu Series i DataFrame.

Przykład interpolacji danych za pomocą metody liniowej:

import pandas as pd

# Tworzenie przykładowego DataFrame'u z brakującymi wartościami
df = pd.DataFrame({'Data': ['2022-01-01', '2022-01-03', '2022-01-06', '2022-01-07'], 'Liczba': [1, 3, 6, 7]})

# Konwersja kolumny 'Data' na typ daty
df['Data'] = pd.to_datetime(df['Data'])

# Ustawienie kolumny 'Data' jako indeksu
df.set_index('Data', inplace=True)

# Interpolacja brakujących wartości za pomocą metody liniowej
df_interp = df.interpolate(method='linear')

Wynikowy DataFrame df_interp będzie zawierał brakujące wartości wypełnione za pomocą interpolacji liniowej.

Można również użyć innych metod interpolacji, takich jak metoda kwadratowa, metoda logarytmiczna lub metoda sześcienna.

# Interpolacja brakujących wartości za pomocą metody sześciennej
df_interp = df.interpolate(method='cubic')

Interpolacja za pomocą metody logarytmicznej:

# Interpolacja brakujących wartości za pomocą metody logarytmicznej
df_interp = df.interpolate(method='logarithmic')