Pandas to biblioteka Python, która służy do przetwarzania i analizy danych. Można ją użyć do obliczania różnych statystyk opisowych dla kolumn w obiekcie typu DataFrame
. Oto kilka przykładów:
- Aby obliczyć średnią dla kolumny danych numerycznych, można użyć metody
DataFrame.mean()
:
import pandas as pd
# Tworzymy przykładowy DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
# Obliczamy średnią dla kolumny A
mean_a = df['A'].mean()
print(mean_a)
Wynik: 2.0
Aby obliczyć mediana dla kolumny danych numerycznych, można użyć metody DataFrame.median()
:
import pandas as pd
# Tworzymy przykładowy DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
# Obliczamy medianę dla kolumny B
median_b = df['B'].median()
print(median_b)
Wynik: 5.0
Aby obliczyć wariancję dla kolumny danych numerycznych, można użyć metody DataFrame.var()
:
import pandas as pd
# Tworzymy przykładowy DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
# Obliczamy wariancję dla kolumny B
variance_b = df['B'].var()
print(variance_b)
Wynik: 2.0
Te to tylko niektóre z możliwości obliczania statystyk opisowych za pomocą biblioteki Pandas. Więcej informacji można znaleźć w dokumentacji tej biblioteki.