Statystyki opisowe - Baza wiedzy Data Science

Pandas to biblioteka Python, która służy do przetwarzania i analizy danych. Można ją użyć do obliczania różnych statystyk opisowych dla kolumn w obiekcie typu DataFrame. Oto kilka przykładów:

Aby obliczyć średnią dla kolumny danych numerycznych, można użyć metody DataFrame.mean():

import pandas as pd

# Tworzymy przykładowy DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})

# Obliczamy średnią dla kolumny A
mean_a = df['A'].mean()
print(mean_a)
Wynik: 2.0

Aby obliczyć mediana dla kolumny danych numerycznych, można użyć metody DataFrame.median():

import pandas as pd

# Tworzymy przykładowy DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})

# Obliczamy medianę dla kolumny B
median_b = df['B'].median()
print(median_b)
Wynik: 5.0

Aby obliczyć wariancję dla kolumny danych numerycznych, można użyć metody DataFrame.var():

import pandas as pd

# Tworzymy przykładowy DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})

# Obliczamy wariancję dla kolumny B
variance_b = df['B'].var()
print(variance_b)
Wynik: 2.0

Te to tylko niektóre z możliwości obliczania statystyk opisowych za pomocą biblioteki Pandas. Więcej informacji można znaleźć w dokumentacji tej biblioteki.