Aby utworzyć dataframe z obiektu ndarray, można użyć funkcji pandas.DataFrame()
.
Przykład:
import pandas as pd
import numpy as np
data = np.array([[1, 2, 3], [4, 5, 6]])
df = pd.DataFrame(data, columns=['a', 'b', 'c'])
print(df)
a b c
0 1 2 3
1 4 5 6
Można też utworzyć dataframe z obiektu ndarray i ustawić indeksy rzędów za pomocą atrybutu index
:
import pandas as pd
import numpy as np
data = np.array([[1, 2, 3], [4, 5, 6]])
df = pd.DataFrame(data, columns=['a', 'b', 'c'], index=['row1', 'row2'])
print(df)
a b c
row1 1 2 3
row2 4 5 6
Parametr copy
określa, czy dane wejściowe mają być skopiowane przy tworzeniu dataframe’u. Domyślnie jest to False
, co oznacza, że dataframe będzie odwoływać się do oryginalnych danych, a nie do ich kopii.
import pandas as pd
import numpy as np
data = np.array([[1, 2, 3], [4, 5, 6]])
df = pd.DataFrame(data, columns=['a', 'b', 'c'], index=['row1', 'row2'], copy=True)
print(df)
a b c
row1 1 2 3
row2 4 5 6
Parametr ndim
określa liczbę wymiarów danych wejściowych. Dla obiektów ndarray zawsze jest to 2.
Parametr shape
określa kształt danych wejściowych jako parę liczb całkowitych (liczba rzędów, liczba kolumn).
Parametr size
określa liczbę elementów w danych wejściowych.
import pandas as pd
import numpy as np
data = np.array([[1, 2, 3], [4, 5, 6]])
# Parametr 'copy'
df = pd.DataFrame(data, columns=['a', 'b', 'c'], index=['row1', 'row2'], copy=True)
print(df)
a b c
row1 1 2 3
row2 4 5 6
# Parametr 'ndim'
df = pd.DataFrame(data, columns=['a', 'b', 'c'], index=['row1', 'row2'], ndim=2)
print(df)
a b c
row1 1 2 3
row2 4 5 6
# Parametr 'shape'
df = pd.DataFrame(data, columns=['a', 'b', 'c'], index=['row1', 'row2'], shape=(2, 3))
print(df)
a b c
row1 1 2 3
row2 4 5 6
# Parametr 'size'
df = pd.DataFrame(data, columns=['a', 'b', 'c'], index=['row1', 'row2'], size=6)
print(df)
a b c
row1 1 2 3
row2 4 5 6