ndarray to dataframe

Aby utworzyć dataframe z obiektu ndarray, można użyć funkcji pandas.DataFrame().

Przykład:

import pandas as pd
import numpy as np

data = np.array([[1, 2, 3], [4, 5, 6]])
df = pd.DataFrame(data, columns=['a', 'b', 'c'])
print(df)

   a  b  c
0  1  2  3
1  4  5  6

Można też utworzyć dataframe z obiektu ndarray i ustawić indeksy rzędów za pomocą atrybutu index:

import pandas as pd
import numpy as np

data = np.array([[1, 2, 3], [4, 5, 6]])
df = pd.DataFrame(data, columns=['a', 'b', 'c'], index=['row1', 'row2'])
print(df)

       a  b  c
row1  1  2  3
row2  4  5  6

Parametr copy określa, czy dane wejściowe mają być skopiowane przy tworzeniu dataframe’u. Domyślnie jest to False, co oznacza, że dataframe będzie odwoływać się do oryginalnych danych, a nie do ich kopii.

import pandas as pd
import numpy as np

data = np.array([[1, 2, 3], [4, 5, 6]])
df = pd.DataFrame(data, columns=['a', 'b', 'c'], index=['row1', 'row2'], copy=True)
print(df)

       a  b  c
row1  1  2  3
row2  4  5  6

Parametr ndim określa liczbę wymiarów danych wejściowych. Dla obiektów ndarray zawsze jest to 2.

Parametr shape określa kształt danych wejściowych jako parę liczb całkowitych (liczba rzędów, liczba kolumn).

Parametr size określa liczbę elementów w danych wejściowych.

import pandas as pd
import numpy as np

data = np.array([[1, 2, 3], [4, 5, 6]])

# Parametr 'copy'
df = pd.DataFrame(data, columns=['a', 'b', 'c'], index=['row1', 'row2'], copy=True)
print(df)


       a  b  c
row1  1  2  3
row2  4  5  6

# Parametr 'ndim'
df = pd.DataFrame(data, columns=['a', 'b', 'c'], index=['row1', 'row2'], ndim=2)
print(df)

       a  b  c
row1  1  2  3
row2  4  5  6

# Parametr 'shape'
df = pd.DataFrame(data, columns=['a', 'b', 'c'], index=['row1', 'row2'], shape=(2, 3))
print(df)

       a  b  c
row1  1  2  3
row2  4  5  6

# Parametr 'size'
df = pd.DataFrame(data, columns=['a', 'b', 'c'], index=['row1', 'row2'], size=6)
print(df)

       a  b  c
row1  1  2  3
row2  4  5  6