반응형
PANDAS
import pandas as pd
PANDAS의 장점
Allows the use of labels for rows and columns
기본적인 통계데이터 제공
NaN values 를 알아서 처리함.
숫자 문자열을 알아서 로드함.
데이터셋들을 merge 할 수 있음.
It integrates with NumPy and Matplotlib
PANDAS 데이터 생성하기
import pandas as pd
import numpy as np
index = ['eggs', 'apples', 'milk', 'bread']
data = [30, 6, 'Yes', 'No']
np. array(data)
x = pd.Series(data = data)

판다스의 1차원 데이터를 Series(시리즈)라고 부른다.
groceries = pd.Series(data= data, index= index)

PANDAS를 알기 전까지의 인덱스 == 컴퓨터가 자동으로 매기는 인덱스
PANDAS를 배우는 이제부터는
PANDAS를 다룰때는 '인덱스' 라는 용어는
왼쪽에 붙어있는 것을 가리킨다. => 사람용 인덱스
PANDAS FUNCTIONS
.shape
.size
.ndim
.dtype
.index
.values
in
PANDAS SERIES DATA ACCESSING

PANDAS OPERATIONS

PANDAS DATA FRAME
레이블로 생성하기
import pandas as pd
# We create a dictionary of Pandas Series
items = {'Bob' : pd.Series(data = [245, 25, 55], index = ['bike', 'pants', 'watch']),
'Alice' : pd.Series(data = [40, 110, 500, 45], index = ['book', 'glasses', 'bike', 'pants'])}

df = pd.DataFrame(data= items)

- 용어 -
왼쪽 진한글자가 인덱스
위쪽 진한글자가 컬럼
안에 있는 데이터는 밸류
DataFrame, index, columns, values

NaN
NaN은 해당 항목에 값이 없음을 뜻함.
NaN은 실제로 np.nan과 같다.

반응형
'Library > PANDAS' 카테고리의 다른 글
| PYTHON PANDAS - PANDAS OPERATIONS & APPLYING FUNCTION (0) | 2022.04.28 |
|---|---|
| PYTHON PANDAS - Loading Data & Categorical Data (0) | 2022.04.28 |
| PYTHON PANDAS - NaN (0) | 2022.04.28 |
| PYTHON PANDAS - DATA FRAME CHANGE & APPEND & DELETE (0) | 2022.04.28 |
| PYTHON PANDAS - DATA FRAME ACCESSING (0) | 2022.04.28 |