본문 바로가기

Library/PANDAS

PYTHON PANDAS - SERIES & SERIES DATA ACCESSING & DATA FRAME & NaN

반응형
PANDAS

 

 

 

import pandas as pd

 

 

 

 

 

PANDAS의 장점

 

 

 

Allows the use of labels for rows and columns

 

기본적인 통계데이터 제공

 

NaN values 를 알아서 처리함.

 

숫자 문자열을 알아서 로드함.

 

데이터셋들을 merge 할 수 있음.

 

It integrates with NumPy and Matplotlib

 

 

 

PANDAS 데이터 생성하기

 

 

import pandas as pd
import numpy as np
index = ['eggs', 'apples', 'milk', 'bread']
data = [30, 6, 'Yes', 'No']
np. array(data)
x = pd.Series(data = data)

 

판다스의 1차원 데이터를 Series(시리즈)라고 부른다.

 

 

groceries = pd.Series(data= data, index= index)

 

PANDAS를 알기 전까지의 인덱스 == 컴퓨터가 자동으로 매기는 인덱스

 

PANDAS를 배우는 이제부터는

 

PANDAS를 다룰때는 '인덱스' 라는 용어는

 

왼쪽에 붙어있는 것을 가리킨다. => 사람용 인덱스

 

 

 

 

 

 

PANDAS FUNCTIONS

 

.shape
.size
.ndim
.dtype
.index
.values
in

 

 

 

 

 

 

PANDAS SERIES DATA ACCESSING

 

 

 

 

 

 

PANDAS OPERATIONS

 

 

 

 

 

 

 

PANDAS DATA FRAME

 

 

 

 

레이블로 생성하기

 

import pandas as pd

# We create a dictionary of Pandas Series 
items = {'Bob' : pd.Series(data = [245, 25, 55], index = ['bike', 'pants', 'watch']),
         'Alice' : pd.Series(data = [40, 110, 500, 45], index = ['book', 'glasses', 'bike', 'pants'])}

df = pd.DataFrame(data= items)

 

- 용어 -


왼쪽 진한글자가 인덱스

 

위쪽 진한글자가 컬럼

 

안에 있는 데이터는 밸류

 

DataFrame, index, columns, values

 

 

 

 

 

 

NaN

 

 

NaN은 해당 항목에 값이 없음을 뜻함.

 

NaN은 실제로 np.nan과 같다.

 

 

 

 

 

 

 

 

 

반응형