반응형
PANDAS OPERATIONS
df = pd.DataFrame({'Employee ID':[111, 222, 333, 444],
'Employee Name':['Chanel', 'Steve', 'Mitch', 'Bird'],
'Salary [$/h]':[35, 29, 38, 20],
'Years of Experience':[3, 4 ,9, 1]})
df

# 경력이 3년 이상인 사람의 데이터를 가져오시오
df['Years of Experience'] >= 3

# 경력이 3년 이상인 사람의, 이름과 시급 정보를 가져오시오
df.loc[ df['Years of Experience'] >= 3 , [ 'Employee Name' , 'Salary [$/h]' ] ]

# 경력이 3년 이상이고, 8년 이하인 사람의 데이터를 가져오시오
df.loc[ (df['Years of Experience'] >= 3) & (df['Years of Experience'] <=8)]

# 시급이 가장 높은 사람은 누구인가
df['Salary [$/h]'].max()

df['Salary [$/h]'] == df['Salary [$/h]'].max()

df.loc[df['Salary [$/h]'] == df['Salary [$/h]'].max(), 'Employee Name']

APPLYING FUNCTIONS

# 직원 이름이 몇글자 인지, 글자수를 세어서
# 새로운 컬럼 length컬럼에 저장하시오
df['length'] = df['Employee Name'].str.len()


Employee Name컬럼의 데이터를 하나씩 가져와서 , len 함수에 적용하라
함수 안의 파라미터에 데이터를 입력하라. 라는 뜻
df['Employee Name'].apply(len)

# 시급이 30 이상이면, A 그룹
# 그렇지 않다면 B그룹이라고 구분 할 것이다.
# 따라서 새로운 컬럼 group 컬럼을 만들어서 A나 B값으로 저장하시오
def grouping(salay) :
if salay >= 30 :
return 'A'
else :
return 'B'
df['group'] = df['Salary [$/h]'].apply( grouping )

반응형
'Library > PANDAS' 카테고리의 다른 글
| PYTHON PANDAS - DATA FRAME PLOT (CHART) (0) | 2022.05.03 |
|---|---|
| PYTHON PANDAS - SORTING & ORDERING & CANCATENATING (0) | 2022.05.02 |
| PYTHON PANDAS - Loading Data & Categorical Data (0) | 2022.04.28 |
| PYTHON PANDAS - NaN (0) | 2022.04.28 |
| PYTHON PANDAS - DATA FRAME CHANGE & APPEND & DELETE (0) | 2022.04.28 |