Machine Learning - 구두점 & STOPWORDS(불용어) & Pipe Lining
쉼표, 마침표 등의 구두점 제거 방법 Test = 'Hello Mr. Future. I am so happy to be learning AI now~' import string string.punctuation 위의 문장에서, 글자를 앞에서부터 하나씩 가져와서, 구두점인지 확인한 후, 구두점이 아닌 문자만 리스트로 저장 # 결과 예시) [ 'H', 'e', 'l', ... 'M', 'r', ' ','F' ... ] Test_punc_removed = [] for char in Test : if char not in string.punctuation : Test_punc_removed.append( char ) 컴프리핸션을 이용해 코드를 작성 [ char for char in Test if char not..
Machine Learning - GridSearchCV
GridSearchCV hyper parameter 하이퍼파라미터 사람이 설정해줘야 되는 값이고, 어떤 값을 설정해야 똑똑한 인공지능이 나올지는 아무도 모른다. param_grid = { 'C' : [0.1, 1, 10, 100] , 'kernel' : ['linear', 'rdf', 'poly'], 'gamma' : [1, 0.1, 0.01]} from sklearn.model_selection import GridSearchCV grid = GridSearchCV( SVC() , param_grid , refit=True, verbose=4 ) grid.fit(X_train, y_train) best_classifier = grid.best_estimator_ y_pred = best_classifi..