본문 바로가기

인공지능/머신러닝

(7)
[머신러닝ML] 분류 앙상블 모델 앙상블 모델 - tree구조(결정트리)를 기반으로 만들어진 모델 - 여러개의 트리 모델을 이용해서 훈련하는 모델을 앙상블 모델이라고 칭합니다. 앙상블 모델 분류 - 회귀와 분류에서 모두 사용한 모델들 입니다. - sklearn 패키지 모델은 모두 가능. - xgb도 가능. 분류 모델 - 랜덤포레스트 - 엑스트라트리 - 그레디언트 부스팅 - 히스트그레디언트부스팅 - XGboost 앙상블 모델 - 배깅(Bagging)과 부스팅(Boosting) 방식 - 앙상블 모델은 여러개의 트리를 사용하기 때문에 → 훈련 데이터를 여러 모델(여러 트리)에 적용하는 방식에 따라서 → 배깅과 부스팅 방식으로 구분합니다. 배깅(Bagging) 방식 - 사용되는 여러개의 모델(여러 트리)들은 서로 독립적으로 사용됨(연관성 없음)..
[머신러닝ML]모델 파일 저장 및 불러오기 1. 와인데이터 불러들이기 2. 랜덤포레스트로 훈련까지(fit)만 수행하기 라이브러리 """데이터 처리""" import pandas as pd import numpy as np """데이터 분류""" from sklearn.model_selection import train_test_split """하이퍼파라메터 튜닝""" from sklearn.model_selection import GridSearchCV """사용할 분류모델들""" from sklearn.ensemble import RandomForestClassifier from sklearn.ensemble import ExtraTreesClassifier from sklearn.ensemble import GradientBoostingCla..
[머신러닝ML] 머신러닝 실습 - 다중회귀모델(Multiple Regression) 다중회귀모델 - 여러 개의 특성을 사용한 회귀모델 - 특성이 많을 수록 복잡도가 증가됨(훈련 시간이 오래걸림, 시스템 성능에 따라 빠를 수도 있음) - 다중회귀모델 공식 y = a*x1 + b*x2 + c*x3 + ... + y절편 ### 데이터 불러들이기 # 사용할 데이터프레임 변수 : df import pandas as pd df= pd.read_csv("./data/03_농어의_길이_높이_두께_데이터.csv") df.info() df.head() df.describe() 농어 데이터에 다중회귀모델 적용하기 - 독립변수 : 길이, 두께, 높이 - 종속변수 : 무게 - 독립변수 생성하기 : 데이터프레임의 특성 중에 독립변수로 사용할 특성들을 2차원의 리스트 또는 배열 형태로 만들어야 합니다. # 독립변..
[머신러닝ML] 머신러닝 실습 - 선형회귀모델(LR; Linear Regression Model), 다항회귀모델(곡선) 선형회귀모델 ### 모델 라이브러리 불러들이기 from sklearn.linear_model import LinearRegression ### 사용할 데이터 train_input, test_input, train_target, test_target = train_test_split(perch_length, perch_weight, test_size=0.25, random_state=42) print(f"{train_input.shape} : {train_target.shape}") print(f"{test_input.shape} : {test_target.shape}") ### 모델 생성하기 lr = LinearRegression() lr ### 모델 훈련 시키기 lr.fit(train_input, tr..
[머신러닝ML] 머신러닝 실습 - KNN모델(회귀모델) 라이브러리 정의 import numpy as np import matplotlib.pyplot as plt # 폰트 환경설정 라이브러리 from matplotlib import font_manager, rc plt.rc("font", family = "Malgun Gothic") ### 그래프 내에 마이너스( - ) 표시 기호 적용하기 plt.rcParams["axes.unicode_minus"] = False from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighborsRegressor ### 회귀평가 라이브러리 from sklearn.metrics import mean_absolute_error ..
[머신러닝ML]머신러닝 실습 - 생선 구분하기(K최근접이웃 모델, KNN) 목차 1. 머신러닝 실습 2. 데이터 분포 확인하기 3. 생선 분류하기 4. 하이퍼파라메터 튜닝 머신러닝 실습 먼저 문제를 내주고 답을 준다음 학습하도록 한다. 1. 생선구분하기 K최근접이웃모델 : 분류분석 - 독립변수 : 길이와 무게 - 종속변수 : 도미? 빙어? - 정답을 만들어야 한다 = 라벨링 작업(머신러닝 중 가장 오래걸리는 작업) 2. 라이브러리 - import matplotlib.pyplot as plt 3. 데이터 처리 - 빙어와 도미 데이터 - 생선의 종류를 분류(구분)하기 위한 모델 생성을 위해 독립변수와 종속변수로 데이터를 가공해야함 - 독립변수(x) : 길이, 무게 - 종속변수(y) : 생선종류(빙어 또는 도미) 1. 데이터 전처리 2. 데이터 정규화(표준..
[머신러닝ML] 머신러닝이란? 목차 1. 머신러닝이란? 2. 머신러닝의 학습 프로세스와 종류 3. 머신러닝 환경 구축하기 머신러닝이란? 머신러닝(ML) ▪ 알고리즘(algorithms) : 어떠한 문제를 해결하기 위한 일련의 절차나 방법 ▪ 머신러닝(machinelearning) : 기계가 패턴(규칙)을 학습하여 자동화하는 알고리즘 EX) 유튜브 : 개인이 유튜브 영상을 보는 패턴에 대해 학습하는 프로그램(머신러닝)을 만든 다음 그 패턴(알고리즘)에 맞게 다음 영상을 계속 추천 EX) 구매 추천 : 인터넷쇼핑몰에서장바구니에추가한제품과비슷한 제품구매를추천 EX) 번역 : 머신러닝에전문번역가의번역을학습시켜새로운문 장을번역하게함 EX) 자율주행차 : 머신러닝 기술 중 하나인 이미지 처리 기술을 활용하여 도로상의 여러 이미지를 학습,차량에 ..