[딥러닝] 신경망계층 추가방법 및 성능향상방법

~ 목차 ~

1. 신경망모델에 계층(layer) 추가하는 방법

2. 성능 향상 방법

3. 옵티마이저(Optimizer)

- SGD(확률적 경사하강법), Adagrad, RMSProp, Adam

- 학습률

- 모멘텀

fashion_mnist 데이터로 독립변수와 종속변수 읽어들이기

라이브러리

import tensorflow as tf
from tensorflow import keras

import matplotlib.pyplot as plt
import numpy as np

from sklearn.model_selection import train_test_split

"""실행 결과를 동일하게 하기 위한 처리(완전 동일하지 않을 수도 있음)"""
tf.keras.utils.set_random_seed(42)

"""연산 고정"""
tf.config.experimental.enable_op_determinism()

데이터 수집

(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()

print(train_input.shape , train_target.shape)
print(test_input.shape , test_target.shape)

출력 : (60000, 28, 28) (60000,)
(10000, 28, 28) (10000,)

정규화

train_scaled_255 = train_input / 255.0
test_scaled_255 = test_input / 255.0
train_scaled_255.shape, test_scaled_255.shape

출력 : ((60000, 28, 28), (10000, 28, 28))

데이터 전처리(2차원 데이터로 변환하기)

train_scaled_2d = train_scaled_255.reshape(-1, 28*28)
test_scaled_2d = test_scaled_255.reshape(-1, 28*28)
print(train_scaled_2d.shape, test_scaled_2d.shape)

출력 : (60000, 784) (10000, 784)

훈련:검증(8:2)로 분류하기

훈련 및 검증 데이터로 분류하기 (8:2)

train_scaled, val_scaled, train_target, val_target = train_test_split(train_scaled_2d, train_target,
test_size=0.2,
random_state=42)

print(train_scaled.shape, train_target.shape)
print(val_scaled.shape, val_target.shape)
print(test_scaled_2d.shape, test_target.shape)

출력 : (48000, 784) (48000,)
(12000, 784) (12000,)
(10000, 784) (10000,)

계층 추가하기

신경망모델에 계층(layer) 추가하는 방법(3가지)

1. 층을 먼저 만들고, 신경망 모델 생성 시 추가하기

2. 신경망모델 생성 시 계층(layer)을 함께 추가

3. 신경망 모델을 먼저 생성 후, 계층 추가하기

[1번 방법] 층을 먼저 만들고, 신경망 모델 생성 시 추가하기

입력계층(Input Layer) 생성하기

dense1 = keras.layers.Dense(
                            ### 출력 개수(units은 생략가능)
                            100,
                            activation="sigmoid",
                            ### 입력 개수
                            input_shape=(784, ))
dense1

출력 : <keras.layers.core.dense.Dense at 0x27234b85df0>

출력계층(Output Layer) 생성하기

### 다중분류는 softmax 활성화 함수 사용해야함.
### 10개를 출력해야함 // 100개->10개로 확률로 손실 적은 것으로 출력시켜줌.
dense2 = keras.layers.Dense(10, activation="softmax")
dense2

출력 : <keras.layers.core.dense.Dense at 0x27234b85a90>

신경망 모델 생성하기

### 껍데기 모델에 계층 추가함, 보통 파이썬에서 여러 개 넣을때 리스트 형태로 넣으면 됨
model = keras.Sequential([dense1, dense2])
model

출력 : <keras.engine.sequential.Sequential at 0x27234b85d60>

모델 계층 확인하기

model.summary()

출력 :

[2번 방법] 신경망모델 생성 시 계층(layer)을 함께 추가

모델 생성 및 계층 추가하기

model = keras.Sequential(

[keras.layers.Dense(
                            100,
                            activation="sigmoid",
                            input_shape=(784, ),
                            ### name : 계층 이름 설정
                            name="Input-Layer"),
                          keras.layers.Dense(10, activation="softmax",  name="Output-Layer")
],

name = "Model-2")
model

출력 : <keras.engine.sequential.Sequential at 0x27234b8c970>

모델 계층 확인하기

⭐나중에 꼭 캡처해놓기⭐

model.summary()

출력 :

[3번 방법] 신경망 모델을 먼저 생성 후, 계층 추가하기

신경망 모델 생성하기

⚡신경망 모델 생성하기
- 일반적으로 사용되는 방식(빈 껍데기 만들고 계층 추가하기)
- 위의 1, 2 방법으로 수행 후, 계층을 추가할 필요성이 있을 경우에도 사용됨 ( add 사용 )

model = keras.Sequential()
model

출력 : <keras.engine.sequential.Sequential at 0x27234b8c340>

계층 생성 및 모델에 추가하기

model.add(
keras.layers.Dense(100, activation="sigmoid", input_shape=(784, ), name="Input-Layer")
)
model.add(
keras.layers.Dense(10, activation="softmax", name = "Output-Layer")
)

model

출력 : <keras.engine.sequential.Sequential at 0x27234b8c340>

모델 계층 확인하기

⭐나중에 꼭 캡처해놓기⭐

model.summary()

출력 :

모델 설정하기(compile)

"""손실함수는 다중분류 사용"""
model.compile(
loss = "sparse_categorical_crossentropy",
metrics = "accuracy"
)

출력 :

모델 훈련하기(fit)

"""반복횟수 10번 → 100번(하이퍼파라메터 튜닝) 추가"""
model.fit(train_scaled, train_target, epochs=100)

출력 :

성능 평가하기(검증)

"""손실율과 정확도 출력하기"""

score = model.evaluate(val_scaled, val_target)

print(f"손실율 : {score[0]}, 정확도 : {score[1]}")

출력 : 손실율 : 0.5846814513206482, 정확도 : 0.8820833563804626

해석🪄 : 정확도를 보았을때 0.9정도가 정확도가 높다라 한다.

과대,과소,정상 중 정상인 편 검증 정확도 보다 훈련 정확도가 높으므로

성능 향상시키기

<성능 향상 방법>

1. 데이터 증가 시키기

2. 하이퍼파라메터 튜닝

→ 반복횟수 증가

→ 계층 추가 또는 제거(일반적으로 추가)

→ 이외 하이퍼파라메터들...

3. 옵티마이저

[1번 방법] 반복횟수 증가

훈련 반복횟수 증가시키기(50회 → 100회)

"""반복횟수 10번 → 100번(하이퍼파라메터 튜닝) 추가"""
model.fit(train_scaled, train_target, epochs=100)

출력 :

성능 평가하기(검증)

"""손실율과 정확도 출력하기"""

score = model.evaluate(val_scaled, val_target)

print(f"손실율 : {score[0]}, 정확도 : {score[1]}")

출력 : 손실율 : 0.5846814513206482, 정확도 : 0.8820833563804626

[2번 방법] 성능향상 - 은닉 계층(Hidden Layer) 추가

모델 생성

model = keras.Sequential()
model

출력 : <keras.engine.sequential.Sequential at 0x2724e7f4670>

입력 계층 추가하기

- 전처리 계층으로 추가

⭐Flatten()⭐
: 차원축소 전처리 계층 (1차원으로 축소)
          : 훈련에 영향을 미치지는 않음 ⭐⭐
          : 일반적으로 입력계층 다음에 추가하거나, 입력계층으로 사용되기도 함
          : 이미지 데이터 처리시에 주로 사용됨

model.add(
keras.layers.Flatten(input_shape=(28, 28))
)

중간계층 = 은닉계층(hidden layer) 생성하기

- Dense()로 만들어지는 계층은 모델 성능에 영향을 미침 ⭐⭐

model.add(
keras.layers.Dense(100, activation = "relu")
)

출력 계층(output layer) 생성하기

- Dense()로 만들어지는 계층은 모델 성능에 영향을 미침 ⭐⭐

model.add(
keras.layers.Dense(10, activation="softmax")
)

모델에 추가된 계층 모두 확인하기

model.summary()

모델 설정하기(compile)

model.compile(
loss = "sparse_categorical_crossentropy",
metrics = "accuracy"
)

※ flatten 계층은 1차원이므로 훈련이 안됨.

왜? 훈련모델은 2차원데이터로 되어있으므로

그래서 깨끗한 데이터 다시 가져와야함(2차원으로 변환 하지 않기!)

차원축소하지 않은 정규화된 데이터로 다시 생성

⚡ 깨끗한 데이터 다시 가져와야함
- 훈련모델은 2차원데이터로 되어있는데 flatten 계층은 1차원이므로 훈련이 안됨
- 따라서 2차원 변환하지 않은 데이터 가져오기

(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()

print(train_input.shape , train_target.shape)
print(test_input.shape , test_target.shape)

출력 : (60000, 28, 28) (60000,)
(10000, 28, 28) (10000,)

train_scaled_255 = train_input / 255.0
test_scaled_255 = test_input / 255.0

train_scaled, val_scaled, train_target, val_target = train_test_split(train_scaled_255, train_target,
test_size=0.2,
random_state=42)

print(train_scaled.shape, train_target.shape)
print(val_scaled.shape, val_target.shape)
print(test_scaled_255.shape, test_target.shape)

출력 :

(48000, 28, 28) (48000,)
(12000, 28, 28) (12000,)
(10000, 28, 28) (10000,)

모델 훈련시키기

model.fit(train_scaled, train_target, epochs=100)

출력 :

성능평가 - 검증하기

score = model.evaluate(val_scaled, val_target)
score

출력 :

375/375 [==============================] - 0s 535us/step - loss: 1.1827 - accuracy: 0.8741

[1.1827137470245361, 0.8740833401679993]

옵티마이저

<성능 향상 방법>

1. 데이터 증가 시키기

2. 하이퍼파라메터 튜닝

→ 반복횟수 증가

→ 계층 추가 또는 제거(일반적으로 추가)

→ 이외 하이퍼파라메터들...

3. 옵티마이저

<옵티마이저(Optimizer)>

- 옵티마이저 설정 위치 : compile() 시에 설정함
- 손실을 줄여나가기 위한 방법을 설정함
- 손실을 줄여나가는 방법을 보통 "경사하강법" 이라고 칭합니다.
- "경사하강법"을 이용한 여러가지 방법들 중 하나를 선택하는 것이 옵티마이저 선택입니다.
- 옵티마이저 종류 : SGD(확률적 경사하강법), Adagrad, RMSProp, Adam 이 있음

* SGD(확률적경사하강법)
- 현재 위치에서 기울어진 방향을 찾을 때
→ 지그재그 모양으로 탐색해 나가는 방법

* Adagrad
- 학습율을 적절하게 설정하기 위해 학습율 감소라는 기술을 사용
- 학습 진행 중에 학습율을 줄여가는 방법을 사용
- 처음에는 학습율(보폭)을 크게 학습하다가, 점점 작게 학습한다는 의미

* RMSProp
- Adagrad의 단점을 보완한 방법
- Adagrad는 학습량을 점점 작게 학습하기 때문에 학습량이 0이 되어 갱신되지 않는(학습되지 않는) 시점이 발생할 수 있는 단점이 있음
- 이러한 단점을 보완하여 과거의 기울기 값을 반영하는 방식 사용
- 먼 과거의 기울기(경사) 값은 조금 반영하고, 최근 기울기(경사)를 많이 반영
- Optimizer의 기본값(default)로 사용됨

* Adam
- 공이 굴러가듯이 모멘텀(momentum → 관성)과 Adagrad를 융합한 방법
- 자주 사용되는 기법으로, 좋은 결과를 얻을 수 있는 방법으로 유명함
** 모멘텀 : 관성과 가속도를 적용하여 이동하던 방향으로 좀 더 유연하게 작동함
- 메모리 사용이 많은 단점이 있음(과거 데이터를 저장해 놓음)
- 가장 많이 사용하는 방법

옵티마이저 - compile

model.compile(
    ### 옵티마이저 정의 : 손실을 줄여나가는 방법
    optimizer="sgd",
    loss="sparse_categorical_crossentropy",
    metrics="accuracy"
)

옵티마이저 - fit

model.fit(train_scaled, train_target, epochs=10)

옵티마이저 - evaluate

score = model.evaluate(val_scaled, val_target)
score

출력 :

375/375 [==============================] - 0s 574us/step - loss: 1.0868 - accuracy: 0.8797

[1.086826205253601, 0.8796666860580444]

옵티마이저 - 학습률

<옵티마이저에 학습률 적용하기>

* 학습률을 적용하는 방법
- 사용되는 4개의 옵티마이저를 객체로 생성하여 learning_rate(학습률) 값을 설정할 수 있음
- 학습률 : 보폭 이라고 생각하시면 됩니다.
- 학습률이 작을 수록 보폭이 작다고 보시면 됩니다.
- 가장 손실이 작은 위치를 찾아서 움직이게 됩니다.
- 이때 가장 손실이 작은 위치는 모델이 스스로 찾아서 움직이게 됩니다.(사람 관여하지 않음)
- 학습률의 기본값은 = 0.01을 사용 (사용값의 범위 0.1 ~ 0.0001 정도)

* 과적합을 해소하기 위한 튜닝방법으로 사용됨
- 과대적합이 일어난 경우 : 학습률을 크게
- 과소적합이 일어난 경우 : 학습률을 작게
- 과대/과소를 떠나서, 직접 값의 범위를 적용하여 튜닝을 수행한 후 가장 일반화 시점의 학습률 값을 찾는 것이 중요함

옵티마이저에 학습률 적용하기

"""옵티마이저 객체 생성"""
sgd = keras.optimizers.SGD(learning_rate=0.1)

"""모델 설정(compile)"""
model.compile(
    optimizer=sgd,
    loss="sparse_categorical_crossentropy",
    metrics="accuracy"
)

model.fit(train_scaled, train_target, epochs=50)

출력 :

score = model.evaluate(val_scaled, val_target)
score

출력 :

375/375 [==============================] - 0s 558us/step - loss: 1.0818 - accuracy: 0.8837

[1.0817798376083374, 0.8836666941642761]

옵티마이저 - 모멘텀

< 모멘텀(Momentum) >

- 과거의 방향(기울기)를 적용하여 → 관성을 적용시키는 방법
- 기본적으로 0.9 이상의 값을 적용시킴
- 보통 nesterov=True 속성과 함께 사용됨
→ nesterov=True : 모멘텀 방향보다 조금 더 앞서서 경사를 계산하는 방식(미리 체크)
- momentum 속성을 사용할 수 있는 옵티마이저 : SGD, RMSProp

모멘텀(Momentum) 직접 적용하기

### 모멘텀 정의

sgd = keras.optimizers.SGD(
    momentum=0.9, nesterov=True, learning_rate=0.1)

### 모멘텀 적용(compile)
model.compile(
    optimizer=sgd,
    loss="sparse_categorical_crossentropy",
    metrics="accuracy"
)

### 모델 훈련
model.fit(train_scaled, train_target, epochs=50)

### 성능 검증
score = model.evaluate(val_scaled, val_target)
score

출력 :

375/375 [==============================] - 0s 579us/step - loss: 0.6494 - accuracy: 0.8347

[0.6494151949882507, 0.8347499966621399]

옵티마이저 적용 실습

Adagrad

adagrad = keras.optimizers.Adagrad()
model.compile(
    optimizer=adagrad,
    loss="sparse_categorical_crossentropy",
    metrics="accuracy"
)

""" 또는 """
model.compile(
    optimizer="adagrad",
    loss="sparse_categorical_crossentropy",
    metrics="accuracy"
)

RMSProp

rmsprop = keras.optimizers.RMSprop()
model.compile(
    optimizer=rmsprop,
    loss="sparse_categorical_crossentropy",
    metrics="accuracy"
)

""" 또는 """
model.compile(
    optimizer="rmsprop",
    loss="sparse_categorical_crossentropy",
    metrics="accuracy"
)

Adam

adam = keras.optimizers.Adam()
model.compile(
    optimizer=adam,
    loss="sparse_categorical_crossentropy",
    metrics="accuracy"
)

""" 또는 """
model.compile(
    optimizer="adam",
    loss="sparse_categorical_crossentropy",
    metrics="accuracy"
)

신경망 모델 실습

1. 신경망 모델 생성
2. 계층 추가하기
- 1차원 전처리계층 추가
- 은닉계층 추가, 활성화함수 relu 사용, 출력크기 100개
- 최종 출력계층 추가
3. 모델 설정하기
- 옵티마이저에는 adam 사용, 학습률 0.01 사용
4. 훈련시키기
- 훈련횟수 : 50회
5. 성능평가하기

### 데이터셋 불러오기

(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()

print(train_input.shape , train_target.shape)
print(test_input.shape , test_target.shape)

### 정규화

train_scaled_255 = train_input / 255.0
test_scaled_255 = test_input / 255.0

### 훈련 : 검증하기

train_scaled, val_scaled, train_target, val_target = train_test_split(train_scaled_255, train_target,
test_size=0.2,
random_state=42)

print(train_scaled.shape, train_target.shape)
print(val_scaled.shape, val_target.shape)
print(test_scaled_255.shape, test_target.shape)

### 신경망 모델 생성
model = keras.Sequential()
model

### 계층 추가하기
model.add(
    keras.layers.Flatten(
        input_shape=(28,28)
    )
)
model.add(
    keras.layers.Dense(
        100, activation = "relu"
    )
)
model.add(
    keras.layers.Dense(
        10, activation= "softmax"
    )
)

### 계층 확인하기
model.summary()

### 모델 설정하기
adam = keras.optimizers.Adam(learning_rate=0.01)
model.compile(
    optimizer=adam,
    loss = "sparse_categorical_crossentropy",
    metrics= "accuracy"
)

### 훈련시키기
model.fit(train_scaled, train_target, epochs=50)

### 성능평가하기
score = model.evaluate(val_scaled, val_target)
score

신경망 모델 실습 - 함수화

<실습>

- 옵티마이저에 적용할 학습기법(sgd, adagrad, rmsprop, adam) 중에
- 가장 좋은 성능을 나타내는 옵티마이저 학습기법 확인하기
- 훈련횟수 : 50회
- 학습률은 기본값 사용
- 은닉계층 relu 사용

- 성능 평가결과가 가장 높을 때의 학습기법과 손실율, 정확도를 출력해주세요~

옵티마이저 학습방법 및 반복횟수를 받아서 처리할 함수 정의

def getBestEval(opt, epoch):
    """모델 생성"""
    model= keras.Sequential()

    """레이어 계층 생성 및 모델에 추가하기"""
    model.add(keras.layers.Flatten(input_shape = (28, 28)))
    model.add(keras.layers.Dense(100, activation="relu"))
    model.add(keras.layers.Dense(10, activation="softmax"))

    """모델 설정하기"""
    model.compile(optimizer = opt,
                  loss = "sparse_categorical_crossentropy",
                  metrics= "accuracy")

    """모델 훈련시키기"""
    model.fit(train_scaled, train_target, epochs=epoch)

    """모델 성능 평가"""
    score = model.evaluate(val_scaled, val_target)

    """성능 결과 반환하기"""
    return score

함수 호출하기

""" 옵티마이저를 리스트로 정의하기 """
optimizers = ["sgd", "adagrad", "rmsprop", "adam"]

"""최고 정확도를 담을 변수 정의"""
best_acc = 0.0

"""최고 정확도일 때의 학습방법을 담을 변수 정의"""
best_acc_opt = ""

"""최저 손실율을 담을 변수 정의"""
best_loss = 1.0

"""최저 손실율일 때의 학습방법을 담을 변수 정의"""
best_loss_opt = ""

"""옵티마이저의 학습방법을 반복하여 성능 확인하기"""
for opt in optimizers:
    print(f"-------------------------{opt}---------------------------")

    """함수 호출"""
    epoch = 50
    rs_score = getBestEval(opt, epoch)

    """가장 높은 정확도와 이때 학습방법 저장하기"""
    if best_acc < rs_score[1]:
        best_acc = rs_score[1]
        best_acc_opt = opt

    """가장 낮은 손실율와 이때 학습방법 저장하기"""
    if best_loss > rs_score[0]:
        best_loss = rs_score[0]
        best_loss_opt = opt

    print()

print("전체 실행 종료 >>>>>>>>>>")
print(f"최고정확도 옵티마이저 : {best_acc_opt} / 최고정확도 : {best_acc} ")
print(f"최저손실율 옵티마이저 : {best_loss_opt} / 최저손실율 : {best_loss} ")

728x90

저작자표시 (새창열림)

'인공지능 > 딥러닝' 카테고리의 다른 글

[딥러닝DL] DNN 회귀데이터 사용 (1)	2024.01.05
[딥러닝DL] 심층신경망 훈련 및 성능향상2 - 성능규제(Dropout), 모델 저장 및 불러오기, 콜백함수(ModelCheckpoint, EarlyStopping) (1)	2024.01.05
[딥러닝DL] 심층신경망(DNN) 훈련 및 성능향상 - verbose, epoch, history, 시각화 (2)	2024.01.03
[딥러닝] 인공신경망 훈련모델 맛보기 (1)	2023.12.29
[딥러닝]딥러닝 환경설정하기 + 가상환경 생성 (0)	2023.12.29

[딥러닝] 신경망계층 추가방법 및 성능향상방법 - 옵티마이저

fashion_mnist 데이터로 독립변수와 종속변수 읽어들이기

라이브러리

데이터 수집

정규화

정규화

데이터 전처리(2차원 데이터로 변환하기)

훈련:검증(8:2)로 분류하기

훈련 및 검증 데이터로 분류하기 (8:2)

계층 추가하기

[1번 방법] 층을 먼저 만들고, 신경망 모델 생성 시 추가하기

입력계층(Input Layer) 생성하기

출력계층(Output Layer) 생성하기

신경망 모델 생성하기

모델 계층 확인하기

[2번 방법] 신경망모델 생성 시 계층(layer)을 함께 추가

모델 생성 및 계층 추가하기

모델 계층 확인하기

[3번 방법] 신경망 모델을 먼저 생성 후, 계층 추가하기

신경망 모델 생성하기

계층 생성 및 모델에 추가하기

모델 계층 확인하기

모델 설정하기(compile)

모델 훈련하기(fit)

성능 평가하기(검증)

해석🪄 : 정확도를 보았을때 0.9정도가 정확도가 높다라 한다.

과대,과소,정상 중 정상인 편 검증 정확도 보다 훈련 정확도가 높으므로

성능 향상시키기

[1번 방법] 반복횟수 증가

훈련 반복횟수 증가시키기(50회 → 100회)

성능 평가하기(검증)

[2번 방법] 성능향상 - 은닉 계층(Hidden Layer) 추가

모델 생성

입력 계층 추가하기

중간계층 = 은닉계층(hidden layer) 생성하기

출력 계층(output layer) 생성하기

모델에 추가된 계층 모두 확인하기

모델 설정하기(compile)

차원축소하지 않은 정규화된 데이터로 다시 생성

모델 훈련시키기

성능평가 - 검증하기

옵티마이저

옵티마이저 - compile

옵티마이저 - fit

옵티마이저 - evaluate

옵티마이저 - 학습률

옵티마이저에 학습률 적용하기

옵티마이저 - 모멘텀

모멘텀(Momentum) 직접 적용하기

옵티마이저 적용 실습

Adagrad

RMSProp

Adam

신경망 모델 실습

신경망 모델 실습 - 함수화

옵티마이저 학습방법 및 반복횟수를 받아서 처리할 함수 정의

함수 호출하기

'인공지능 > 딥러닝' 카테고리의 다른 글

'인공지능/딥러닝' Related Articles

티스토리툴바