본문 바로가기
딥러닝

딥러닝 이해 시작(8) - 다중분류_인코딩

by pumkinni 2022. 6. 15.

딥러닝 이해 시작(8) - 다중분류_인코딩

 다중분류 문제를 풀 때 사용할 수 있는 인코딩(원-핫 인코딩)에 대해 알아보자

 

다중분류(multi classification)

 여러 개의 답 중 하나를 고르는 분류 문제

  • 활성화 함수로 softmax 사용

 

인코딩 

전체 코드

# 문자열을 숫자로 변환
e = LabelEncoder()
e.fit(Y_obj)
Y = e.transform(Y_obj)
Y_encoded = tf.keras.utils.to_categorical(Y)

 

 1) LabelEncoder( )

     Y값이  숫자가 아니라 문자열일 때, 문자열을 숫자로 바꿔 주려면 클래스 이름을 숫자 형태로 바꿔 주는 함수

e = LabelEncoder()
e.fit(Y_obj)
Y = e.transform(Y_obj)

       인코딩 전 y 값                                                                                               LabelEncoder( ) 후 y 값

 

 2) 원-핫 인코딩 - tf.keras.utils.categorical( )

     여러 개의 Y 값을 0과 1로만 이루어진 형태로 바꿔 주는 기법

Y_encoded = tf.keras.utils.to_categorical(Y)

원-핫 인코딩 후 y 값