RNN 텐서 차원수

딥러닝의 모델을 이해하기 위해서는 모델의 각 레이어 사이를 흘러다니는 데이터인 텐서의 차원을 정확이 이해하고 파악해야 합니다. 아래는 순환신경망인 기본 RNN에 대한 모델과 레이어에 입력되고 출력되는 텐서에 대한 그림입니다. 모델의 구성 레이어는 사각형으로, 텐서는 원으로 표시하였습니다.

위의 그림에서 언급된 텐서(Tensor)의 의미를 명시하면, W는 가중치, b는 편향, N은 미니배치 구성수, V는 시퀀스 구성수, D는 시퀀스 구성 요소의 분산 표현 벡터 차원수, H는 은닉 벡터 차원수입니다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다