LSTM input, output, hidden으로 보는 동작 과정
LSTM Inputs: input, (\(h_0\), \(c_0\)) Outputs : output, \((h_n, c_n)\) 음성 처리 관점에서 input은 frames이 되겠다. Pytorch document를 보면 비단 input으로 frame만 들어갈 수 있을 뿐만 아니라 input, \((h_0, c_0)\)이 들어갈 수 있다. 5, 6번째 frame이 있고 6번째 frame의 hidden 및 cell state 정보를 0으로 초기화된 값이 아닌 5번째의 정보를 계속 이어서 사용하고 싶을 때 Outputs에서의 \((h_n, c_n)\)을 6번째 frame의 Inputs에서의 \((h_0, c_0)\)으로 넣어준다. 한 frame을 처리하는 동안인 \(h_1, c_1, ..., h_{n-1},..
2023. 5. 15.