정리 노트

33일 차(2022/08/17) 본문

[TIL]국민대X프로그래머스 여름방학 인공지능 과정

33일 차(2022/08/17)

꿈만 꾸는 학부생 2022. 8. 17. 15:05
728x90

LSTM(Long Short-Term Memory) 아키텍처

  RNN 아키텍처를 사용하면 토큰 사이의 거리가 먼 경우에 연속적인 정보가 잘 전달되지 않을 수 있습니다. LSTM은 RNN과 달리 두 개의 상태 정보를 저장하고 처리합니다. 두 상태 정보를 각각 장기 기억(Cell State), 단기 기억(Hidden State)이라 부릅니다.

  LSTM에서는 여러 게이트들이 있습니다.

  • Forget Gate: 어떤 정보를 잊게 만들지 결정하는 레이어로 오래된 정보 중 필요 없는 정보는 잊게 됩니다.
  • Input Gate: 새 정보를 장기 기억에 반영하는 역할로 새롭게 특정 정보를 기억하게 만듭니다.
  • Cell State는 Forget Gate와 Input Gate에 의해 갱신됩니다.
  • Output Gate는 Cell State와 현재 데이터를 이용해 단기 기억을 갱신합니다.

RNN(위)과 LSTM(아래): https://m.hanbit.co.kr/channel/category/category_view.html?cms_code=CMS6074576268

 

728x90

'[TIL]국민대X프로그래머스 여름방학 인공지능 과정' 카테고리의 다른 글

35일 차(2022/08/19)  (0) 2022.08.19
34일 차(2022/08/18)  (0) 2022.08.19
32일 차(2022/08/16)  (0) 2022.08.17
31일 차(2022/08/15)  (0) 2022.08.15
29일 차(2022/08/11)  (0) 2022.08.12