일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- Regression
- machine learning
- Stack
- 국민대
- PANDAS
- Python
- 운영체제
- 데이터베이스
- gan
- 머신 러닝
- LSTM
- C++
- OS
- 프로그래머스
- Heap
- 국민대학교
- programmers
- kmu
- googleapiclient
- GIT
- instaloader
- 재귀
- 파이썬
- Seq2Seq
- 스택
- db
- python3
- 회귀
- 정렬
- SQL
Archives
- Today
- Total
정리 노트
33일 차(2022/08/17) 본문
728x90
LSTM(Long Short-Term Memory) 아키텍처
RNN 아키텍처를 사용하면 토큰 사이의 거리가 먼 경우에 연속적인 정보가 잘 전달되지 않을 수 있습니다. LSTM은 RNN과 달리 두 개의 상태 정보를 저장하고 처리합니다. 두 상태 정보를 각각 장기 기억(Cell State), 단기 기억(Hidden State)이라 부릅니다.
LSTM에서는 여러 게이트들이 있습니다.
- Forget Gate: 어떤 정보를 잊게 만들지 결정하는 레이어로 오래된 정보 중 필요 없는 정보는 잊게 됩니다.
- Input Gate: 새 정보를 장기 기억에 반영하는 역할로 새롭게 특정 정보를 기억하게 만듭니다.
- Cell State는 Forget Gate와 Input Gate에 의해 갱신됩니다.
- Output Gate는 Cell State와 현재 데이터를 이용해 단기 기억을 갱신합니다.

728x90
'[TIL]국민대X프로그래머스 여름방학 인공지능 과정' 카테고리의 다른 글
35일 차(2022/08/19) (0) | 2022.08.19 |
---|---|
34일 차(2022/08/18) (0) | 2022.08.19 |
32일 차(2022/08/16) (0) | 2022.08.17 |
31일 차(2022/08/15) (0) | 2022.08.15 |
29일 차(2022/08/11) (0) | 2022.08.12 |