주식시장 예측 개선을 위한 하이브리드 모델 연구
- 주제(키워드) 금융시장 예측 , Deep learning , LSTM , 하이브리드 모델 , 다중 작업 학습 , 랜덤포레스트
- 발행기관 아주대학교
- 지도교수 이슬
- 발행년도 2020
- 학위수여년월 2020. 2
- 학위명 석사
- 학과 및 전공 일반대학원 데이터사이언스학과
- 실제URI http://www.dcollection.net/handler/ajou/000000029663
- 본문언어 한국어
- 저작권 아주대학교 논문은 저작권에 의해 보호받습니다.
초록/요약
금융시장 예측을 위해 기계 학습 기반 연구, 특히 딥러닝 관련 모델은 적은 가정과 높은 성능으로 인해 활발하게 연구되고 있다. 본 연구에서는 오버피팅을 방지하면서 가능한 한 많은 기술 지표를 사용하기 위해 LSTM과 랜덤포레스트 프레임워크를 통합하는 LSTM-Forest (LFM) 이라는 새로운 접근 방법을 제안한다. 본 연구에서는 주식의 변환율과 등락을 모두 예측하는 다중 작업 학습을 통해 성능을 더욱 개선한다. 또한 변수의 중요도를 기반으로 기술 지표의 영향력을 분석한다. 제안한 방법을 실험적으로 검증하기 위해 3개의 글로벌 주가 지수(S&P500, SSE 및 KOSPI200)와 43개 기술 지표를 사용한다. S&P500, SSE 및 KOSPI200의 수익률 예측에서 multi-task를 사용하는 LFM의 평균 제곱 오차는 랜덤포레스트 모델에 비해 각각 44.54 %, 40.31% 및 38.26% 낮게 나타난다. 주식 등락 예측에 대한 모형의 정확도는 랜덤포레스트에 비해 각각 7.37%, 1.68% 및 3.79% 만큼 높게 나타난다. 또한 트레이딩 테스트에서 LFM의 누적 수익이 가장 높게 나타난다.
more목차
1. 서론 1
2. 관련 연구 5
2.1. 통계적 접근법 5
2.2. 뉴럴네트워크 접근법 5
2.3. 하이브리드 및 앙상블 접근법 7
2.4. 연구배경 8
3. 방법 12
3.1. 데이터 설명 12
3.2. 제안 프레임워크 : LFSM-Forest 21
3.3. LSTM-Forest: 단일 작업 학습 vs. 다중 작업 학습 23
3.4. 성능평가 25
4. 실험 결과 28
4.1. 변수 개수에 다른 LSTM-Forest의 성능 29
4.2. LFM의 로버스트 32
4.3. 변수 중요도 38
4.4 Top-K 변수들을 활용하여 LSTM 모델 구성 45
4.5. 트레이딩 테스트 46
5. 결론 49
6. 참고문헌 51
7. Abstract 60