본문 바로가기
딥러닝/논문리뷰

A Robust Predictive Model for Stock Price Prediction Using Deep Learning and Natural Language Processing 감성분석을 이용한 주가 예측

by 달죽 2021. 1. 12.
반응형

감성분석을 이용한 주가 예측에 관련된 논문이 있어서 혼자 리뷰해 보았다. 

 

비정형데이터는 과거의 주가나 재무에서 가져 올 수 없는 시장상황에 대한 패턴을 제공하는것에 의의가 있는데

이 논문에서는 기존의 머신러닝 기반 주가 예측 + 트위터 데이터를 감성 분석을 이용하여 인도 지수를 예측해 본 것이다.  

 

기존의 비정형 데이터를 이용해서 쉽게 접근 할 수 있는 이벤트 드리븐 전략과는 사뭇 다른 접근이지만 인간의 감성을 퍼지 신경망에 입각해 정량화하는 아이디어가 재밌다.  

 

---------------

 

 

논문에서는 8개의 회귀 분석과 8개의 분류 방법을 이용하여 주간 예측 수평선에서 주가와 이동 예측했다. 

이러한 모델은 기계 학습 심층 학습 접근법을 기반으로 한다.

 

목표 : 2015년 1월 2일부터 2019년 6월 28일까지 3년간 NIFTY 50( 인도 니프티 지수) 의 일일 주가 사용하여모델을 제작, 1주일의 이동평균선에 대한 주식 가격과 마지막날 종가를 예측.

 

 

연구모형과 심층학습모형을 설계하고 검증한 후, 퍼지 신경망 기반 SOFNN 알고리즘을 입력함에 따라,

일일 주 외에 트위터의 민심을 분석하는 감성 분석 모듈을 두번째 입력으로 사용된다. 

 

* 퍼지 신경망 : 퍼지 시스템에서 일단 결정된 규칙을 환경의 변화에 적응 할 수 있도록 인공신경망을 이용하여 퍼지 규칙을 생성하고 퍼지 추론의 소속함수를 조정할 수 있는 모델. 

* 퍼지 이론 : '다루는 대상의 결과 자체가 불확실한 문제를 측정' ex) 예 아니오 -> 조금 더, 조금 덜 

인간의 사고와 같은 불확실성을 내포한 정보를 처리하고, 추론 할 수 있는 장점.  

* 소속함수 (membership function) : 0~1 의 실수값으로 원소가 집합에 속할 소속도를 함수로 나타낸 것. 

 

 

트위터의 감성을 4가지로 분류하고 그레인저 인과성 검정을 이용하여 NIFTY 50 주가이동에 대한

감성 분석의 인과관계를 연구하였다. 

 

데이터 : ohlcv, 일간 변동성, 월,주,일 날짜 데이터, 요일, ohlcv 의 등락율 (전날 백분위 차이) , 트위터 스트리밍 API 

 

모델 : 분류 8가지 + 회귀 8 가지 , 

 

(i)Logistic Regression, (iiK-Nearest Neighbor (iiiDecisionTree, (ivBagging, (vBoosting, (viRandom Forest, (vii)Artificial Neural Network, and (viiiSupport VectorMachines.

 

(iMultivariate Regression, (ii)Decision Tree, (iii) Bagging, (ivBoosting, (vRandomForest, (vi) Artificial Neural Network, (vii) Support VectorMachine, and (viiiLong- and Short-Term Memory (LSTM)Network

 

* LSTM 말고는 다 머신러닝

 

성과지표 : 

 

분류 : confusion matrix

회귀  : 평균 절대 백분율 오차 (MAPE) , 반응 변수( : close_norm)의 실제 값과 예측 사이의 상관 계수

 

 

 

 

 

반응형

댓글