딥러닝/논문리뷰

A Robust Predictive Model for Stock Price Prediction Using Deep Learning and Natural Language Processing 감성분석을 이용한 주가 예측

달죽 2021. 1. 12. 17:22
반응형

감성분석을 이용한 주가 예측에 관련된 논문이 있어서 혼자 리뷰해 보았다. 

 

비정형데이터는 과거의 주가나 재무에서 가져 올 수 없는 시장상황에 대한 패턴을 제공하는것에 의의가 있는데

이 논문에서는 기존의 머신러닝 기반 주가 예측 + 트위터 데이터를 감성 분석을 이용하여 인도 지수를 예측해 본 것이다.  

 

기존의 비정형 데이터를 이용해서 쉽게 접근 할 수 있는 이벤트 드리븐 전략과는 사뭇 다른 접근이지만 인간의 감성을 퍼지 신경망에 입각해 정량화하는 아이디어가 재밌다.  

 

---------------

 

 

논문에서는 8개의 회귀 분석과 8개의 분류 방법을 이용하여 주간 예측 수평선에서 주가와 이동 예측했다. 

이러한 모델은 기계 학습 심층 학습 접근법을 기반으로 한다.

 

목표 : 2015년 1월 2일부터 2019년 6월 28일까지 3년간 NIFTY 50( 인도 니프티 지수) 의 일일 주가 사용하여모델을 제작, 1주일의 이동평균선에 대한 주식 가격과 마지막날 종가를 예측.

 

 

연구모형과 심층학습모형을 설계하고 검증한 후, 퍼지 신경망 기반 SOFNN 알고리즘을 입력함에 따라,

일일 주 외에 트위터의 민심을 분석하는 감성 분석 모듈을 두번째 입력으로 사용된다. 

 

* 퍼지 신경망 : 퍼지 시스템에서 일단 결정된 규칙을 환경의 변화에 적응 할 수 있도록 인공신경망을 이용하여 퍼지 규칙을 생성하고 퍼지 추론의 소속함수를 조정할 수 있는 모델. 

* 퍼지 이론 : '다루는 대상의 결과 자체가 불확실한 문제를 측정' ex) 예 아니오 -> 조금 더, 조금 덜 

인간의 사고와 같은 불확실성을 내포한 정보를 처리하고, 추론 할 수 있는 장점.  

* 소속함수 (membership function) : 0~1 의 실수값으로 원소가 집합에 속할 소속도를 함수로 나타낸 것. 

 

 

트위터의 감성을 4가지로 분류하고 그레인저 인과성 검정을 이용하여 NIFTY 50 주가이동에 대한

감성 분석의 인과관계를 연구하였다. 

 

데이터 : ohlcv, 일간 변동성, 월,주,일 날짜 데이터, 요일, ohlcv 의 등락율 (전날 백분위 차이) , 트위터 스트리밍 API 

 

모델 : 분류 8가지 + 회귀 8 가지 , 

 

(i)Logistic Regression, (iiK-Nearest Neighbor (iiiDecisionTree, (ivBagging, (vBoosting, (viRandom Forest, (vii)Artificial Neural Network, and (viiiSupport VectorMachines.

 

(iMultivariate Regression, (ii)Decision Tree, (iii) Bagging, (ivBoosting, (vRandomForest, (vi) Artificial Neural Network, (vii) Support VectorMachine, and (viiiLong- and Short-Term Memory (LSTM)Network

 

* LSTM 말고는 다 머신러닝

 

성과지표 : 

 

분류 : confusion matrix

회귀  : 평균 절대 백분율 오차 (MAPE) , 반응 변수( : close_norm)의 실제 값과 예측 사이의 상관 계수

 

 

 

 

 

반응형