3.1 예측 프로세스
통계적 예측 결과 산출을 목표로 과학적 예측모형의 적용, 수요시장 등의 포괄적 지표 관리, 예측 결과의 타당성 확보를 필요로 한다. 예측 프로세스는
주요 지수 및 관련 자료를 취합하여 현물시장과의 면밀한 분석 이후 대표지표들의 미래치 추정을 통해 인공지능(AI, Artificial Intelligence)
기반 다양한 통계 예측모형을 사용하여 예측치를 산출하고 예측 결과의 타당성을 검증하는 과정을 갖는다.
예측 결과는 여러 예측 모델 집합에 속한 모델들 중 가장 성능이 좋은 모델에서의 결과 값을 앙상블(Ensemble) 하여 산출한다. 예측 모델 유형으로는
머신러닝 선형 회귀(Machine Learning Linear Regression) 모델, 결정 트리 기반 회귀(Tree Based Regression)
모델, 유사성 기반(Similarity Based) 모델, 시계열 기반(Time Series Based) 모델을 사용했다(13). 머신러닝 선형 회귀 모델로는 Mutiple Linear Regression, Ridge Regression, Lasso Regression, ElasticNet
Regression을 활용, 결정 트리 기반 회귀 모델로는 Random Forest, XGBoost Regression, Light GBM Regression(14), 유사성 기반 모델로는 KNN(K-Nearest Neighbor), 시계열 기반 모델로는 TCN(Temporal Convolutional Network)을
활용했다.
3.2 예측 인자
미래 REC가격 추정을 위해 사용하는 인자는 크게 REC 중요 인자, 시나리오 정의 필수 인자, 예측 성능 영향인자로 구분하였다. "REC 현물시장"
관련 뉴스기사들의 Word cloud 분석으로 도출한 키워드로부터 인자를 분류하였다. 먼저 월별 REC가격에 직접적인 영향을 미치는 인자들은 REC
중요 인자로 정의하였고 전력수요, 계통한계가격(SMP, System Marginal Price), 신재생 거래 비중이 해당된다. 전력수요는 전력거래소의
2년간 전망치, SMP는 자체 예측으로 사용, 신재생 거래 비중은 선형모형의 추세를 사용한다. 정부 정책과 같이중장기적으로 영향을 미치는 인자들은
시나리오 정의 필수 인자로 정의하였고 RPS 할당율, 소비자물가 상승률, 경제성장률, 환율, 유가가 해당된다. RPS 할당율은 정책(5)에 기반하여 2023년 13%, 2024년 13.5%를 사용했으며 소비자물가상승률(3%), 경제성장률(1.5%), 환율(1,320원), 유가(76$/bbl)는
한국개발연구원(KDI, Korea Development Institute)의 경기전망을 이용했다. 이외에도 REC가격의 통계적인 특성에 대해서는 예측
성능 영향인자는 REC 현물시장 거래 규모 패턴, 체결가격 패턴, REC 수급 밸런스, 2개의 REC 현물시장의 동태변수를 적용하였다. 거래 규모
패턴, 체결 건수 패턴, 체결가격 패턴은 Prophet Model의 Cyclic Term을 이용하여 사용했으며 REC 수급 밸런스는 2022년 84.8%를
유지하는 것으로 가정하였다. 특히, REC 현물시장 동태변수는 딥러닝의 AutoEncoder의 Embedding Vector를 통해 추출하였다.
REC 현물시장의 거래 패턴을 Cyclic Pattern으로 나타내면 수식(1)과 같으며
$g(t)$는 비주기적 변화를 반영하는 추세 함수, $s(t)$는 주간 혹은 연간과 같은 주기적인 변화, $h(t)$는 불규칙 이벤트인 휴일의 영향력,
$\epsilon$는 모형이 설명하지 못하는 나머지 부분을 의미한다. 또한 $s(t)$는 수식(2)와 같이 설명될 수 있다.
$P$는 시계열모델에서의 정규주기로 계절성 모델을 적합하기 위해서는 $2N$만큼의 파라미터인 $\beta =[a1,\: b1,\:\ldots ,\:
a N,\: b N]^{t}$를 추정해야 한다. 또한 $N$이 커질수록 모델은 패턴을 더욱 세세하게 감지한다.
그림. 5. REC 거래 규모에 대한 Cyclic Pattern 지수
Fig. 5. Cyclic Pattern index of REC trade size
그림. 6. REC 체결 건수에 대한 Cyclic Pattern 지수
Fig. 6. Cyclic Pattern index of number of REC contracts
그림. 7. REC 체결가격에 대한 Cyclic Pattern 지수
Fig. 7. Cyclic Pattern index of REC contract price
REC 거래 규모, 체결 건수(건), 체결가격을 기준으로 Cycle을 도출하여 전체 거래 규모의 월간 추이, REC 거래의 형태, REC 가격의 시계열적인
월간 주기를 파악하는 지수로 활용했으며 이를 그림으로 나타내면 그림 5, 6, 7과 같다. 세 경우 모두 2018년을 100으로 환산하여 지수화했으며, 4년을 주기로 Cycle이 생성됨을 확인했다.
그림. 8. 예측인자 특징 대표 벡터 추출
Fig. 8. Extraction latent vector of characteristic of forecasting feature
AutoEncoder는 예측인자들의 특징을 요약하기 위해 사용하였다. AutoEncoder는 입력 데이터를 변환하는 인코딩 기능과 인코딩된 표현에서
입력 데이터를 재생성하는 디코딩 기능의 두 가지 기능을 가진다. 일반적으로 차원 축소를 위해 데이터 집합에 대한 효율적인 표현을 학습하게 된다. AutoEncoder는
원본 데이터에서 잠재 벡터로의 인코더와 잠재 벡터에서 출력 데이터로의 디코더로 구성되며 원본 데이터와 출력 데이터 간의 차이가 최소화되도록 인코더와
디코더가 학습된다. 이를 수식으로 나타내면 수식(3)과 같다.
$\phi$는 원본 데이터 $X$를 병목지점의 잠재 벡터 $F$로 매핑하는 인코더 함수, $\psi$는 병목지점의 잠재 벡터 $F$를 출력 데이터에
매핑하는 디코더 함수이다.
그림 8은 예측인자들의 특징을 대표하는 벡터를 추출하는 인코딩과 디코딩 과정을 나타낸 것으로 예측인자들의 종합적인 동태를 2차원 벡터로 요약하는 것을 나타낸.
2차원 벡터는 입력값들과 재현값들 간의 MSE(Mean Squared Error)가 최소화되도록 학습하였다. 미래 가정에 따른 입력값들에 대해 학습된
패턴으로 2개의 특징 벡터를 산출하였다.