• 대한전기학회
Mobile QR Code QR CODE : The Transactions of the Korean Institute of Electrical Engineers
  • COPE
  • kcse
  • 한국과학기술단체총연합회
  • 한국학술지인용색인
  • Scopus
  • crossref
  • orcid

  1. (Smart Power Distribution Lab., KEPCO Research Institute, Korea.)
  2. (School of Electrical Engineering, Korea University, Korea.)



Distribution planning, Renewable energy resources, Mid to Long-term forecasting, Deep learning model

1. 서 론

국내 신재생에너지 보급이 확대됨에 따라 안정적인 계통 운영 측면이나 효율적인 계획 측면에서 정확한 발전량 예측이 중요해졌다. 태양광·풍력의 발전 비중이 커질수록 발전량의 불확실성이 증대되기 때문에 이를 제어하고 운영하기 위한 전력계통의 부담을 점점 증가하기 때문이다. 표 1은 신재생에너지의 비중에 따라 국제 에너지 기구(IEA : International Energy Agency)에서 권고하는 사항을 나타내고 있다.

표 1. 태양광·풍력 발전량 비중에 따른 단계별 구분

Table 1. Categorization of solar and wind power generation by percentage of power generation

구분

태양광·풍력 비중

태양광·풍력 관리에 대한 권고사항

1단계

0~3%

태양광·풍력 기술적 요구 조건 검토

2단계

3~15%

개별 태양광·풍력 예측 발전량 확보 및 예측시스템 구축

3단계

15~25%

태양광·풍력 변화에 대응하기 위한

유연성 자원 발굴

4단계

25~50%

전력계통 안정도 유지를 위한

대체 자원 확보

국내의 태양광·풍력은 2020년 기준 약 3.6%로 이제 2단계에 속한다. 신재생에너지 발전량은 지난해보다 26%가 증가하였고, 지속적인 증가세를 보임에 따라 표 1에서 언급된 바와 같이, 개별 태양광·풍력 예측시스템 구축의 필요성이 증대되고 있다. 세부적으로, 배전계통 말단 수용가에 분산전원이 연계되기 시작하면서 송전계통운영과 차이가 발생하기 시작하였다. 또한, 배전계통 내에 재생에너지, 전기자동차(EV : Electric Vehicle), 에너지저장장치(ESS : Energy Storage System) 등 다양한 분산전원이 증가하면서 배전계통이 복잡해졌기 때문에, 미리 변화에 대응하기 위한 배전계획 분야 연구의 중요성이 높아지고 있다.

하지만, 기존의 배전계획 방식은 분산형 전원의 비중이 크지 않았던 시기의 방법론으로, 배전선로의 부하에 대해서만 일정한 증가를 가정하여 설비의 용량을 계획하였기 때문에 분산전원의 연계로 인한 변화를 반영할 수 있도록 개선이 필요하다. 특히, 배전계통에 연계되는 가정용 분산전원이나 소규모 분산전원의 경우 감시가 안 될 가능성이 크기 때문에, 배전선로의 분산전원 설치량과 발전량을 예측할 수 있는 중장기 예측모델이 필요하다. 만약, 정확도 높은 중장기 분산전원 예측 결과를 활용할 수 있다면, 미래의 신재생에너지 연계를 고려하여 배전계획을 수립함으로써, 잘못된 부하 예측으로 인한 배전선로, 변압기 등의 배전설비의 과투자로 인한 경제적 손실을 방지할 수 있게 된다. 또한, 예측모델을 통해 생성된 시나리오를 배전계통의 안정도 시험에 적용함으로써, 더욱 신뢰성 있는 계통을 구축할 수 있다.

본 논문은 배전계획을 위한 중장기 분산전원 예측모델을 분석하고 장단점을 논의하였다. 2장에서는 배전계통 내 분산전원의 특성과 역할에 대해 논의하였고, 3장에서는 분산전원 예측에 적용할 수 있는 모델들의 장단점과 사례에 대해 분석하였다.

2. 분산전원 예측을 위한 배전계통 프로파일 분석

2.1 분산전원 정의 및 종류

분산전원이란, 대규모 집중형 전원과는 달리 소규모로 전력 소비지역 부근에 분산하여 배치가 가능한 발전설비를 의미한다. 일반적으로 신에너지 및 재생에너지를 이용한 발전설비 또는 자가용 전기설비에 해당하는 발전설비가 이에 속한다. 대표적인 신에너지로는 조력, 연료전지, 석탄액화가스, 수소에너지 등이 있고, 재생에너지로는 태양광, 풍력, 수력, 폐기물, 바이오에너지 등이 있다. 2019년을 기준으로 국내 신재생에너지 설비용량의 비중은 전체 설비용량의 약 10% 이상을 차지하고 있으며, 이 가운데 태양광 발전이 67%, 풍력 및 수력발전이 약 10% 정도를 차지하고 있다. 또한, 분산전원은 계통과 연계 여부에 따라 연계형, 독립운전형 등으로 구분하거나 이용형태에 따라 발전전용, 열병합용으로 구분할 수도 있으며 에너지저장장치, V2G(Vehicle To Grid)와 같은 양방향 분산전원이나 태양광, 풍력발전 등의 분산전원에 에너지저장장치를 혼합하여 발전하는 하이브리드(Hybrid) 형태의 분산전원도 존재한다(1).

2.2 분산전원 현황

국내 에너지 정책으로 2030년까지 신재생에너지 발전량 비중을 20%까지 확대하는 정책인 ‘재생에너지 3020 이행계획’이 발표되었고, 2019년 6월에 확정된 ‘제3차 에너지기본계획’에서는 2040년까지 재생에너지 발전 비중을 30~35%로 확대하기로 하였다. 이처럼 에너지전환 정책의 시행으로 신재생에너지 발전 전력량과 발전 설비용량의 빠른 확대가 이루어지고 있다.

그림 1에서는 연도별 국내 신재생에너지 발전 전력량 및 비율을 나타내고 있으며, 그림 2에서는 2019년 국내 행정구역별 신재생에너지 발전량 및 발전 비율을 나타내고 있다. 이를 통해 국내 신재생에너지의 발전량 및 발전설비용량은 매년 증가하고 있음을 알 수 있다. 2014년부터 2019년까지 신재생에너지 비중은 약 2.61%에서 약 5.42%로 지속하여 증가한 것을 그래프를 통해 알 수 있다(2).

그림 3에서는 연도별 국내 신재생 발전설비용량과 비율을 나타내며, 그림 4에서는 행정구역별 신재생에너지 발전설비용량 비율을 나타낸다. 신재생에너지 발전량뿐만 아니라 발전설비용량도 최근 5년간 급격히 증가하였으며, 이는 분산전원 시스템의 연계가 많이 이루어지고 있다는 것을 보여준다. 그래프를 통해 2014년부터 2019년까지 전체 발전설비에서 차지하는 비중은 약 3.57%에서 약 11.37%로 증가한 것을 확인할 수 있고, 행정구역별 신재생에너지 발전설비용량과 비율이 가장 높은 지역을 파악할 수 있다.

그림. 1. 연도별 신재생에너지 발전량 비율

Fig. 1. Percentage of renewable energy generation by year

../../Resources/kiee/KIEE.2021.70.9.1248/fig1.png

그림. 2. 행정구역별 신재생에너지 발전량 비율

Fig. 2. Percentage of renewable energy generation by administrative region

../../Resources/kiee/KIEE.2021.70.9.1248/fig2.png

그림. 3. 연도별 신재생에너지 발전설비용량 비율

Fig. 3. Percentage of renewable energy capacity by year

../../Resources/kiee/KIEE.2021.70.9.1248/fig3.png

그림. 4. 행정구역별 신재생에너지 발전설비용량 비율

Fig. 4. Percentage of renewable energy capacity by administrative region

../../Resources/kiee/KIEE.2021.70.9.1248/fig4.png

그림 1, 3과 같은 신재생에너지 발전량 및 발전설비용량 데이터들을 기반으로 예측을 수행할 시, 신재생에너지 발전량과 설비용량의 증가율이 일정할 것이라고 가정할 수 있다. 하지만 그림 2와 4에서 확인할 수 있듯이 지역마다 신재생에너지의 용량이 달라, 각 지역에 일괄적으로 증가율을 적용하여 예측을 수행한다면 집계된 예측량과 실제 측정량이 일치하지 않을 경우가 발생할 것이다. 따라서, 지역별로 특성화된 증가율과 패턴을 학습하는 모델이 필요하며, 중장기적인 측면에서 다양한 변수를 분석하고 반영하여 예측성을 높여야 한다.

2.3 분산전원 예측을 위한 데이터 및 모델 선정 기준

예측은 시간 주기에 따라, 결과를 결정하는 요인에 따라, 데이터의 패턴의 종류에 따라, 그리고 많은 양상에 따라 적용방식과 방법이 달라진다. 변동성이 큰 발전량 예측을 위한 모델에서는 이전 발전량 추이와 기상요소가 중요하며, 변동성이 적고 추세전환도 적은 증가율 예측모델에서는 변화를 유발하는 사건을 찾아내거나 패턴의 변화요인을 파악하는 것이 중요하다.

예측에 있어 핵심적인 과정은 과거 데이터에서 학습하지 않아야 할 이상치(Outlier)와 편향(Bias)을 구분하고, 정확한 패턴을 학습할 수 있도록 해야 한다. 보통 수치의 변화량이 일정하다고 가정할 때가 있다. 하지만 정제되지 않거나 전처리 되지 않은 데이터는 일정하지 않은 변화량을 갖는 경우가 훨씬 많다. 때문에, 예측 모델을 설계하기 위해서는 이러한 단순한 외적인 추세뿐만 아니라 값이 변하는 원인과 방식을 잡아낼 수 있어야 한다.

예측 변수(Predictor Variable)는 결과를 예측하기 위해 고려할 수 있는 변수들을 의미한다. 예를 들어, 목표 지역의 시간당 전기 수요(Electricity Demand)를 예측하려는 모델을 다음과 같이 나타낼 수 있다.

(1)
$ED = f(temperature,\:economic,\:population,\:time,\:date,\:error)$

식(1)과 같이 입력과 결과 간의 상관성을 설명할 수 있는 모델을 설명 모델(Explanatory Model)이라고 부른다. 오차(error)항은 외부변수의 영향과 잡음(Noise)에 의한 변동성을 반영하는 역할을 한다.

(2)
$ED_{t+1}=f(ED_{t},\:ED_{t-1},\:ED_{t-2},\:\cdots ,\:error)$

식(2)와 같이 시계열 모델을 사용할 수도 있다. 는 현재시간, 은 한 시간 후, 은 한 시간 전을 의미한다. 해당 식에서는 자신의 과거 패턴을 통해 미래를 예측하는 방식이다. 이 외 발생할 수 있는 편차는 오차항을 이용하여 표현할 수 있다.

(3)
$ED_{t+1}= f(ED_{t},\: temperature,\:time,\:date,\:error) $

식(3)은 두 가지 모델의 특징을 모두 활용한 모델로 혼합된 모델(Mixed Models)이라고 불린다. 혼합 모델은 예측하고자 하는 변수의 과거 값만 다루지 않고, 외부변수에 관한 데이터도 포함하기 때문에, 데이터의 상관성을 알아내기 위한 설명 모형으로 유용하게 사용될 수 있다. 하지만, 시스템을 잘 이해하지 못하거나, 분석하더라도 변수가 결과에 주는 영향을 파악하기 매우 어려운 경우, 혼합 모델보다 시계열 모델이 더 정확한 예측값을 도출할 수도 있다.

예측하려는 대상이 정확하게 알 수 없는 값이라면, 해당 대상을 확률변수(Random Variable)로 가정할 수 있다. 예를 들어, 다음 달 부하나 신재생에너지 발전량의 합은 얼마가 될지 알 수 없다. 따라서, 해당 값은 실제 측정값을 얻기 전까지는 알 수 없는 확률값이 된다. 상대적으로 가까운 시간일수록 나올 수 있는 확률값의 범위가 작지만, 예측기간이 길어질수록 가능한 값의 범위가 커지게 된다. 이는 예측의 불확실성이 커지는 것을 의미하며, 예측이 어렵다는 것을 의미한다.

만약 예측 과정을 통해 예측값을 얻으면, 확률변수가 가능한 값들의 범위 내 중간값을 특정 값으로 지정할 수 있으며, 이러한 예측 개념을 점 예측(Point Forecast)이라 한다. 이와 상반되는 방법인 구간예측은 확률변수가 비교적 높은 확률로 취할 수 있는 값들의 범위를 제시하는 예측구간을 의미한다.

관측한 모든 정보를 $I$로, 예측하고 싶은 대상을 $y_{t}$라고 할 때, 상대적인 확률값에 따라 해당 확률변수가 가질 수 있는 값을 $y_{t}| I$의 확률 분포(Probability Distribution) 또는 예측 분포(Forecast Distribution)라고 한다. 예측은 보통 예측 분포의 평균을 의미하며, 이는 $y_{t}$가 가질 수 있는 값의 평균을 의미하는 $\hat y_{t}$로 표기한다(3).

따라서, 확률을 분산전원 예측모델의 결과로 도출하게 된다면, 분산전원의 설치용량과 가능성을 확률적으로 표현할 수 있게 되며, 이는 배전계획 측면에서 설치 가능성이 큰 지역의 계통을 미리 검토하는 용도로 활용 가능할 것이다.

3. 분산전원 예측모델 장단점 및 사례분석

기존 부하 및 분산전원 예측을 위해 이용되는 알고리즘은 회귀기법부터 인공지능(AI)까지 알고리즘 기법이 다양하게 존재한다. 예측 주기 및 목적에 따라 알고리즘 성능이 상이하므로 각 알고리즘의 장단점을 파악하여 적절한 알고리즘을 선택하는 것이 중요하다. 예측 알고리즘은 Persistence, 통계적 모델, 인공지능 모델 등으로 구분할 수 있으며 각 그룹에는 다양한 알고리즘이 있다.

Persistence 방식은 전일의 실적을 당일의 예측치로 사용하는 가장 간단한 방법으로 많은 논문에서 참조모형으로 사용하고 있는 방법이다. 통계적 방식은 크게 회귀분석과 다양한 시계열 기반 분석기법이 연구되고 있다. 머신러닝 기법은 ANN을 기반으로 다양한 모형들이 개발되고 있으며 통계적 방식과 융합하여 하이브리드 형태로 연구되고 있다. 이러한 하이브리드 예측기법은 시계열 예측기법과 인공지능 예측기법의 장점을 결합한 것이다. 특히, 태양 일사량 데이터는 선형·비선형 구성 요소를 모두 포함하고 있는데 시계열, 인공지능 예측기법 중 하나만 적용할 경우, 선형·비선형 요소를 모두 예측하기에는 한계가 있다. 그러나 계절별 자기회귀 차분이동평균(SARIMA : Seasonal Autoregressive Integrated Moving Average)과 서포트벡터머신(SVM : Support Vector Machine) 예측기법을 결합한 하이브리드 예측기법은 태양광 발전의 선형·비선형 요소를 모두 추종할 수 있는 장점이 있다(4).

또한, 기간에 따른 분산전원 예측기법 분류를 그림 5에 나타내었다(5). 첫 번째는 단기 예측으로 1시간, 몇 시간, 하루, 최대 7일 동안의 분산전원 발전량을 예측하는 방법이다. 이러한 유형은 PV 통합 에너지관리시스템을 설계할 때 유용하며, 계통운영의 보안을 향상할 수 있다. 또한, 발전기 기동·정지 계획, 스케줄링, 경제급전 등을 원활하게 하는 방법이다. 두 번째는 중기 예측으로 1주일에서 1개월 이상의 기간을 예측하는 방법이며 전력시스템 계획 및 정비 일정을 수립하는데 있어 유용하다.

그림. 5. 기간에 따른 분산전원 발전량 예측 분류

Fig. 5. Distributed power generation forecast classification over time

../../Resources/kiee/KIEE.2021.70.9.1248/fig5.png

마지막으로 장기예측은 1개월에서 1년까지의 기간을 예측하는 방법이다. 장기예측은 에너지 입찰 및 안정적 운영 외에도 발전, 송전 및 배전계획을 하는 데 있어 유용하다. 일부 논문에서는 초단기 예측을 추가하여 발전량 예측 기간을 네 가지 범주로 나누기도 한다. 초단기 예측은 초 단위, 분 단위를 고려하는 방법으로 전력 평활화, 실시간 급전 및 최적의 예비 전력을 위해 수행할 수 있다(20).

3.1 시계열 분석(Time-Series Analysis) 활용 사례

통계적 모델은 주어진 데이터를 기반으로 통계적 추정을 수행하는 수학적 모델이다. 대표적인 통계적 모델은 ARMA 모델, 차분도 고려한 ARIMA 모델, 시계열 데이터 이외에 외부 변수를 고려하는 ARMAX(AutoRegressive Moving Average with eXogeneous inputs) 모델도 있다. ARMA, ARIMA 모델의 경우에 시계열 데이터에 대한 예측 정확도가 높지만 예측 대상에 영향을 주는 외부 변수를 고려할 수 없다. 그래서 다양한 외부변수를 고려해야하는 이번 부하 및 분산전원 예측 모델의 경우에는 ARMAX나 ARIMAX 모델의 활용도가 높을 것으로 예상된다.

(4)
\begin{align*} \Delta^{d}S_{t}(t)=c +\phi_{1}\Delta^{d}S_{t-1}+\phi_{2}\Delta^{d}S_{t-2}+...+\phi_{p}\Delta^{d}S_{t-p}+\\ \varepsilon_{t}-\theta_{1}\varepsilon_{t-1}-\theta_{2}\varepsilon_{t-2}-\theta_{2}\varepsilon_{t-2}-...-\theta_{q}\varepsilon_{t-q} \end{align*}

여기서 $\Delta^{d}S_{t}$는 d차 차분 시계열이며, d는 일정 차분의 개수로 d가 0이면 ARIMA$(p,\: d,\: q)$는 ARIMA$(p,\: q)$로 나타낼 수 있다. 태양광 발전량 예측에 ARIMA 모델을 사용하면 계절별 태양광 발전의 최대 출력데이터를 수집하고 파악할 수 있다. 그러나 ARIMA 모델은 어떠한 요인이 태양광 발전의 최대 출력을 만들어내는지 파악하기가 어렵다. 즉, 해당 모델을 활용하여 태양광 발전량을 예측하는 경우, 기상 데이터와 태양광 발전의 최대 발전량 데이터와의 관계를 명확히 규명하기가 쉽지 않다.

참고문헌 (6)에서는 기상청으로부터 37년(1981~2017) 동안 수집한 시간당 일사량 데이터를 기반으로 서울의 태양 일사량 예측하기 위해 SARIMA 모델을 제안하였다. 예측 정확도 평가를 위해 평균 제곱근 편차(RMSE : Root-Mean Square Error) 및 결정계수$(R^{2})$을 사용하였으며 몬테카를로 모델과 비교하였다. 논문에서는 SARIMA$(4,\:1,\:1)$ 모델을 이용하여 월별 일사량을 예측하였고, ARIMA$(1,\:1,\:2)$ 모델을 이용하여 일별 일사량을 예측하였다. 그 결과, SARIMA 예측 모델은 RMSE=33.18 및 $R^{2}$=79%이며, ARIMA 예측 모델은 RMSE=104.26 및 $R^{2}$=68%로, 우수한 성능을 보였다. 몬테카를로 모델은 상대적으로 큰 변동을 보이지만, ARIMA 모델의 일별 일사량 평균은 거의 유사한 결과를 가진다. 하지만 월별 일사량 예측은 시간이 지남에 따라 오차가 증가하였다. 참고문헌 (7)에서도 분산전원 예측을 위해 SARIMA 모델을 활용하였으며 SVM 모델과 결합한 앙상블 모델과 비교하였다. 이는 3.9장에서 다른 앙상블 모델과 함께 상세히 논의할 예정이다.

참고문헌 (8)에서는 기상청으로부터 수집한 기상 데이터를 기반으로 태양 일사량을 예측하기 위해 ARIMA 모델, ARIMA 모델에 독립변수를 추가한 ARIMAX 모델, 다중회귀 모델을 이용하여 예측 성능을 비교하였다. 시뮬레이션을 위한 최적 모형을 ARIMA$(4,\:1,\:2)$로 선정하였으며, 표 3에 해당 모델의 모수 추정치를 나타냈다. 여기서 $\phi$는 추정하고자 하는 지역의 위도이며, p-value는 유사성 확률을 나타낸다.

표 2. ARIMA 모델 추정치

Table 2. Estimation of ARIMA model

파라미터

예측량

오차

p-value

$\phi_{1}$

2.1222

0.0085

<0.0001

$\phi_{2}$

-1.3219

0.0161

<0.0001

$\phi_{3}$

0.0436

0.0146

0.0028

$\phi_{4}$

0.1147

0.0068

<0.0001

또한, 표 3에서는 예측 정확도를 비교하기 위해 평균 절대 오차(MAE : Mean Absolute Error)를 활용하였다. 예측 모델명 뒤 1은 4가지 변수(운량, 기온, 습도, 대기권 밖 일사량)를 모두 사용한 모델을 의미이며, 2는 3가지 기상변수(운량, 기온, 습도)만을 사용한 모델을 의미한다. 대기권 밖 일사량 반영에 따라 약 0.16~0.23 정도 차이가 난다. 또한, ARIMAX와 다중회귀 모델에 실제값과 예측값을 추가로 비교한 결과, ARIMAX 모델이 다중회귀 방법보다 실제 태양 일사량의 패턴에 적합한 결과를 보였다.

표 3. 예측기법별 예측 정확도 비교

Table 3. Comparison of forecast accuracy

예측 모델

MAE

ARIMA

0.4121

ARIMAX 1

0.1895

ARIMAX 2

0.4137

다중회귀 1

0.1553

다중회귀 2

0.3146

3.2 VAR(Vector Auto-Regression) 활용 사례

벡터자기회귀(VAR : Vector Auto-Regression) 모형은 다변량 분석에서 예측할 변수의 과거 값뿐만 아니라 예측할 변수와 의존성이 있는 변수들까지 고려하여 선형함수로 나타내는 확률적 과정이다. 전통적인 회귀모형에 의한 구조 방정식은 변수간의 인과관계를 통해 종속변수 $Y$를 몇 개의 독립변수 {$X_{1},\:X_{2},\:X_{3 ...}$}에 의해 설명하고 있다. 그러나 회귀모형에서는 변수의 영향이 시간 $t$가 변하더라도 항상 일정하다는 가정을 하고 있어 구조적 변화가 급속히 진행되어 변수의 영향이 변화하는 경우 이를 적절히 반영하지 못한다는 약점이 있다. 또한, 구조 모형은 경제이론에 의해서 모형을 구축하고 있어 변수 선택 및 모형 내, 외생 변수의 선정, 즉 인풋과 아웃풋이 모형 설계자의 주관에 의해서 결정된다는 단점이 있다. 따라서 시간에 대한 경직성과 주관성을 극복하기 위해 ARIMA 모형이 제시되었다. ARIMA 모형은 현재의 관측치 $Z_{t}$는 과거의 어떠한 규칙성에 의해 재현되며, 규칙성은 미래에도 유지된다고 가정하여 미래의 값을 예측한다. ARIMA 모형의 경우 모형 설정은 용이하나, 변수 사이의 상호작용을 무시하고 있어 일변량 분석이라는 한계에 부딪히게 된다. 이들 회귀모형과 시계열분석의 한계를 보완한 모형이 VAR 모형이라고 할 수 있다(9).

VAR 모형은 연립방정식 체계와 유사하나, 연립방정식과 비교하면 분석상의 특징을 지닌다. 첫째, 충격 반응 분석(Impulse Response Analysis)을 통하여 어떤 한 변수의 변화가 내생변수에 미치는 동태적 효과를 파악할 수 있다. 둘째, 분산 분해(Variance Decomposition)을 통해 각각의 내생변수의 변동 중, 이들 변수들이 전체 변동에 기여한 부분의 상대적 크기를 분석할 수 있다. 참고문헌 (10)은 VAR을 통해 재생에너지 전기 발전량 및 이산화탄소 배출량에 대한 연간 데이터를 모형화한 바 있다. 논문은 충격 반응 분석을 통해 재생에너지원의 점유율 증가가 경제 성장에 미치는 영향 등을 확인하였다. 또한, 분산 분해를 통해 경제 성장과 이산화탄소 배출 예측 오차 변동을 설명하여, 재생에너지원의 낮은 점유율을 검증한 바 있다.

그림. 6. 재생에너지 발전량 및 경제 성장에 관한 VAR 모형 수립을 위한 흐름도

Fig. 6. Flowchart of VAR model based on renewable energy and economic indicators

../../Resources/kiee/KIEE.2021.70.9.1248/fig6.png

이러한 VAR 모형은 어떠한 경제이론을 기초로 가설을 설정하는 것이 아니라, 실제 관찰되는 경제 시계열 변수들이 주는 정보를 최대로 이용하여 현실 경제를 분석하게 된다. VAR 모형은 이미 결정된 경제이론을 바탕으로 하는 것이 아니므로, 이와 같은 문제에 대해 시차분포모형을 이용하여 원인과 결과를 확인할 수 있는 간단한 검정방법으로 그레인저 인과관계 검정(Granger casuality test)이 있다.

예를 들어 A라는 사건이 B라는 사건 이전에 일어났다면, A가 B의 원인이라고 파악할 수 있지만, 반드시 B가 A를 유발시켰다고 할 수는 없다. 이를 다시 표현하면 과거의 사건을 현재의 사건을 유발할 수 있지만 미래의 사건은 현재의 사건을 유발할 수는 없다는 것이다. 이러한 논리에 근거하여 인과관계를 파악하는 것이 그레인저 인과관계 검정이라 한다. 그레인저의 정의에 의하면, y라는 값을 예측 혹은 추정할 때 y의 과거값과 함께 x의 과거값도 함께 사용하는 것이 y의 과거값만으로 예측 혹은 추정하는 것보다 정확하면 x로부터 y로의 인과방향이 존재한다고 간주하는 것이다. 마찬가지로 x의 예측 혹은 추정이 자신의 과거값에 의존하는 것보다 y의 과거값이 포함됨으로써 x의 과거값만으로 예측 혹은 추정하는 것보다 정확하면 y로부터 x로의 인과방향이 존재한다고 간주한다. 만일 이러한 인과관계가 두 방향으로 모두 성립되면, x와 y는 상호의존적인 관계로 쌍방의 인과방향이 존재하는 것으로 간주할 수 있다.

즉, 그레인저 인과관계 검정은 한 변수가 다른 변수를 예측하는데 도움이 되지 않는다는 귀무가설(Null hypothesis)에 대해 검정하는 것을 말한다. 그레인저 인과관계 검정에 대한 모형은 다음과 같은 두 개의 회귀모형으로 이뤄진다.

(5)
$y_{t}=\sum_{i=1}^{p}\alpha_{i}x_{t-i}+\sum_{j=1}^{p}\beta_{j}y_{t-j}+\epsilon_{1t}$

(6)
$x_{t}=\sum_{i=1}^{n}y_{i}x_{t-i}+\sum_{j=1}^{p}\delta_{j}y_{t-j}+\epsilon_{2t}$

예를 들어, x가 y에 영향을 미치지 않는다는 귀무가설을 검정하기 위하여 y를 y의 과거값과 x의 과거값에 대한 회귀식을 추정하고, y를 y의 과거값에 대해서만 회귀식을 추정한다. 오차항 $\epsilon_{t}$는 상호독립적이다.

3.3 ANN(Artificial Neural Network) 활용 사례

인공지능 모델은 컴퓨터 연산 성능 향상에 따라 다양한 분야에서 적용하며 전력수요인 부하 및 분산전원 예측에서도 활발히 응용된다. ANN 모델은 인공지능 모델에서 매우 포괄적인 모델을 의미하며 인공신경망을 이용하는 모델은 모두 ANN 모델에 속한다. 인공신경망을 이용한 예측은 생물학적 신경 시스템의 작동 방법을 기반으로 개발된 수학적 모델이다. 전형적인 인공신경망 구조는 그림 7과 같이 입력층, 숨겨진 층, 출력층으로 이루어져 및 뉴런의 상호연결로 구성되어있다(11).

표 4. ANN기반 예측 모델

Table 4. Forecasting model based on ANN

예측 기간

예측기법

장점

단점

입력 변수

다양한 케이스

(1, 26, 51h 전)

MLPNN + 특성 선택 방법

(i)신경망 입력 횟수를 70%까지 감소시킴

(ii) 다변량 예측에서 훈련 MSE(1.509) 및 시험 MSE(1.1531)

단일 예측 변수와 비교 시,

다변량 예측 변수의 MSE 증가

일사량, 풍속, 풍향, 상대습도,

공기온도 등

매일 GR 및 매시간 DNI

MLPNN

GR에는 MAPE(4.57%), RMSE(160.3Wh/$m^{2}$), $R^{2}$(0.9918)이 있고,

시간당 DNI는 MAPE, RMSE, R값이 각각 5.57, 17.7, 0.994

타 연구의 방법론과 대비됨

기상학적, 천문학적인 변수

15분 전

BPTT + RNN

낮은 MAE(6.9%), 다른 딥러닝 방식 대비 220초 연산시간 단축

전시간 간격에서 영구모델 대비 부족

일사량

매시간

TDNN +

클러스터링 알고리즘

TDNN 및 ARMA 대비 가장 낮은 RMSE(122W/$m^{2}$)

복잡도 증가

일사량

전날과 전전날

MLFFNN

$R^{2}$(99.894%), RMSE(0.223kW/$m^{2}$/일), MAE(0.17kW/$m^{2}$/일), MAPE(2.56%)

복잡도 증가

고도, 경도, 고도, 습도, 압력,

맑음지수, 평균 온도 등

매시간

RNN

MAPE가 16.83%

RNN 및 측정된 태양 복사와

비교되는 결과

최대온도, 최소온도,

다음 날의 구름 상태

1일 또는

1주 전

FF-DNN

주파수 영역에서 RNN과 비교 시, MAPE(0.067) 감소시킴

TF 과정으로 인한 복잡도 증가

날짜, 시간, 전력 가격,

이슬점 등

24시간 전

ANN, MLPNN,

EBPNN

맑은 날에 RMSE를 줄임

예측 신뢰도 및 정확도가

훈련 데이터 샘플에 영향 받음

일기예보, 전력, 일사량 측정 등

그림. 7. 인공 신경망(ANN)의 구조

Fig. 7. Block diagram of ANN

../../Resources/kiee/KIEE.2021.70.9.1248/fig7.png

인공신경망은 입력 변수와 출력 변수 사이의 관계를 학습하는 모델이다. 인공신경망으로 구성된 모델의 입력 레이어에 다양한 외부 변수들이 입력된다. 입력 레이어와 숨겨진 레이어 사이의 관계식을 자동으로 연산하며 노드 사이의 가중치를 선정하고 숨겨진 레이어와 출력 레이어 사이의 관계도 인공지능 기법 내부에서 자동 연산한다. 결국, 입력 변수로부터 출력 데이터가 도출되지만 모델 개발자는 어떤 함수를 통해 예측 값이 도출되는지 중간 과정을 알 수 없다. 이러한 출력 변수가 도출되기까지의 중간 과정을 알 수 없는 모델을 Black-box 모델이라고 하며 인공지능 모델의 단점 중 하나이다.

참고문헌 (12)에서는 ANN을 이용하여 태양광 발전의 발전량을 예측했다. 먼저 805kW만큼 태양광이 설치된 콜로라도 지역을 선정했다. 다층 퍼셉트론 기반 ANN을 이용하여 실시간 데이터를 학습시켰다. 입력 변수로는 시간, 방사량, 온도, 습도, 풍속이며, 출력은 DC 전압과 전류가 있다. 또한, 오차는 MSE를 사용했으며 아래와 같이 표현된다.

(7)
../../Resources/kiee/KIEE.2021.70.9.1248/equ7.png

ANN을 적용하여 콜로라도의 실제 발전량과 예측한 발전량을 비교하였으며, 평균 퍼센트 오차는 1.8% 근처로 얻었으며, MSE 값은 0.9827로 확인할 수 있다. 향상된 ANN 모델은 93.9%의 정확성을 보였다. 이러한 형태의 연구는 태양광 패널을 효율적으로 모델할 수 있을 것이다.

참고문헌 (13)에서는 빅데이터와 ANN을 이용하여 효율적인 예측시스템을 만들었다. 제안한 방법은 받은 데이터를 원하는 형태로 만드는 과정과 데이터를 ANN의 BP 알고리즘을 이용하여 학습하는 두 단계로 구성되어 있다.

3.4 RNN(Recurrent Neural Network) 활용 사례

기존의 신경망은 입력데이터가 독립적으로 학습되기 때문에 시간의 흐름에 따라 정보를 학습하는 것이 한계가 있다. 하지만 RNN 모델은 같은 신경망을 여러 개 복사하여 병렬 구조를 갖기 때문에 이전 신경망의 학습 결과를 현재 신경망의 학습에 사용할 수 있다. 즉, 과거 시점의 데이터를 이용하여 현재를 예측할 수 있는 매우 효과적인 알고리즘이다(14).

그림 8은 RNN 모델의 구조를 나타내며 RNN 구조변수를 표 5에 나타냈다. RNN 모델은 은닉상태 노드(Hidden State Node)가 방향을 가진 엣지(Edge)로 연결된 재귀 구조로 구성된다. 따라서 상태를 계산한 후 자기 입력을 하고, 이전 데이터가 다음 데이터에 영향을 미친다. 시간 정보 t와 가중치 W값을 추가하면, W값을 통해 이전 데이터가 다음에 영향력을 끼치거나 영향을 받는다. 또한, 학습을 위한 가중치의 집합은 하나의 cell 안에 있고 모든 cell에서 공유된다. RNN 모델에서 $h_{t}$는 아래 식과 같다.

(8)
$h_{t}=f_{w}(h_{t-1},\: x_{t})$

여기서 $h_{t}$는 다음의 새로운 상태를 계산하는 식이며, $f_{w}$는 파라미터 $w$를 가지는 함수, $x_{t}$는 어떤 시간에서의 입력으로 벡터값, $h_{t-1}$은 이전 상태의 값을 의미한다. RNN은 여러 종류의 형태가 개발되어 제공되고 있으며, 개선된 대표적인 모델이 LSTM과 GRU(Gated Recurrent Unit)이다.

표 5. RNN 구조변수

Table 5. Internal variable of RNN

$x_{t}$

$t$시간에서의 입력값

$W_{x}$

인코딩을 위한 웨이트 (벡터값)

$H_{t}$

일정 차분의 개수

$W_{h}$

$H_{t}$에서 우측 엣지의 웨이트

$W_{y}$

디코딩을 위한 웨이트 (벡터값)

$y_{t}$

$t$시간에서의 디코딩 결과 출력값 (예측값)

그림. 8. RNN 구조

Fig. 8. Block diagram of RNN

../../Resources/kiee/KIEE.2021.70.9.1248/fig8.png

참고문헌 (15)는 제안한 RNN 모델의 예측 성능을 평가하기 위해 다양한 예측 범위를 기준으로 시뮬레이션을 진행하였다. 예측 범위는 15분에서 90분 사이로 설정하였으며, 예측 범위에 따른 예측값 및 출력값에 대한 선형회귀 분석 결과를 제시하였다. 예측 범위에 따라 실제 측정값에서 예측값의 편차가 증가하였다. 특히, 예측 범위가 60분 이상이 되는 경우, 선형회귀 분석 결과에 큰 오류가 발생한다. 또한, 사례 1과 비교하여, 사례 2는 계절 중 겨울에 속하는 유형으로 태양 복사 안정성이 떨어지고 온도가 낮으므로 상대적으로 성능이 떨어졌다. 따라서 사례 1의 예측 결과의 편차가 사례 2의 편차보다 더 좋았다.

또한, 표 6에서는 사례별 예측 범위에 따른 결정계수 $R^{2}$을 계산하였다. RNN 예측 모델의 결정계수가 1에 가까울수록 더 효율적이라고 판단할 수 있다. 표 6에서 RNN 모델은 사례 1의 경우 $R^{2}$가 0.9699~0.9994이었고, 사례 2의 경우 $R^{2}$가 0.8359~0.9954 사이의 값을 나타냈다. 예측 범위에 따라 $R^{2}$값이 낮아졌는데, 이는 RNN 모델의 효율성이 시간에 따른 영향을 받는 것을 나타낸다. 또한, 사례 2의 $R^{2}$은 사례 1보다 낮았으며, RNN 모델의 성능이 계절에 따라 영향을 받을 수 있음을 의미한다.

표 6. 단계별 결정계수 비교

Table 6. Comparison of decision parameter of each stage

사례

결정

계수

15분

30분

45분

60분

75분

90분

사례 1

$R^{2}$

0.9994

0.9975

0.9938

0.9881

0.9800

0.9699

사례 2

$R^{2}$

0.9954

0.9828

0.9619

0.9296

0.8864

0.8359

참고문헌 (16)은 RNN 예측 모델을 사용하여 풍속 데이터를 기반으로 풍력 발전기의 발전량을 예측하였다. RNN 예측 모델은 풍속 예측 시, 과거 풍속 데이터만 사용하기 때문에 예측 시간을 단축할 수 있다. 실제 측정량과 순방향 신경망(FNN : Feed-forward Neural Network) 모델, RNN 모델의 2003년 풍속 예측 결과를 MAPE을 활용하여 비교하였다. 우선, RNN의 경우, 3시간 전에 4.87%, 6시간 전에 5.19%, 9시간 전에 7.31%, 1일 전에 19.53%, 2일 전에 23.89%, 3일 전에는 28.22%였다. FNN의 경우, 3시간 전에 7.14%, 6시간 전에 7.71%, 9시간 전에 9.71%, 1일 전에 21.17%, 2일 전에 26.42%, 3일 전에 30.07%였다. 결과적으로, 풍속 예측에서는 예측 시간이 길어질수록 예측 오차가 증가하는 것을 알 수 있다. 특히, FNN 모델의 평균 제곱 오차가 불안정해지는데 이는 시계열 정보가 파괴되고 예측 오차가 증가하기 때문이다. 즉, 풍력 발전량을 예측하기 위해 FNN 모델과 비교 시, RNN을 사용하는 것이 더 우수한 성능을 보였다.

3.5 LSTM(Long-Short Terms Memory) 활용 사례

RNN은 관련 정보와 그 정보를 사용하는 구간이 멀어질수록 학습능력이 저하되는 장기의존성 문제를 가진다. 이를 해결하기 위해 LSTM 모델은 RNN의 뉴런 대신에 메모리를 사용한다. LSTM 구조를 그림 9에 나타냈다. LSTM 셀은 4개의 Layer로 구분되며 첫 번째는 cell state로부터 이전 state의 $h_{t-1}$과 현재 입력값 $X_{t}$를 $sigmoid(\sigma)$ 함수를 통해 “0”과 “1”의 값으로 메모리값을 그대로 남길지 삭제할지 정하는 forget gate Layer가 있다. 두 번째는 input gate Layer로 $sigmoid(\sigma)$ 함수를 통해 구해진 값과 tanh 함수와의 곱으로 각 cell state에 저장될 데이터를 결정하는 단계이다. 세 번째는 2단계로부터 구해진 정보를 cell state에 저장하는 단계로 cell state update이다. 마지막은 Output Gate Layer로 이전 출력과 현재의 입력의 $sigmoid(\sigma)$ 함수 결과와 업데이트된 cell state의 tanh 함수 결과의 곱으로 최종 출력값을 결정한다. 따라서 LSTM 구조는 정보의 저장, 삭제, 유지 기능 등을 통해 정보의 연속성을 가질 수 있도록 학습능력을 향상했다(17).

그림. 9. LSTM 구조

Fig. 9. Block diagram of LSTM

../../Resources/kiee/KIEE.2021.70.9.1248/fig9.png

참고문헌 (15)에서는 LSTM 모델과 타 예측기법의 성능을 비교한 결과를 제시하여 이를 표 7에 나타내었다. 단일 모델 중에서는 DNN 모델이 가장 성능이 좋았다. LSTM 모델은 앙상블을 통해 성능을 개선할 필요가 있다. 따라서, (15)에서는 hybrid 모델을 제시하여 LSTM 모델의 성능을 개선하였다. 이는 3.9장에서 소개할 것이다.

표 7. LSTM 모델과 타 모델 성능 비교

Table 7. Performance comparison between LSTM and Other Models

예측기법

계절

MSE

nRMSE

nMBE

R

Persistence

1857

0.110

0.000

0.942

여름

2332

0.124

0.000

0.924

가을

1080

0.084

0.000

0.948

DNN

1154

0.087

0.010

0.965

여름

1545

0.101

0.006

0.950

가을

847

0.075

0.022

0.967

SVR

1260

0.091

0.006

0.960

여름

1536

0.100

0.004

0.949

가을

948

0.079

0.029

0.964

LSTM

1747

0.1049

−0.029

0.949

여름

2204

0.1178

−0.022

0.928

가을

958

0.077

0.0071

0.953

참고문헌 (16)에서는 제주도에 위치한 풍력발전단지 출력을 예측하기 위해 LSTM 모델을 활용하였고 기존에 예측 모델에 많이 적용되는 ANN, SVR 등의 모델을 구현하여 성능을 비교하였다. 풍력발전단지의 예측을 위해 2018년 1월 1일부터 8월 31일까지의 15분 단위의 풍속과 출력데이터를 모델 학습에 사용하였으며, 예측 정확도를 판단하기 위해 RMSE, MAPE 등을 사용하였다. 예측기법별 풍력발전 예측량을 비교하기 위해 10월, 11월, 12월 시뮬레이션을 진행하였다. 11월의 전체 예측 결과를 참고하면, ANN, LSTM 모델의 경우 9월, 10월과 비슷한 결과를 보였으나 SVR 모델의 경우 MAPE=8.60%로 9월, 10월과 비교하여 약간 낮았다. 이는 SVR 모델이 모든 입력 데이터에 대해 출력데이터를 최상으로 예측하는 수식을 구성하여 출력 변동률이 작은 입력일수록 예측 결과가 좋게 나옴을 의미한다. 결과적으로 시뮬레이션을 진행하는 동안 RMSE 및 MAPE를 비교하면 월별 비슷한 예측 성능을 보였다. 하지만 LSTM 예측모델이 ANN, SVR 모델보다는 우수한 성능을 가졌다.

3.6 GRU(Gated Recurrent Unit) 활용 사례

GRU는 LSTM의 순환신경망의 장점을 유지하면서 연산량을 줄여 제안된 모델이다. LSTM 순환신경망과 구조상 큰 차이가 없어 성능상 큰 차이가 없다는 평가도 있다. 하지만, 사용하는 데이터 및 응용에 따라 성능의 차이가 있다. GRU는 셀 상태를 저장하여 기억해주는 메모리가 존재하지 않아 데이터의 양이 많아지면 LSTM 순환신경망보다 좋지 않은 결과를 보일 수 있다. 하지만, 적은 양의 시계열 데이터를 연산으로 사용할 때는 LSTM보다 연산량이 적어 시간 및 정확도 측면에서 좋은 결과가 나온다(18).

GRU 알고리즘은 순환신경망의 장기의존성 문제를 해결하기 위해 설계된 LSTM 알고리즘의 구조를 단순화한 것이다. LSTM은 input, output, forget 총 3개의 게이트로 구성되는데, GRU는 input과 forget 게이트가 결합된 update 게이트 reset 게이트로 구성되어 LSTM 알고리즘의 장기의존성 문제 해결 능력을 유지하며 동일한 예측 성능과 빠른 학습 속도의 이점을 갖는다(19).

그림. 10. GRU 구조

Fig. 10. Block diagram of GRU

../../Resources/kiee/KIEE.2021.70.9.1248/fig10.png

GRU를 수식적으로 표현하면 아래와 같이 나타낼 수 있다(20).

(9)
\begin{align*} z_{t}=\sigma(W_{z}x_{t}+U_{z}h_{t-1})\\ r_{t}=\sigma(W_{r}x_{t}+W_{r}h_{t-1})\\ h_{t}=\tanh(W_{x_{t}}+U(r_{t}\circ h_{t-1})\\ h_{t}=(1-z_{t})\circ h_{t-1}+z_{t}\circ h_{t} \end{align*}

GRU 모델을 이용하여 풍속 값을 예측하여 실제 값을 비교해보면, RMS 값은 0.98로 상당히 예측값과 실제값이 유사함을 알 수 있으며, 추세도 비슷함을 확인할 수 있다. 따라서 해당 알고리즘을 사용한다면 풍속에 대해 다른 경우에 대해서도 비슷한 추세를 확인할 수 있을 것으로 예상된다.

GRU의 성능은 이론적으로 분석하고 예상한 만큼 나오지 않을 수 있다. GRU의 단점은 이전 정보에 접근할 수 있을 뿐 미래 정보에 접근할 수 없다. 이러한 한계를 극복하기 위해 양방향 GRU가 고안되었다. 양방향 GRU 모델에서 최종 출력은 t-1의 데이터뿐만 아니라 t+1도 영향을 미친다.

표 8. SVM기반 예측 모델

Table 8. Forecasting model based on SVM and ELM

예측 기간

예측기법

장점

단점

입력 파라미터

주어지지 않음

SVM

2 입력 SVM: 26% 정확도,

3 입력 SVM: 18% 정확도

대량의 데이터가 요구됨

공기 온도, 일조 비율 상대습도, 대기 중의 수증기

매일

ANFIS, ANN, SVM

RMSE, MAE, $R^{2}$이 가장 낮은 ANN보다

우수한 SVM

충분한 강수 및 구름 조건에서 낮은 $R^{2}$

일일 온도, 우주 태양 복사,

강우, 강수량

1시간 전

k-평균 알고리즘, SVM

낮은 RMSE 및 MRE, 높은 $R^{2}$ , 전력 및

에너지 수용량, 감소된 비용

기상 데이터를 입력으로 사용하여,

ANN 및 SVM의 예측 정확도 약간 감소

구름양을 포함한 기상 데이터

1시간 전

NNs, SVM

영구 모델과 대비되는 rMAE(26.15%)

불안정한 기상 조건에서 RMSE 상대적 오차 2%

측정된 GHI 값

그림. 11. 양방향 GRU 구조

Fig. 11. Block diagram of bidirectional GRU

../../Resources/kiee/KIEE.2021.70.9.1248/fig11.png

3.7 SVR(Support Vector Regression) 활용 사례

SVR은 머신러닝 알고리즘 중 SVM(Support Vector Machine)을 일반화한 기법으로, 최대한 많은 데이터를 포함하는 최적의 평면을 찾아 데이터를 예측하는 기법이다. SVM 중에서 회귀 분석을 이용하여 예측하는 모델을 SVR이라 한다. SVR은 전력수요 예측, 기상, 경제활동, 금융 등 많은 분야에서 활용되고 있으며 SVR을 학습시키기 위해서는 데이터를 준비하고 함수를 추정하는 과정을 거친다(21). SVR의 구조는 그림 12과 같다.

SVR 문제는 미지의 함수를 근사하는 함수인 f(x)를 결정하는 것이다. SVR 기법은 고차원 특성 공간에서 선형회귀 함수를 계산하는 것을 기반으로 하며 아래와 같이 나타낼 수 있다.

그림. 12. SVR 구조

Fig. 12. Block diagram of SVR

../../Resources/kiee/KIEE.2021.70.9.1248/fig12.png

(10)
$f(x)=(w\bullet\Phi(x))+b$

참고문헌 (22)에서는 태양광 발전 출력 예측 평가를 위해 MAPE, RMSE를 도입하여 결과의 신뢰성을 평가했으며, 태양광 출력이 발생하는 시간은 8시간으로 설정했다. 태양광 발전량 예측을 위해 크리깅 기법을 적용하여 일사량에 대한 데이터가 제공되지 않는 태양광 발전 단지의 일사량을 예측하였다. 빠른 계산속도를 가진 SVR 모델을 이용하여 예측을 수행했으며, 평균 MAPE는 7.44%, 평균 RMSE는 0.86MW의 결과로 확인할 수 있다. 다른 머신러닝 기법과 비교하였을 때, 약 14% 정도 감소하는 결과를 확인했다.

3.8 가우시안 프로세스(Gaussian Process) 활용 사례

GP 회귀는 비선형 회귀 중에 활용도가 높은 기법이며 확률적인 모델로 단순한 점 예측이 아닌 예측 분포를 제공한다. GP는 단순 대상 데이터가 다변수 가우시안 및 각 점에서의 가우스 노이즈로 분포된다고 가정한다. 이 가정에서는 예측 분포도 가우시안 분포로 만든다(23).

가우시안 프로세스 회귀 기법은 학습데이터를 통해 입력 데이터와 출력데이터 사이의 관계를 파악하여 모델링하는 것이 목적이다(24). 가우시안 프로세스 모델은 비선형성을 인공신경망 모델보다 단순하게 표현할 수 있기 때문에, 에너지 시계열 데이터 분석 및 모델링에서 사용되고 있다. 가우시안 프로세스의 평균 함수는 아래의 식과 같다(25).

(11)
$m(x)=E[f(x)]$

가우시안 프로세스의 공분산 함수는 아래의 식으로 표현한다.

(12)
$k(x,\:x')=E[(f(x)-m(x))(f(x')-m(x'))^{T}]$

가우시안 프로세스 모델을 이용하여 예측 $y_{0}=f(x_{0})$를 만들 때, y0와 Y는 가우시안 분포를 따르며 이는 아래와 같이 표현할 수 있다(26).

(13)
$\left[\begin{array}{c}y_{0} \\ Y\end{array}\right] \sim N\left(0,\left[\begin{array}{cc}A_{p} & B_{p} \\ B_{p}^{T} & C_{p}\end{array}\right]\right)$ $$A_{p}=\operatorname{cov}_{p}\left(y_{0}, y_{0}\right)$$ $$B_{p}=\left(\operatorname{cov}_{p}\left(y_{0}, y_{1}\right), \cdots, \operatorname{cov}_{p}\left(y_{o}, y_{N}\right)\right)$$ $$C_{p}(i, j)=\operatorname{cov}_{p}\left(y_{i}, y_{j}\right)$$

하이브리드 가우시안 프로세스를 활용하여 풍력발전을 예측하였으며, 하이브리드 가우시안 프로세스는 과거 데이터뿐만 아니라 현재시간 데이터를 같이 학습시키는 것으로 순서도는 그림 13와 같다.

참고문헌 (27)은 수치적 날짜 예측모델을 포함한 풍력발전 데이터 및 SCADA 시스템에서 측정한 데이터 분석 및 가우스 프로세스를 사용하여 최대 하루에 걸친 풍력 발전량 예측을 할 수 있다. 제안한 가우스 프로세스의 순서도는 그림 14과 같다.

그림. 13. 하이브리드 GP 순서도

Fig. 13. Flowchart of Hybrid GP

../../Resources/kiee/KIEE.2021.70.9.1248/fig13.png

그림. 14. 제안 GP 모델 순서도

Fig. 14. Flowchart of suggested GP model

../../Resources/kiee/KIEE.2021.70.9.1248/fig14.png

위에서 제시한 가우시안 프로세스를 활용하여 중국 서부에 위치한 간수 지역의 풍력을 예측했다. 예측의 정확성은 여러 가지 지표를 사용하여 평가하였으며, 여러 가지 지표로는 RMSE, NRMSE, MAE, NAMPE 등을 사용했다. 학습 횟수에 따른 정확성을 실제 풍력 발전량과 예측한 풍력 발전량을 비교하면, 학습 횟수가 많아질수록 풍력발전 예측의 정확성이 높아지고 있으며, 다층 퍼셉트론 모델보다 RMSE가 현저히 줄어드는 것을 확인할 수 있다.

실제 풍력발전 단지의 경우 얻어지는 풍력 발전량은 센서의 미작동, 측정 오류, 오동작 등으로 정확하지 않을 수 있다. 따라서, 가우시안 프로세스와 다중 대체법을 결합하여 문제를 풀기도 한다. 일반적으로 정보 소실률이 높아질수록 기법들의 오차가 높아진다. 하지만, 타 모델에 보다 가우시안 프로세스를 사용한 방법의 오차가 가장 작은 것을 알 수 있으며, 정보가 다양한 원인으로 소실될 경우 가우시안 프로세스 방법을 사용할 경우 결과가 가장 신뢰성이 있음을 알 수 있다.

표 9. 하이브리드 모델 방법

Table 9. Forecasting model based on Hybrid Model

예측 기간

예측기법

장점

단점

입력 파라미터

1~48시간

k-평균 알고리즘 + MLPNN

처리 속도 감소

RMSE 감소

정확도가 예측 구간이 증가함에 따라 감소

과거 기반 일사 데이터

주어지지 않음

FFNN

기존 회귀 모델보다 나은 결과

복잡도 증가

위도, 경도, 고도 및 LLP

일~주

MLR + NN

최소 RMSE가 하루, 한주 각각

1, 4.42%

급격한 변화로 인한 정확성 영향

과거 기반 데이터

주어지지 않음

WD + ANN

빠른 수렴, RMSE가 7.193

주어지지 않음

태양 복사 조도, 온도, 습도 및 풍속

매 시간

GTSOP + NG +CHL

낮은 RMSE, rRMSE

정확도가 예측 구간이 증가함에 따라 감소

온도, 풍속, 풍향, 태양 데이터

5일

LASSO

최소 MAPE(13.247%)

실제 데이터와 차이

온도, 압력, 상대 습도, 태양 천정각, 강수량, 풍속 및 방향, GHR

주어지지 않음

FFNN + PSO + WT

최소 MAPE(9.17%)

계절적인 영향으로 PV 출력이

바뀔 수 있음

PV 출력 데이터, GSR, 일조 강도, 온도, 습도, 풍속

하루

PCA + LS-SVM

계산 시간 70% 단축

단순 방법에 비해 복잡한 계산

모듈 온도, 주변 온도, 패널 방사조도, PV 전력의 시간당 값

7시간

AAKR + 청천일 모델

90%

좁은 지역 기후에 의존적

태양 복사, 생산 전력

24시간

GRNN + FFNN + MLR

기존 회귀 모델보다 나은

RMSE, MAE 값

기존 GRNN 방법에 비해 큰 RMSE

평균온도, 대기압, 풍속, 방향, 강우, 일조 시간, 일조 강도

하루

MARS

시험 단계에서 RMSE(119), MAD(89.8), MAPE(69.2%)

훈련 단계에서 낮은 우선성

일일 온도, 이슬 온도, 풍속,

강수량, 습도 및 기압

분~시간

ARX

PSS 대비 감소된 RMSE(154.5) 및 MAE(111.4)

짧은 시간에 대해 정확성이 낮음

지역 및 근방 태양 과거 기반 데이터

1시간

EMD, EEMD, WD +

하이브리드 모델

RMSE가 EMD

맑은 날씨에만 해당되는 결과

복잡성 증가

GHI

매 시간

Linear + EM

가장 낮은 RMSE(34.86%)

정확도 향상 필요

다른 지역 태양 복사 데이터

3.9 앙상블 모델(Ensemble Model) 활용 사례

앙상블 모델은 각 모델의 높은 정확도를 추려내는 혼합 모델을 의미한다. 그림 15는 앙상블 모델의 특징을 잘 보여준다. 해당 그림은 예측 주기별 모델의 성능을 보여주고 있는데, 여러 모델은 예측 주기에 따라 예측 성능이 상이하다. 앙상블 모델을 도입함으로써 한 가지 모델을 이용한 것보다 향상된 모델을 제시할 수 있다.

그림 15에서는 예측 주기별 모델의 오차 그래프를 나타냈지만, 예측 주기 외에도 모델 특징에 따라 장단점이 존재하는데, 각 모델의 장점을 모아 한 모델로 구성하는 것이 앙상블 모델이다. 최근 예측 분야에서 단일 모델을 제시하는 경우는 드물며 다양한 예측모델을 시험한 뒤 높은 정확도를 보이는 모델을 앙상블하여 최종 모델을 제시한다. 이번 연구에서도 여러 알고리즘을 적용하여 부하 및 분산전원 예측을 수행하고 여러 앙상블 모델의 조합을 시험한 뒤 최종 모델을 제시할 예정이다.

그림. 15. 예측 주기별 모델과 앙상블 모델의 정확도

Fig. 15. Forecast accuracy of each forecast models and ensemble model

../../Resources/kiee/KIEE.2021.70.9.1248/fig15.png

참고문헌 (7)에서는 SARIMA 모델과 SVM 모델의 장점을 결합한 Hybrid 모델과 기존 SARIMA 모델의 일별 태양 일사량(DGSR : Daily Global Solar Radiation)을 예측하여 정확도를 평가하였다. 이를 평가하기 위해 RMSE, 정규화된 평균 제곱근 편차(NRMSE : Normalized Root Mean Square Error), 평균 절대 백분율 오차(MAPE : Mean Absolute Percent Error) 등을 활용하였다. 표 10에 Hybrid 모델과 SARIMA 모델의 성능을 비교한 결과를 제시하였다. 2가지 예측기법을 활용한 Hybrid 모델이 불확실한 DGSR의 예측 성능을 개선할 수 있었으며, 다소 무작위적인 현상에 대한 해결책이 될 수 있을 것이다.

표 10. SARIMA 모델과 Hybrid 모델 성능 비교

Table 10. Comparison of SARIMA and Hybrid Model

예측기법

RMSE

$[Wh/m^{2}]$

NRMSE

[%]

MAPE

[%]

R

SARIMA

889.768

14.913

14.139

0.867

Hybrid

866.814

14.529

13.820

0.874

앞서 살펴보았던 참고문헌 (15)에서는 LSTM 모델과 심층 신경망(DNN : Deep Neural Network) 모델의 장점을 결합한 Hybrid 모델과 다양한 예측 모델의 태양 일사량을 예측하여 예측 정확도를 평가하였다. 이를 평가하기 위해 MSE, NRMSE, NMBE, R 등의 지표를 활용하였다. 표 11에 따르면 LSTM-DNN을 결합한 Hybrid 모델의 경우, 타 기법들과 비교했을 때 모든 측면에서 성능이 우수하였다. 이러한 유형의 기법은 Persistence, WT + RBFNN, WT + BPNN, LSTM과 같은 다른 모델과 비교하였을 때, MSE, MAPE 및 NRMSE 값을 크게 줄일 수 있다. DNN 모델도 예측 성능이 좋았지만, Hybrid model의 성능보다는 뒤떨어졌다. 또한, LSTM을 사용하여 태양광 발전량을 예측하면 간단하지만, Hybrid 모델과 비교하면 낮은 성능을 보인다.

표 11. LSTM 기반 Hybrid 모델과 타 모델 성능 비교

Table 11. Performance comparison between hybrid models based on LSTM and Other Models

예측기법

계절

MSE

nRMSE

nMBE

R

LSTM

1747

0.1049

−0.029

0.949

여름

2204

0.1178

−0.022

0.928

가을

958

0.077

0.0071

0.953

WT+BPNN

1891

0.111

0.006

0.939

여름

2145

0.119

0.002

0.928

가을

1011

0.081

0.021

0.966

WT+RBFNN

2782

0.135

0.001

0.912

여름

3610

0.154

0.005

0.887

가을

1921

0.112

0.010

0.903

Hybrid WT +

LSTM-DNN

973

0.080

0.016

0.971

여름

762

0.071

0.005

0.975

가을

660

0.066

0.015

0.971

4. 중장기 분산전원 예측모델을 위한 활용성 분석

이전 장에서는 분산전원 예측을 위해 다양한 예측 알고리즘의 특징과 사례에 대해 분석하였다. 본 장에서는 중장기 분산전원 예측모델에 해당 알고리즘의 활용 가능성과 적용방식에 대해 논의한다. 또한, 중장기 예측모델에서 자주 활용되는 변수를 분석하고, 상관관계에 대해 논의한다.

그림 16은 예측 기간별 이용되는 알고리즘의 활용 빈도를 나타낸다. 초단기 예측의 경우에는 작성된 논문 수 자체가 많지 않으므로 활용도가 높은 알고리즘을 추려내기 어렵다. 단기 예측은 ANN 모델과 시계열 모델, 그리고, SVM 모델 순서로 많이 쓰이고 있다. 중기 예측의 경우에도 초단기 예측과 같이 예측 주기로 자주 이용하지 않는 것으로 보인다. 장기 예측의 경우 회귀 기법이 가장 많이 쓰이며 ANN 모델과 시계열 모델, Bottom up 모델도 일부 적용할 수 있는 것으로 보인다.

그림 17은 예측 기간별 입력변수 활용 빈도를 나타낸다. 이전 그래프와 마찬가지로 초단기 예측과 중기 예측은 관련 연구 표본이 적다. 단기 예측의 경우에는 기상 데이터, 시간 지표, 건물 및 토지 용도 데이터 순으로 이용한다. 단기 예측에서는 사회 및 경제 변수는 잘 이용하지 않는데, 이는 예측 주기가 짧은 만큼 먼 미래에 대한 변수가 이용되지 않는 것으로 보인다. 반면, 장기 예측에서는 오히려 기상 변수와 시간 지표 활용성이 낮아지고 사회, 경제 변수와 건물 및 토지 용도 데이터 활용이 높아졌다. 장기 예측일 때 경제 성장성을 고려해야 하며 신규 부하 및 분산전원이 투입 가능성을 분석해야 하므로 사회, 경제 변수 및 건물 및 토지 용도 변수를 이용하는 것으로 보인다.

그림 18은 예측 구역의 크기별 입력변수 활용 빈도를 나타내는 그래프이다. 예측 지역 단위가 건물, 행정구역(district) 정도 되는 작은 지역을 예측하는 연구 빈도가 높다. 해당 범위 부하 예측은 기상 데이터와 건물 및 토지 용도 데이터, 시간 지표 데이터가 많이 이용된다. 도시 단위의 연구는 많지 않고 국내에서 도 단위로 추정되는 시도 단위 예측에서도 특정 입력변수에 치중되지는 않는다. 국가 단위 예측의 경우에는 국가를 이루고 있는 건물, 토지 용도의 비중을 고려하는 것으로 추정되고 사회, 경제성 지표를 가장 많이 이용한다.

그림 19는 예측기법별 입력변수의 활용 빈도를 나타낸 그래프이다. ANN 기법에서는 다양한 입력변수를 활용할 수 있는 것으로 보인다. 혹은 ANN 기법 자체가 활용성이 높다고 판단할 수도 있다. 시계열 기법에서는 기상 변수 활용량이 많은데, 이전 그래프를 참고해보았을 때 시계열 기법이 단기 예측에서 많이 이용되므로 기상 변수의 영향이 높아서 기상 변수 활용을 많이 한 것으로 추정된다. 건물, 토지 용도 활용한 논문이 적은 이유도 같은 이유인 것으로 보인다. Bottom-up 기법을 이용한 문헌이 많지 않으나 건물, 토지 용도 활용량이 많은 것으로 보아 Bottom-up 기법 특성상 소규모 예측을 통해 전체 구역에 대한 예측을 수행하므로 건물, 토지 용도를 상세히 분석이 필요하기 때문으로 보인다. 그리고 가장 활용도가 높은 회귀 기법의 경우 장기 예측에서 많이 이용되었기 때문에 사회, 경제성 변수를 이용한 문헌 수가 가장 많았고 이외의 변수들도 적절하게 이용되었다. SVM 모델은 예측에 많이 이용되지 않은 것으로 보이지만 기상 변수와 시간 지표 이용성이 높았다.

참고문헌 (28)에 따르면, 단기 예측에서는 30분 또는 1시간 단위 예측에 관한 연구가 많고 ANN, 시계열 기법이 많이 쓰이고 있다. 장기예측의 경우에는 다양한 예측 주기에 관한 연구가 분포되어 있고 그 중 연간 예측에 관한 연구가 가장 활발하며 회귀 기법이 가장 많이 이용된다.

그림. 16. 예측 주기별 알고리즘 활용 빈도

Fig. 16. Frequency of algorithm by forecast period

../../Resources/kiee/KIEE.2021.70.9.1248/fig16.png

그림. 17. 예측 주기별 입력변수 활용 빈도

Fig. 17. Frequency of input variable by forecast period

../../Resources/kiee/KIEE.2021.70.9.1248/fig17.png

그림. 18. 예측 구역 크기별 입력변수 활용 빈도

Fig. 18. Frequency of input variable by forecast region

../../Resources/kiee/KIEE.2021.70.9.1248/fig18.png

그림. 19. 예측기법별 입력변수 활용 빈도

Fig. 19. Frequency of algorithm by forecast method

../../Resources/kiee/KIEE.2021.70.9.1248/fig19.png

5. 결 론

본 논문에서는 중장기 배전계획을 수립하기 위해, 중요한 요소인 분산전원을 정의하고 최근 현황에 관해 서술하였다. 더불어, 분산전원 예측을 위한 다양한 예측기법과 모델의 사용사례에 대해 분석하였으며, 고려할 만한 입력변수들을 논의하였다. 예측 지역 단위에 따라 활용하는 입력변수가 상이하다. 건물과 같이 좁은 지역 단위로 예측하는 경우 기상, 건물, 시간 지표가 주로 활용되어 해당 변수를 활용하는 알고리즘으로는 주로 ANN이나 SVM이 주로 활용된다. 국가와 같이 큰 지역 단위 예측의 경우 사회경제지표가 주로 활용되며 사회경제지표는 주로 회귀 기법의 입력변수로 활용된다. 예측 주기에 따라서도 활용하는 입력변수가 다르다. 단기 예측의 경우에는 기상지표, 시간지표가 주로 활용된다. 중기 예측의 사례가 적지만 조사한 자료에 따르면 기상지표, 건물토지지표가 활용되었다. 장기 예측은 긴 기간의 정보를 학습시킬 수 있는 사회경제지표, 건물토지지표가 활용된다. 배전계획의 경우, 중장기적으로 배전계통 측면에서 선로 등의 배전설비 계획을 고려하기 때문에, 짧은 시간 단위의 발전량 예측보다는 중장기적으로 분산전원 도입량을 파악하는 것이 중요하다. 중장기 예측 알고리즘으로 회귀, ANN, 시계열, Bottom up 기법이 많이 활용된 사례가 있다. 해당 모델들의 활용 사례에 따르면 앙상블 모델이 단일 모델보다 예측 정확도가 높다. 표 11에 제시된 Hybrid WT + LSTM-DNN 모델은 시계열 기반 ANN 모델로써 다른 앙상블 알고리즘과 비교해서도 예측 성능이 가장 높았다. 이와 같이 중장기 분산전원 예측 모델은 Bottom up 방식으로 예측을 수행하고 시계열 기반 ANN 모델과 회귀 모델의 알고리즘 조합을 통한 앙상블 모델이 가장 효과적일 것이다.

Acknowledgements

This work was supported by the KEPCO Research Institute under the project entitled by “A Research of Advanced Distribution Planning System for Mid-Long term (R20DA16)”.

References

1 
KEPCO, 2018, Technology of Distributed Energy Resource connection with distribution system: GuidelineGoogle Search
2 
Renewable Energy 3020 Implementation Plan, 2017, Ministry of Trade, Industry and EnergyGoogle Search
3 
R. J. Hyndman, G. Athanasopoulos, 2018, Forecasting: Principles and Practice, 2nd edition, OTextsGoogle Search
4 
M. N. Akhter, S. Mekhilef, H. Mokhlis, N. M. Shah, 2019, Review on forecasting of photovoltaic power generation based on machine learning and metaheuristic techniques, IET Renewable Power Generation, Vol. 13, No. 7, pp. 1009-1023Google Search
5 
U. K. Das, K. S. Tey, M. Seyedmahmoudian, S. Mekhilef, M.Y.I. Idris, W.V. Deventer, B. Horan, A. Stojcevski, 2018, Forecasting of photovoltaic power generation and model, optimization: A review. Renew. Sustain. Energy Rev., Vol. 81, pp. 912-928DOI
6 
MH Alsharif, MK Younes, J. Kim, 2019, Time Series ARIMA Model for Prediction of Daily and Monthly Average Global, Solar Radiation: The Case Study of Seoul, South Korea Symmetry, Vol. 11, pp. 240-257Google Search
7 
S.B. Boualit, A. Mellit, 14–17 November 2016, SARIMA-SVM hybrid model for the prediction of daily global solar radiation time series, In Proceedings of the 2016 International Renewable and Sustainable Energy Conference (IRSEC) IEEE, Marrakesh Morocco, pp. 712-717DOI
8 
Sahm Kim, 2017, A study on solar irradiance forecasting with weather variables, The Korean Journal of Applied StatisticsDOI
9 
B. Oryani, Y. Koo, S. Rezania, 2020, Structural Vector Autoregressive Approach to Evaluate the Impact of Electricity Generation Mix on Economic Growth and CO2 Emissions in Iran, Energies, Vol. 13, No. 4268DOI
10 
Y. Li, June 2014, An ARMAX model for forecasting the power output of a grid connected photovoltaic system, Renewable Energy, Vol. 66, pp. 78-89DOI
11 
S. Bae, 2018, Research Trends of Photovoltaic Generation Forecasting, KIEE: World of electric, Vol. 67, No. 12, pp. 16-25Google Search
12 
A. Almadhor, 2018, Performance prediction of distributed PV generation systems using Artificial Neural Networks (ANN) and Mesh Networks, International Conference on Smart Grid, Vol. nagasaki, No. japan, pp. 88-91DOI
13 
M. N. Rahman, A. Esmailpour, 2015, An Efficient Electricity Generation Forecasting System Using Artificial Neural Network Approach with Big Data, IEEE First International Conference on Big Data Computing Service and Applications, Redwood City, Vol. ca, pp. 213-217DOI
14 
Gwon-Yoon Lee, Sang-Boo Lee, 2018, Universal Prediction System Realization Using RNN, Journal of KII, Vol. 16, No. 10, pp. 11-20Google Search
15 
Juan Ospina, Newaz Alvi, Omar Faruque M., 2019, Forecasting of PV plant output using hybrid wavelet-based LSTM- DNN structure model, IET Renewable Power Generation, Vol. 13, No. 7, pp. 1087-1095Google Search
16 
S. Tomonobu, Y. Atsushi, U. Naomitsu, F. Toshihisa, 2006, Application of Recurrent Neural Network to Long-Term- Ahead Generating Power Forecasting for Wind Power Generator, IEEE Power Systems Conference and Exposition, pp. 1260-1265DOI
17 
Jungin Lee, 2019, Technology trends of Renewable energy generation forecasting based on ICT, The Journal of The Korean Institute of Communication Sciences, Vol. 36, No. 11, pp. 3-8Google Search
18 
K. W. Kim, G. S. Jang, S. M. Lim, I. K. Ahn, J. Park, H. C. Oh, 2020, GRU-based Activity Recognition from Early-stage Motion, The Institute of Electronics and Information Engineers, pp. 2016-2019Google Search
19 
Yong-jin Jung, Kyoung-woo Cho, Jong-sung Lee, Chang-heon Oh, 2019, Particulate Matter (PM10) Concentration Prediction Model using GRU, The Korea Institute of Information and Communication Engineering, Vol. 23, No. 2, pp. 644-646Google Search
20 
W. Li, T. Logenthiran, W. L. Woo, 2019, Multi-GRU prediction system for electricity generation's planning and operation, in IET Generation, Transmission & Distribution, Vol. 13, No. 9, pp. 1630-1637Google Search
21 
Ju-Hwan Ham, Sung-Yul Kim, 2020, A Study on the Comparison of Kernel Functions Appropriate to the SVR-based Power Demand Prediction Algorithms, The Korean Institute of Electrical Engineers, Vol. workshop, pp. 158-159Google Search
22 
Gwon-Sun Mun, 1997, Understaing of VAR model, KOSTAT, Vol. research of statistics analysis, No. , pp. 23-56Google Search
23 
Jae Hyun Yoo, 1997, Gaussian Process Model based Reinforcement Learning, Journal of Institute of Control, Robotics and Systems, Vol. 25, No. 8, pp. 746-751Google Search
24 
Junho Song, Seungwook Yoon, Kanggu Park, Euiseok Hwang, 2017, Hybrid Day-ahead Prediction of Power Consumption based on Linear Prediction and Gaussian Process with Atypical Residual of Meteorological Information, KIEE, pp. 33-35Google Search
25 
A. G. Abo-Khalil, D. Lee, 2007, SVR-based Wind Speed Estimation for Power Control of Wind Energy Generation System, 2007 Power Conversion Conference, Vol. nagoya, pp. 1431-1436DOI
26 
J. Yan, K. Li, E. Bai, A. Foley, 2015, Special condition wind power forecasting based on Gaussian Process and similar historical data, 2015 IEEE Power & Energy Society General Meeting, Vol. denver, pp. 1-5DOI
27 
N. Chen, Z. Qian, I. T. Nabney, X. Meng, march 2014, Wind Power Forecasts Using Gaussian Processes and Numerical Weather Prediction, in IEEE Transactions on Power Systems, Vol. 29, No. 2, pp. 656-665DOI
28 
Kuster Corentin, 2017, Electric load forecasting models: A critical systematic review, Sustainable Cities and SociertyDOI

저자소개

Jintae Cho
../../Resources/kiee/KIEE.2021.70.9.1248/au1.png

He received the B.S. and M.S. degrees in Electrical Engineering from Korea University, Seoul, Korea, in 2006 and 2008, respectively.

He is currently pursuing an Ph.D. degree in Electrical Engineering at Korea University.

He joined KEPCO Research Institute in 2009.

He is the Senior researcher at Distribution Planning Research Group in Smart Power Distribution Lab. of KEPCO Research Institute, Daejeon, Korea.

His research interests include load forecasting and distribution power system planning included renewable energy resources.

Hongjoo Kim
../../Resources/kiee/KIEE.2021.70.9.1248/au2.png

He received the B.S. and M.S. degrees in Electrical and Electronic Engineering from Korea University, Seoul, Korea in 2010 and 2012, respectively.

From 2012 to 2014, he was with the DL E&C, Seoul, Korea, as a plant design engineer.

From 2014 to 2016, he was with the LS Electric, Anyang, Korea, as an EMS engineer.

He joined KEPCO Research Institute in 2016.

His current research interests include planning, analysis and operation of Distribution Power System.

Hosung Ryu
../../Resources/kiee/KIEE.2021.70.9.1248/au3.png

He received the B.S. and M.S. degrees in Energy System Engineering from Chung-Ang University, Seoul, Korea, in 2019 and 2021.

He joined KEPCO Research Institute in 2021.

His research interests include load forecasting based on deep learning and development of distribution planning system.

Yongju Son
../../Resources/kiee/KIEE.2021.70.9.1248/au4.png

He received the B.E. degree in electronic and electrical engineering from Chung-Ang University, Seoul, South Korea, in 2019.

Since 2019, he is currently pursuing an M.S./Ph.D. degree in Electrical Engineering at Korea University.

His research interests include renewable energy forecast and microgrid optimization based on deep learning.

Sungyun Choi
../../Resources/kiee/KIEE.2021.70.9.1248/au5.png

He received the B.E. degree in Electrical Engineering from Korea University, Seoul, South Korea, in 2002 and the M.S. and Ph.D. degrees in Electrical and Computer Engineering from Georgia Institute of Technology, Atlanta, GA, USA, in 2009 and 2013, respectively.

From 2002 to 2005, he was a Network and System Engineer, and from 2014 to 2018, he was a Senior Researcher with Smart Power Grid Research Center, Korea Electrotechnology Research Institute, Uiwang-si, Gyeonggi-do, South Korea.

Since 2018, he has been an Assistant Professor with Electrical Engineering, Korea University, Seoul, South Korea.

His research interests include microgrids, power system state estimation, sub- synchronous oscillations, renewable forecasts, and computational intelligence.