• 대한전기학회
Mobile QR Code QR CODE : The Transactions of the Korean Institute of Electrical Engineers
  • COPE
  • kcse
  • 한국과학기술단체총연합회
  • 한국학술지인용색인
  • Scopus
  • crossref
  • orcid

  1. (Dept. of Electrical Engineering, Kangwon National University, Korea.)



daily peak electric power load, LERP, IT2TSK FLS, uncertainty, KM algorithm

1. 서 론

현대 사회는 안정적인 전력 수급과 전력 시스템의 최적 운용을 위해 정확도 높은 전력부하(수요) 예측의 필요성이 커지고 있으며, 이러한 전력부하(수요) 예측 결과는 국가의 경제 개발 및 사회간접자본(SOC) 확충 계획 수립에 중요한 지표로도 활용되고 있다(1-2).

일반적으로 전력부하(수요)의 변동에는 다양한 요소들이 연관되지만, 인구분포, 기후특성, 산업발전 등이 핵심적인 요소로 작용하며 계절별 특성이 뚜렷하게 나타난다. 최근 한국 그린 캠퍼스 협회의 발표(2019년 3월 4일)에 따르면 국내의 전력 소비량 증가 패턴은 계절적 요인에 민감한 주택용, 일반(상업)용, 교육용 등에서 큰 폭의 증가율을 나타내고 있는 것으로 분석되었으며, 특히 2018년에는 역대 최악의 폭염으로 인한 계절적 요인이 경제적 요인보다 더 중요한 요인으로 작용한 것으로 분석되었다. 이러한 이상기온과 같은 자연현상에 기인하는 인자들은 경제성 인자들보다 비일관성(inconsistency)이나 불확실성(uncertainty)이 더 두드러지며, 이러한 특성들이 데이터에 내재되어 있는 패턴 분석을 훨씬 까다롭게 만드는 요인이 되어 예측모형 구현을 더욱 어렵게 만든다.

또한, 전력부하 예측은 기본적으로 중장기 부하예측과 단기 부하예측으로 나눌 수 있으며, 하나의 예측모형으로 이들에 대한 좋은 예측 결과를 얻는 것은 어려운 문제이다. 그중 단기 부하예측 분야는 기존의 하루의 부하 패턴 예측 관점에서, 최근에는 일별 최대 부하예측의 정확도를 향상하는 문제로 변하고 있다. 왜냐하면, 2011년 9월에 우리나라 최초로 대정전(블랙 아웃)이 발생했고, 2014년 최대 부하 수요량 급증으로 대정전의 위기를 겪는 등의 사건에 더해 탈원전 등으로 인해 전력 사용량이 급증하는 여름이나 겨울의 비정상적인 난방 수요에 대비하여 전력 예비율 확보와 안정적인 전력 시스템 운용이 가능하도록 더욱 정확한 최대 부하 예측이 요구되고 있기 때문이다.

일반적으로 널리 사용되는 전력부하 예측/분석 기법으로는 통계 기반의 예측모형을 이용하는 방법들과 지능형 예측 모델을 이용하는 방법을 꼽을 수 있다. 전자의 경우 선형 회귀 모형인 AR(Auto-Regression), MA(Moving Average), ARMA (Auto-Regression Moving Average), 또는 ARIMA(Box-Jenkins model) 모형이 대표적인데, 비일관적이고 불확실성이 큰 데이터일수록 선형 근사화를 위한 수학적 모델 구현이 더 힘들고 까다로울 뿐만 아니라 추정된 모형의 모수(파라미터)들의 부정확성이 증가하여 원하는 수준의 결과를 기대하기가 어려웠다(3-6). 반면, 후자의 경우는 FLS(Fuzzy Logic System), ANN(Artificial Neural Network) 및 이들의 특성을 개선하기 위한 SVM(Support Vector Machines)이나 FNN(Fuzzy Neural Network)을 이용한 방법들이 주를 이루는데, 언어적 규칙기반이나 예측모형의 학습을 통해 비수학적 모델 수립 문제를 처리할 수 있어 비일관적이고 불확실한 데이터 예측 분야에서 더욱 정교한 예측 결과들을 얻고 있다(7-9). 또한, 최근에는 뉴로-퍼지 시스템의 국부 수렴 문제(local minimum)나 과적합(overfitting) 문제를 해결하기 위해 입자군집 최적화(PSO: Particle Swarm Optimization)를 결합한 ANFIS-PSO 방법이나 다층 퍼셉트론 신경망에 PSO와 ALO(Ant Lion Optimiser)을 적용한 방식 및 비대칭 기반 뉴로-퍼지 모델(AGFINN: Asymmetric-based neuro-fuzzy network)들이 연구되었으며, 이들은 전력가격 예측이나 전력부하 예측 분야에서 우수한 성능을 보였다(10-12). 그렇지만 퍼지 논리와 신경망 혼합 시스템은 어느 한쪽에서 국부 수렴이나 과적합 현상이 야기되면 전체 시스템의 성능이 저하되는 것을 피할 수 없다.

이런 문제점을 극복하기 위한 대안으로 우리는 각기 독립적으로 동작하는 신경망 예측기와 퍼지 예측기를 병렬로 결합한 후 러프 집합을 이용한 예측기 운영 규칙을 통해 매 순간 최적의 예측기가 선택 동작하는 예측시스템을 설계한 바 있다(13). 제안된 방법은 퍼지 예측기의 포용성(강인성)과 신경망 예측기의 불명확성에 대한 예측 이점을 상호 보완적으로 사용하고 선형 보간 기법(LERP: Linear interpolation)(14)을 통해 두 예측기의 성능이 더욱 개선될 수 있도록 하여 우수한 예측 성능을 얻을 수 있었다. 하지만 우리의 기존 연구도 문제점을 안고 있다. 우선 예측시스템의 구조적인 복잡함이다. 두 개의 예측기를 병렬로 구현하여 결합시키기 때문에 두 예측기를 동시에 설계하고 학습시켜야 하며, 학습 과정의 결과를 가지고 다시 예측기 운영 규칙을 도출해야 한다. 다음으로는 러프 집합을 이용한 예측기 운영 규칙의 도출 부분에서 두 예측기의 예측 특성이 서로 완전히 상반된 경우가 아니라면 비일관적인 운영 규칙이 증가하게 되고, 비일관적인 규칙을 모두 삭제할 경우 일부 데이터에 대해선 운영 규칙 자체의 생성이 어려워지는 문제점을 안게 된다. 마지막으로 퍼지 예측기의 데이터에 대한 포용성(강인성)으로 인해 전반적으로 우수한 예측을 수행할 수 있었으나 불명확성이 큰 급변하는 데이터 패턴에 대한 평균적인 동작 특성을 고려하여 신경망 예측기를 병렬로 결합하였지만, 신경망 예측기 또한 국부 수렴이나 과적합 문제로 학습 과정에서의 정확성이 실제 예측 과정에 반영되지 못하고 큰 예측 오차를 발생할 수 있다는 점이다.

결국, 퍼지 예측기가 불명확성이 큰 급변하는 데이터 패턴 또한 잘 취급할 수 있다면 신경망 예측기의 결합 없이(예측기 운영규칙 도출 또한 불필요) 단순한 구조의 시스템을 설계 가능할 것이다. 본 논문에서는 이를 위해 type 2 퍼지집합을 이용하여 단일 구조의 일별 최대 전력부하 퍼지 예측시스템을 설계하였다. 먼저, 기존 연구(13)와 마찬가지로 데이터양의 부족과 급격한 변동 패턴의 안정화를 위해서는 선형 보간법을 적용하여 데이터의 전처리를 수행하였다. 이를 통해 원시(original) 데이터의 특성을 해치지 않는 범위에서 정보량을 증가시켜, 퍼지규칙기반 생성을 위한 데이터 군집화 과정에 군집마다 규칙 도출에 충분한 정도의 데이터가 소속될 수 있도록 하고 모수 추정의 정확도도 보장될 수 있게 하였다. 다음으로 예측시스템 구현에는 interval type 2(IT2) 퍼지집합을 기반으로 하는 TSK 퍼지 논리 시스템(IT2TSK FLS: Interval Type-2 TSK Fuzzy Logic System)(16,17)을 적용하였다. 이렇게 함으로써, 비일관적이고 급격한 변동을 보이는 데이터에 내재된 패턴의 불확실성을 퍼지 시스템만으로도 만족스럽게 취급할 수 있도록 하고 기존 연구에서 나타나는 구조적 복잡성(퍼지와 신경망 예측기의 병렬 결합 구조)을 완화함과 동시에 적은 수의 퍼지집합과 규칙으로도 좋은 예측성능을 발휘할 수 있게 하였다. 마지막으로 시뮬레이션 과정에서는 (13)의 결과와 비교를 위해 동일한 2014년과 2015년 하계의 국내 일별 최대 전력부하 데이터를 적용했으며, 예측시스템 구현에 요구되는 입력 및 퍼지집합의 개수를 각각 3개 및 2개로 설정하여 단지 8개의 규칙만으로 퍼지규칙기반이 구성되도록 하고, 입출력 공간 퍼지분할을 위한 군집화에는 K-평균 군집화(K-Means(KM) clustering)(18)를, TSK 퍼지규칙의 후건부 모수 추정에는 최소자승법(LSM: Least Square Method)(16)을 이용하였으며, 이를 통해 가장 단순한 구조와 기본적인 방법을 사용하였음에도 불구하고 제안된 예측시스템이 동등한 수준의 예측성능을 얻을 수 있음을 검증하였다. 또한, 단순히 퍼지집합의 개수 증가만으로도 제안된 시스템의 성능이 다른 시스템들의 성능보다 상당히 개선될 수 있음을 보여 제안된 시스템 설계 방법의 유효성을 검증하였다.

2. 제안된 시스템의 구조

2.1 이동평균 변화율(RCMA) 기반 데이터 전처리

그림 1은 제안된 IT2TSK 퍼지 예측시스템(IT2TSK FPS: IT2TSK Fuzzy Prediction System)의 전체 흐름을 보여 준다. 제안된 IT2TSK FPS는 그림 1에서처럼 크게 5단계의 주요 절차를 통해 일별 최대 전력부하 데이터를 예측하는 구조로 구성된다. 그림 1에서 ①의 선형보간(LERP: Linear Interpolation) 과정은 전체 시스템의 설계를 위해 요구되는 데이터의 분류, 추정 및 추론 과정에서 요구되는 충분한 정보량을 공급하기 위해 원형의 전력부하 데이터에 보간데이터를 생성 삽입하는 과정을 나타낸다.

데이터 정보량의 증가는 이후 시스템 설계를 위해 요구되는 군집화 과정이나 퍼지규칙의 모수 추정 과정에서 부족한 정보로 야기되는 부정확성(model inaccuracy)을 완화할 수 있으며,

그림. 1. 제안된 IT2TSK FPS의 전체 순서도

Fig. 1. The flow chart of the proposed IT2TSK FPS

../../Resources/kiee/KIEE.2020.69.5.688/fig1.png

IT2TSK FIE(IT2TSK Fuzzy Inference Engine)(16)의 추론 과정에서 데이터에 대한 규칙의 불명확성(Uncertainty)을 표현하는 FOU(Footprint Of Uncertainty)(16,17)의 생성을 위해 더욱 정교한 정보를 제공할 수 있게 된다. ②의 과정은 제안된 시스템의 운용 기반이 되는 IT2TSK FIE의 설계를 위해 필요한 절차로 퍼지집합 생성을 위한 군집화 과정, IT2TSK 퍼지규칙 생성 그리고 생성된 규칙의 모수들을 추정하는 과정을 보여준다. 이러한 각 과정에는 설계 구현이 비교적 단순하면서 성능이 양호한 KM 알고리즘(18)과 LSM 알고리즘(16)이 사용된다. ③의 과정은 원형의 보간 전력부하 데이터로 설계된 IT2TSK FIE을 이용하여 보간 전력부하 데이터의 1차 예측값들을 얻는 과정을 의미한다. 1차 예측 보간데이터를 얻는 과정은 예측이 수행되어야 할 미래의 전력부하 값이 미지의 값이므로 현재의 값과 미래의 전력부하 값 사이의 보간데이터 또한 미지의 값이 되므로 학습을 통해 예측돼야 하기 때문이다. ④의 과정은 예측된 보간데이터를 이용하여 전체 전력부하 데이터를 예측하는 과정을 보여준다. 마지막으로 ⑤의 과정은 전체 예측된 결과로부터 원형의 시점에 상응하는 전력부하 예측값을 추출하는 과정으로, 다시 말해 늘어난 데이터의 길이를 원형의 전력부하 데이터의 길이로 축소하는 것을 의미한다.

2.2 보간데이터의 생성

서론에 언급되었듯이 보간데이터의 삽입은 시스템 설계 과정에서 정보량의 결핍과 불규칙 변동 데이터의 패턴 변화를 완화시켜 시스템 설계에 효과적이다. 하지만, 만약 삽입되는 보간데이터의 개수가 너무 적다면 시스템 설계에 요구되는 충분한 정보를 제공할 수 없을뿐더러 패턴의 안정화에도 큰 기여를 할 수 없게 된다. 반면에 보간데이터의 수가 너무 많으면 시스템의 예측성능 개선 효과 대비 과다 정보의 처리 문제로 시스템의 연산량을 증가시키는 결과를 초래하게 된다. 이러한 선형 보간(LERP) 문제를 해결하기 위해 기존 연구(13)에서는 자기 상관함수(ACF: Auto Correlation Function)(15) 분석법을 이용하였다. 만약 각각의 시간 $t_{1},\: t_{2,\:},\:\cdots ,\: t_{N}$에서 관측된 데이터가 $x_{1},\: x_{2},\:\cdots ,\: x_{N}$이라면 자기상관함수는 식 (1)과 같이 주어지며

(1)
$$r_{k}=\dfrac{C_{k}}{C_{0}}=\dfrac{\dfrac{1}{N}\sum_{t=1}^{N-k}(x_{t}-\bar{X})(x_{t+k}-\bar{X})}{\dfrac{1}{N}\sum_{t=1}^{N}(x_{t}-\bar{X})^{2}},\: k=0,\: 1,\:\cdots ,\: N-1$$

여기서 분자 $C_{k}$는 자기 공분산 함수(Autocovariance function)이며, 분모 $C_{0}$는 분산(Variance function)을 나타낸다. 또한 $x_{t}$는 $t$시점에서의 데이터를 의미하고, $\bar{X}$는 모든 데이터의 평균을 의미한다.

보간데이터의 개수를 점차 증가시키면서 시점에 따른 AFC의 변화를 분석한 결과, 3개 미만의 보간데이터 삽입은 인접 데이터간의 상관성이 매우 낮은 형태를 나타냈으며, 반면에 3개 이상에서는 AFC의 변화 그래프가 완만한 형태를 띠었고 이러한 모양은 보간데이터 개수가 늘어날수록 조금씩 개선되는 양상을 보였다. 그러므로 예측시스템의 학습에 계산량의 부담을 크게 주지 않으면서 충분한 정보량을 제공할 수 있는 적절한 보간데이터의 개수를 3개로 정의하였으며(13), 본 논문에서도 같은 데이터(2015년)와 유사데이터(2014년)를 예측하므로 동일한 방법을 적용한다.

2.3 IT2TSK FLS(Interval Type-2 Fuzzy Logic System)

제안된 시스템 설계의 기본 규칙 모델이 되는 IT2TSK FLS의 $r$번째 퍼지규칙의 일반식은 식 (2)와 같이 정의된다(16).

(2)

$R^{r}:$ If $d_{1}^{r}$ is $\tilde{F}_{1}^{r}$ and $d_{2}$ is $\tilde{F}_{2}^{r}$ and $\cdots$ and $d_{k}$ is $\tilde{F}_{k}^{r}$

Then $Y_{T S K, 2}^{r}(\mathrm{d})=\sum_{k=0}^{n} P_{k}^{r} d_{k}^{r}$

where $d_{0}^{r}=1$ and $P_{k}^{r}=\left[p_{k}^{r}-s_{k}^{r}, p_{k}^{r}+s_{k}^{r}\right]$

여기서 $R^{r}$는 $r$번째 IT2TSK 퍼지규칙을 의미하고, $d$는 $r$번째 규칙을 만족하는 입력데이터, $\widetilde F$는 그 입력이 포함된 IT2 퍼지집합을 의미한다. 또한, $P$는 규칙의 후건부의 추정되어야 할 모수를 의미하고 $p$는 그 추정 모수의 평균(중심)을 의미한다. 마지막으로 $s$는 $P$의 폭을 의미한다.

IT2TSK FLS의 규칙은 언어적으로 속성을 표현하는 전건부(Antecedent part)와 국부 출력을 산출하는 선형 수식의 후건부(Consequent part)로 구성되며, 전건부에서는 퍼지집합 생성을 위한 군집화 과정이, 후건부에서는 선형 수식의 모수 추정 과정이 요구된다.

또한, 규칙의 입력데이터의 개수는 기존 연구(13)와 마찬가지로 단기 예측 부하 문제에서 일반적으로 널리 사용되고 있는 3개로 설정하여 사용한다.

3. 제안된 IT2TSK FPS 설계

제안된 시스템의 설계 과정은 5단계의 과정을 거치지만, 시스템의 실행 절차로만 보면 LERP에 의한 보간데이터 생성, IT2TSK FIE의 설계, 그리고 IT2TSK FIE를 이용한 전력부하 예측과 같이 크게 3개의 실행 과정으로 설명된다.

3.1 LERP 데이터의 생성 및 구조

보간데이터에 의해 증가하게 되는 전체 데이터 길이는 식 (3)과 같이 정의되며

(3)
$L ERP_{l ength}=(N-1)\bullet a+N$

여기서 $L ERP_{l ength}$는 원형의 데이터에 보간 개수에 따라 삽입된 데이터를 포함하는 전체 보간데이터의 길이를 의미하고 $N$은 원형의 데이터 길이, 그리고 $a$는 보간데이터의 개수를 의미한다.

데이터 보간법은 시스템 설계를 위한 데이터의 분석에서 원형의 데이터보다 많은 정보를 제공할 수 있어 효과적일 수 있지만, 보간데이터의 수를 무한정 늘릴 수는 없다. 식 (3)을 보면 보간데이터의 개수에 따라 취급되어야 할 전체 데이터 개수가 상당히 늘어나며, 일정 수준 이상의 삽입 후에는 설계 연산량의 엄청난 가중을 초래한다. 논문 (13)에서는 원형의 전력부하 데이터의 샘플 값을 취하고 이들 사이에 삽입되는 보간데이터의 개수 증가에 따른 자기상관함수를 분석한 후, 이웃하는 시차와 시차 사이의 상관계수 값의 감소 폭에 대한 임곗값을 설정하고($\alpha =0.05$) 이를 만족하는 최소 임곗값의 보간데이터 수를 시스템 설계를 위해 적용하였다. 2015년 하계 일별 최대 전력부하 데이터에 대한 분석결과로 보간데이터의 수는 3개로 결정되었으며, 본 논문 또한 이 결과를 이용하여 보간데이터의 개수를 3개로 정의하여 사용한다.

먼저 앞선 경우와 같이 $t_{1},\: t_{2,\:},\:\cdots ,\: t_{N}$에서 측정된 원형의 전력부하 데이터가 $x_{1},\: x_{2},\:\cdots ,\: x_{N}$이라고 하면 $t$시점의 원형의 전력부하 데이터와 $t+1$시점의 원형의 전력부하 데이터 사이에 삽입되는 3개의 보간데이터는 다음과 같이 정의된다.

(4)
\begin{align*} ix_{t}^{1}=\dfrac{x_{t}+(\dfrac{x_{t}+x_{t+1}}{2})}{2}=mean[x_{t},\: mean[x_{t},\: x_{t+1}]]\\ ix_{t}^{2}=\dfrac{x_{t}+x_{t+1}}{2}=mean[x_{t},\: x_{t+1}]\\ ix_{t}^{3}=\dfrac{(\dfrac{x_{t}+x_{t+1}}{2})+x_{t+1}}{2}=mean[mean[x_{t},\: x_{t+1}],\: x_{t+1}] \end{align*}

여기서 $ix_{t}^{1}$는 $x_{t}$와 $x_{t+1}$ 사이에 삽입되는 첫 번째 보간데이터의 값을 의미하고 $ix_{t}^{2}$와 $ix_{t}^{3}$는 각각 두 번째와 세 번째 보간데이터의 값을 의미한다.

이러한 방법으로 모든 데이터 사이에 보간데이터를 삽입하면 원형의 전력부하 데이터는 다음과 같은 벡터 구조를 가지게 된다.

(5)
\begin{align*} {X}=[x_{1},\: ix_{1}^{1},\: ix_{1}^{2},\: ix_{1}^{3},\:x_{2},\: ix_{2}^{1},\:\cdots ,\: \\ x_{t},\: ix_{t}^{1},\: ix_{t}^{2},\: ix_{t}^{3},\: x_{t+1},\:\cdots x_{N-1},\: ix_{N-1}^{1},\: ix_{N-1}^{2},\: ix_{N-1}^{3},\: x_{N}] \end{align*}

또한, 식 (2)와 같은 퍼지규칙을 표현하기 위해선 입력데이터 쌍과 국부 출력값이 요구된다. 일반적으로 퍼지 예측시스템의 설계를 위한 입력데이터값은 시스템의 추론을 담당하는 규칙기반의 개수와 연관된다. 입력의 개수와 설계되는 퍼지집합의 수에 따라 규칙기반 내의 퍼지규칙의 개수가 정의되며, 규칙의 수가 많을 경우는 더욱 세밀한 추론 과정을 유도할 수는 있지만, 규칙을 만족하는 입력데이터의 개수가 상대적으로 적어질 수 있으며, 충분하지 못한 입력데이터의 개수는 규칙기반 후건부의 모수 추정에 부정확성을 초래하게 된다. 그뿐만 아니라 생성된 규칙에 대하여 이후 시스템 예측 과정에서 데이터의 비일관적이고 불규칙적인 특성으로 인해 어떠한 입력값들도 특정 규칙을 만족하지 못한다면 불필요한 규칙들로 인해 시스템 추론 엔진 구조의 복잡성만 야기하게 된다. 따라서 본 논문에서도 논문(13)에서 사용된 입력변수와 동일한 3개의 입력데이터를 기반으로 시스템을 설계한다.

그러므로 식 (5)의 보간데이터를 3개의 입력 및 1개의 출력 형태의 입출력 데이터 쌍으로 변환하면 다음과 같이 표현할 수 있다.

(6)
$$ D=\left[\begin{array}{ccc} x_{1} & i x_{1}^{1} & i x_{1}^{2} \\ i x_{1}^{1} & i x_{1}^{2} & i x_{1}^{3} \\ \vdots & \vdots & \vdots \\ i x_{t}^{1} & i x_{t}^{2} & i x_{t}^{3} \\ \vdots & \vdots & \vdots \\ i x_{N-1}^{1} & i x_{N-1}^{2} & i x_{N-1}^{3} \end{array}\right], \quad Y=\left[\begin{array}{c} i x_{1}^{3} \\ x_{2} \\ \vdots \\ x_{t+1} \\ \vdots \\ x_{N} \end{array}\right] $$

여기서 $D$는 3개의 입력데이터들로 구성된 입력데이터 행렬로 $(4N-6)\times 3$차원 행렬 크기를 가지며, $Y$는 후건부의 모수 추정을 위해 사용될 국부 출력 데이터들로 구성된 출력 열벡터로 $(4N-6)\times 1$차원의 크기를 가진다.

3.2 IT2TSK FIE의 설계

3.1절과 같이 모든 입력데이터에 대하여 입출력 데이터 쌍이 정의되면, 3개의 입력공간과 하나의 출력공간으로 정의될 수 있으며, 이 입출력 쌍을 이용하여 식 (2)와 같은 IT2TSK FIE를 구성하는 퍼지규칙기반을 생성하게 된다. 퍼지규칙기반의 생성을 위해선 식 (2)의 전건부 언어적 속성 표현을 위한 퍼지 군집화 과정과 후건부의 선형 수식 모수 추정을 위한 파라미터 식별이 요구되며, 또한 데이터의 불확실성을 반영하기 위해 FOU를 기반으로 하는 IT2 퍼지집합의 설계가 요구된다.

3.2.1 퍼지 군집화 및 IT2 퍼지집합의 설계

앞서 2.3절에 언급되었듯이 퍼지규칙기반은 시스템의 구조와 성능에 상당한 영향을 미치며, 펴지 규칙의 수는 $n_{F}^{P}$개로 정의된다. 여기서 $n_{F}$는 퍼지집합의 개수를 의미하고, $p$는 입력데이터의 개수를 의미한다. 따라서 본 논문에서처럼 3개의 입력데이터를 이용할 경우 퍼지집합의 개수에 따라 생성되는 규칙의 수가 변하게 되며, 예를 들어 사용되는 퍼지집합의 개수가 각각 2, 3 및 4개일 경우 생성되는 규칙의 수는 8개, 27개 및 64개로 증가하게 된다. 제안된 예측시스템은 데이터의 패턴 특성을 시스템 설계에 적합화하기 위해 1차적으로 보간 기법을 사용하였으며, 데이터의 패턴 변화에서 오는 불확실성의 반영을 위해 IT2 퍼지집합을 설계하므로 다수의 퍼지규칙의 생성보다는 최소의 퍼지규칙 생성으로도 효과적인 예측 수행이 가능한 구조이다. 따라서 퍼지집합의 개수를 각 입력공간 별로 2개로 정의하여 사용한다.

그림. 2. 제안된 시스템 설계에 사용된 IT2 퍼지집합

Fig. 2. The IT2 fuzzy sets used in the proposed system

../../Resources/kiee/KIEE.2020.69.5.688/fig2.png

그림 2는 제안된 퍼지 예측시스템의 규칙기반을 위해 사용한 $k$번째 입력공간에 대한 IT2 퍼지집합의 모양으로, IT2 퍼지집합은 상한소속함수(UMF: Upper Membership Function)와 하한소속함수(LMF: Lower Membership Function)(16)로 구현되어 있으며, 이를 표현하는 공간을 FOU로 정의하고 있다.

각 입력공간 데이터들에 대한 퍼지집합의 생성은 구조가 단순하면서도 효과적인 KM 알고리즘을 적용하였다. 먼저 $k$번째 입력공간 상의 데이터들에 대하여 임의의 $c$번째 퍼지집합의 중심 $z_{k}^{c}$가 주어진다면, 퍼지집합의 중심의 이동 과정은 다음과 같이 정의된다.

(7)
$z_{k}^{c}(i+1)=\dfrac{1}{n_{k}^{c}}\sum_{i=1}^{n_{k}^{c}}m_{k}^{c}(i)$

여기서 $n_{k}^{c}$는 $k$번째 입력공간에서 $c$번째 퍼지집합에 포함되는 데이터의 개수를 의미하며, $m_{k}^{c}(t)$는 포함된 데이터들을 의미한다. 또한, 본 논문에서는 3개의 입력과 2개의 퍼지집합을 사용하므로 $k$=1,2,3으로 정의되고 $c$=1,2로 정의된다.

초기 정의된 각 입력공간 상의 퍼지집합의 중심과 데이터들은 유클리드 거리(Euclidean distance)(17)를 계산하여 가까운 퍼지집합으로 군집화되고, 군집화된 데이터들의 평균을 이용하여 퍼지집합의 중심은 갱신된다. 이때 데이터의 불확실성을 반영하기 위한 FOU는 다음과 같이 표준편차($\sigma$: standard deviation)의 개념을 이용하여 정의하였다.

(8)
$\sigma_{1}=\dfrac{1}{2}\sqrt{\dfrac{1}{ns-1}\sum_{i=1}^{ns}(m_{k}(i)-z_{k}^{1})^{2}}$

(9)
$\sigma_{2}=\dfrac{1}{2}\sqrt{\dfrac{1}{ns-1}\sum_{i=1}^{ns}(m_{k}(i)-z_{k}^{2})^{2}}$

여기서 $m_{k}(i)$는 $z_{k}^{1}$과 $z_{k}^{2}$사이에 위치된 데이터들을 의미하고, $ns$는 이 데이터들의 개수를 의미한다.

식 (8)(9)는 각 중심 사이의 데이터가 가지는 불확실성을 표현하기 위한 것으로 $z_{k}^{1}$으로부터는 우측 방향으로만 불확실성을 표현하고, $z_{k}^{2}$로부터는 좌측 방향으로만 불확실성을 표현하게 되므로 각 중심으로부터의 편차는 한쪽으로만 나타나는 구조를 가진다. 따라서 중심에 대한 편차는 두 식 모두에서 1/2로 제한된다. 이러한 퍼지집합의 중심 및 FOU의 동조는 일반적인 KM알고리즘과 같이 다음과 같은 종료조건을 만족할 때까지 수행된다.

(10)
$\left |\dfrac{z_{k}^{c}(i+1)-z_{k}^{c}(i)}{z_{k}^{c}(i)}\right | <10^{-4}$

여기서 $z_{k}^{c}(i+1)$은 $k$번째 입력공간에 사용된 $c$번째 퍼지집합의 갱신된 중심값을 의미하고, $z_{k}^{c}(i)$는 갱신 이전의 중심값을 의미한다.

위와 같이 퍼지집합에 대한 정의가 수행되면 식 (2)의 $r$번째 퍼지규칙은 본 논문에서 다음과 같이 수정된다.

(11)
$$ \begin{aligned} &R^{r}: \text { If } d_{1}^{r} \text { is } \widetilde{F}_{1}^{r, c=[1,2]} \text { and } d_{2} \text { is } \tilde{F}_{2}^{r, c=[1,2]} \text { and } d_{3} \text { is } \tilde{F}_{3}^{r, c=[1,2]}\\ &\text {Then } Y_{T S K, 2}^{r}(\mathrm{d})=\sum_{k=0}^{3} P_{k}^{r} d_{k}^{r}\\ &\text { where } d_{0}^{r}=1 \text { and } P_{k}^{r}=\left[p_{k}^{r}-s_{k}^{r}, p_{k}^{r}+s_{k}^{r}\right] \end{aligned} $$

여기서 $d_{^{1}}^{r}$은 식 (6)의 입력데이터 행렬에서 첫 번째 열의 데이터 중 $r$번째 규칙을 만족한 입력데이터를 의미하고, $d_{2}^{r}$ 및 $d_{3}^{r}$도 같은 의미를 나타낸다. 또한, $\widetilde F_{1}^{r,\:c=[1,\:2]}$는 첫 번째 입력공간에서 $r$번째 규칙을 만족한 데이터 $d_{1}^{r}$이 그 공간상에서 분할된 2개의 퍼지집합 중 만족한 하나의 퍼지집합을 의미한다.

다음으로 각 공간상의 입력데이터 $d_{k}$가 그 공간상의 어느 하나의 퍼지집합을 만족하였다면, 그때의 퍼지집합에 대한 소속 정도는 다음과 같은 삼각형 소속함수로 정의된다.

(12)

IF

$d_{k} \leq z_{k}^{1} \quad$ or $\quad d_{k} \geq z_{k}^{2}$

$\begin{aligned} \bar{\mu}_{L}\left(d_{k}\right)=1 & \text { or } \quad \bar{\mu}_{R}\left(d_{k}\right)=1 \\ \underline{\mu}_{L}\left(d_{k}\right)=1 & \text { or } \quad \underline{\mu}_{R}\left(d_{k}\right)=1 \end{aligned}$

elseif

$\quad z_{k}^{1}<d_{k}<\left(z_{k}^{1}+\sigma_{k}^{1}\right) \quad$ or $\left(z_{k}^{2}-\sigma_{k}^{2}\right)<d_{k}<z_{k}^{2}$

$\underline{\mu}_{R}\left(d_{k}\right)=0$ or $\underline{\mu}_{L}\left(d_{k}\right)=0$

else \[ \begin{array}{l} \bar{\mu}_{L}\left(d_{k}\right)=\frac{\left(z_{k}^{2}+\sigma_{k}^{2}\right)-d_{k}}{\left(z_{k}^{2}+\sigma_{k}^{2}\right)-z_{k}^{1}}, \underline{\mu}_{L}\left(d_{k}\right)=\frac{\left(z_{k}^{2}-\sigma_{k}^{2}\right)-d_{k}}{\left(z_{k}^{2}-\sigma_{k}^{2}\right)-z_{k}^{1}} \\ \bar{\mu}_{R}\left(d_{k}\right)=\frac{d_{k}-\left(z_{k}^{1}-\sigma_{k}^{1}\right)}{z_{k}^{2}-\left(z_{k}^{1}-\sigma_{k}^{1}\right)}, \underline{\mu}_{L}\left(d_{k}\right)=\frac{d_{k}-\left(z_{k}^{1}+\sigma_{k}^{1}\right)}{z_{k}^{2}-\left(z_{k}^{1}+\sigma_{k}^{1}\right)} \end{array} \]

여기서 $\mu_{L}$은 입력데이터가 첫 번째(그림 2에서 왼쪽의 퍼지집합) 퍼지집합을 만족하는 소속 정도를 의미하고 $\mu_{R}$은 두 번째 퍼지집합(그림 2에서 오른쪽의 퍼지집합)을 만족하는 소속 정도를 의미한다.

3.2.2 최소자승법에 의한 파라미터 식별

식 (11)의 IT2TSK 퍼지규칙의 후건부의 모수 추정은 T1TSK 퍼지규칙의 파라미터 식별 방법중의 하나인 LSM 알고리즘으로 쉽게 추정할 수 있다. 그림 2에서의 UMF와 LMF로 표현되는 FOU가 0일 경우 정확히 T1TSK(Type-1 TSK) 퍼지규칙으로 사상될 수 있으며, 파라미터 폭을 나타내는 $s$는 UMF와 LMF를 이용한 추론 과정을 통해 국부 출력의 구간집합(interval set)으로 표현할 수 있기 때문이다.

식 (11)의 $r$번째 규칙에 대한 파라미터는 $P^{r}=[p_{0}^{r}p_{1}^{r}p_{2}^{r}p_{3}^{r}]$로 구성된다. 만약 $r$번째 규칙을 만족하는 입력데이터 집합의 개수가 $q$개라면(하나의 입력데이터 집합은 여러 개의 퍼지규칙을 만족할 수 있으므로) 이는 다음과 같은 연립방정식 형태로 표현할 수 있다.

(13)
\begin{align*} y^{r}(1)=p_{0}^{r}+p_{1}^{r}d_{1}^{r}(1)+p_{2}^{r}d_{2}^{r}(1)+p_{3}^{r}d_{3}^{r}(1)\\ \vdots \quad\quad\quad\quad \vdots \quad\quad\quad\quad \vdots \quad\quad\quad\quad \vdots \quad\quad\quad\quad \vdots \\ y^{r}(i)=p_{0}^{r}+p_{1}^{r}d_{1}^{r}(i)+p_{2}^{r}d_{2}^{r}(i)+p_{3}^{r}d_{3}^{r}(i)\\ \vdots \quad\quad\quad\quad \vdots \quad\quad\quad\quad \vdots \quad\quad\quad\quad \vdots \quad\quad\quad\quad \vdots \\ y^{r}(q)=p_{0}^{r}+p_{1}^{r}d_{1}^{r}(q)+p_{2}^{r}d_{2}^{r}(q)+p_{3}^{r}d_{3}^{r}(q \end{align*}

여기서 $y^{r}$은 입력데이터 집합에 상응하는 T1TSK 형태의 국부 출력값으로 식 (6)의 열벡터 값 중에 정의되는 값이다.

식 (13)은 최소자승법을 적용하기 위해 다음과 같이 행렬식과 벡터의 형태로 표현할 수 있다.

(14)
\begin{align*} \left[\begin{aligned}\begin{aligned}\begin{aligned}\begin{aligned}y^{r}(1)\\\vdots\quad\end{aligned}\\y^{r}(i)\end{aligned}\\\vdots\quad\end{aligned}\\y^{r}(q)\end{aligned}\right]=\left[\begin{aligned}\begin{aligned}\begin{aligned}\begin{aligned}1 d_{1}^{r}(1)d_{2}^{r}(1)d_{3}^{r}(1)\\\vdots\quad\quad\vdots\quad\quad\vdots\end{aligned}\\1 d_{1}^{r}(i)d_{2}^{r}(i)d_{3}^{r}(i)\end{aligned}\\\vdots\quad\quad\vdots\quad\quad\vdots\end{aligned}\\1 d_{1}^{r}(q)d_{2}^{r}(q)d_{3}^{r}(q)\end{aligned}\right]\left[\begin{aligned}p_{0}^{r}\\\begin{aligned}p_{1}^{r}\\\begin{aligned}p_{2}^{r}\\p_{3}^{r}\end{aligned}\end{aligned}\end{aligned}\right] \end{align*}

(15)
$Y^{r}=D^{r}P^{r}$

따라서 파라미터 $P^{r}$는 LSM 알고리즘을 이용하여 다음과 같이 추정되며

(16)
$$ \hat{P}^{r}=\left[\left\{D^{r}\right\}^{T} D^{r}\right]^{-1} D^{r} Y^{r} $$

추정된 파라미터는 식 (17)에 나타난 오차의 제곱합인 $E^{r}$을 최소화하는 방향으로 탐색된다.

(17)
$E^{r}=(Y^{r}-D^{r}\hat P^{r})^{T}(Y^{r}-D^{r}\hat P^{r})$

3.2.3 Type-Reduction에 따른 시스템의 출력

식 (11)의 IT2TSK 퍼지 모델의 $r$번째 규칙의 국부 출력 $Y_{TSK,\:2}^{r}({d})$는 $[Y_{TSK,\:1}^{r(L)},\: Y_{TSK,\:1}^{r(R)}]$와 같이 T1(Type-1) 형으로 주어지는 최소가중평균 무게중심과 최대가중평균 무게중심으로 표현된 구간집합으로 표현되며, 각각 다음과 같이 정의된다(15,16).

(18)
$Y_{TSK,\:1}^{r(L)}=\sum_{k=0}^{3}p_{k}^{r}d_{k}^{r}-\sum_{k=0}^{3}\left | d_{k}^{r}\right | s_{k}^{r}\quad where \quad d_{0}^{r}=1$

(19)
$Y_{TSK,\:1}^{r(U)}=\sum_{k=0}^{3}p_{k}^{r}d_{k}^{r}+\sum_{k=0}^{3}\left | d_{k}^{r}\right | s_{k}^{r} \quad where \quad d_{0}^{r}=1$

먼저 식 (18)(19)의 최소 가중평균 무게중심과 최대 가중평균 무게중심을 구하기 위해선 LMF와 UMF를 이용한 T1 형의 국부 출력을 얻어야 한다. 만약 하나의 입력데이터 집합이 $M$개의 퍼지규칙을 만족하였다면, 이 입력데이터 집합에 대한 국부 출력은 다음과 같이 얻을 수 있다.

(20)
\begin{align*} Y_{TSK,\:1}^{(l)}=\dfrac{\sum_{r=1}^{M}\underline f^{r}y^{r}}{\sum_{r=1}^{M}\underline f^{r}}=\dfrac{\sum_{r=1}^{M}\underline f^{r}(\hat p_{0}^{r}+\hat p_{1}^{r}d_{1}+\hat p_{2}^{r}d_{2}+\hat p_{3}^{r}d_{3})}{\sum_{r=1}^{M}\underline f^{r}}\\ where\underline f^{r}=\min[\underline\mu^{r}(d_{1})\underline\mu^{r}(d_{2})\underline\mu^{r}(d_{3})] \end{align*}

여기서 $Y_{TSK,\:1}^{(l)}$은 LMF에 의해서 연산되는 하한 출력값을 의미하고, $Y_{TSK,\:1}^{(u)}$은 UMF에 의해서 연산되는 상한 출력값을 의미한다.

위의 두 식의 상한 출력과 하한 출력을 이용하여 최소 가중평균 무게중심과 최대 가중평균 무게중심을 얻기 위해선 다음과 같이 Karnik-Mendel 알고리즘(15)을 이용할 수 있으며,

(21)
$Y_{TSK,\:1}^{L}=\dfrac{\sum_{r=1}^{L}Y_{TSK,\:1}^{r(u)}+\sum_{r=j+1}^{M}Y_{TSK,\:1}^{r(l)}}{\sum_{r=1}^{L}\bar{f}^{r}+\sum_{r=j+1}^{M}\underline f^{r}}$

(22)
$Y_{TSK,\:1}^{U}=\dfrac{\sum_{r=1}^{U}Y_{TSK,\:1}^{r(l)}+\sum_{r=j+1}^{M}Y_{TSK,\:1}^{r(u)}}{\sum_{r=1}^{U}\underline f^{r}+\sum_{r=j+1}^{M}\bar{f}^{r}}$

여기서 $L$과 $U$는 스위칭 점(switching point)으로, 무게중심이 변동하는 점을 의미한다.

마지막으로 식 (21)(22)의 최소 가중평균 무게중심과 최대 가중평균 무게중심이 구해지면 시스템의 최종 출력은 이들의 평균으로 다음과 같이 얻어지게 된다.

(23)
$Y_{TSK,\:2}({d})=(Y_{TSK,\:1}^{L}+Y_{TSK,\:1}^{U})/2$

여기서 $Y_{TSK,\:2}(bold d)$는 입력데이터가 만족한 모든 규칙을 이용하여 추론된 최종 출력을 의미한다.

3.2.4 전력부하 예측 및 데이터 복원

앞서 설명하였듯이 제안된 시스템은 두 번의 예측을 수행하는 구조를 가진다. 실제 예측을 수행하고자 하는 전력부하를 위한 입력으로 사용될 보간데이터를 먼저 예측하고 이를 이용하여 전력부하 데이터를 예측하는 구조이다. 따라서 위와 같이 모든 예측이 수행되면 식 (5)의 데이터에서 보간데이터를 나타내는 $ix$값들은 1차 예측을 통해 얻어진 결과들인 $\hat ix$로 변환된다. 반면 원형의 전력부하 데이터인 $x$값들은 실제 예측이 수행되어야 할 값이므로 원형의 값을 그대로 사용한다. 모든 데이터의 변환이 이루어지면 이 데이터들은 식 (6)과 같은 입력데이터 행렬로 변환된 뒤 실제 예측을 수행하기 위해 시스템의 입력데이터로 사용되며, 이때 퍼지 군집화 및 파라미터 추정 등과 같은 시스템 설계는 초기 설계된 구조를 그대로 사용함으로써 설계의 복잡성을 완화할 수 있도록 한다.

마지막으로 변환된 데이터를 이용하여 제안된 예측시스템이 모든 데이터에 대하여 예측을 수행하게 되면 이 값들은 보간 및 원형의 전력부하 데이터에 대한 전체 예측 결과를 나타내는 것이므로 근본적으로 예측을 수행하고자 하는 원형의 전력부하 데이터값들에 상응하는 예측데이터를 추출해야 한다. 식 (24)는 전체의 예측값 중에서 원형에 상응하는 예측값을 추출하는 과정을 보여준다.

(24)
$\hat x_{t}=\hat d_{(\dfrac{tt-1}{4}+1)} where \quad tt=[1:4\times(N-1)+1]$

여기서 $\hat x_{t}$는 원형의 시점에 상응하는 예측된 전력부하 데이터값을 의미하고 $tt$는 보간데이터를 포함한 전체 데이터의 길이를 의미한다.

이렇게 추출된 예측값이 원형의 최대전력부하 데이터에 대한 제안된 예측시스템의 최종 예측값이 된다.

4. 컴퓨터 시뮬레이션 및 검토

본 논문에서는 국내 2014년 및 2015년도 하계 일별 최대 전력부하 데이터를 이용하여 제안된 예측시스템의 성능을 분석하고 유효성을 검증하였다. 서론에서도 언급했듯이 2014년은 대정전의 위기를 겪을 정도로 일별 최대 전력부하의 변동이 컸던 해로 예측이 매우 까다로운 대상이라고 할 수 있다. 또한, 2015년도 하계 일별 최대 전력부하의 경우는 기존 연구(13) 결과와의 성능 비교 및 구조적 이점 분석을 위한 것이다.

하루의 부하 패턴을 분석하는 단기 전력부하 예측이나 일별 최대 전력부하 예측에서는 통상 주말과 공휴일 등의 특수일은 평일과 전력 소비 패턴이 완전히 다르므로 이들을 제외한 평일의 데이터만을 이용하며, 따라서 본 논문에서도 각 년도 별로 6월에서 8월 사이의 평일 데이터 64개 중 훈련(설계)에 54개, 검증에 10개를 이용하였다.

Case 1) 2014년 국내 하계 최대 전력부하 데이터

그림 3은 선형 보간 처리가 이루어진 2014년도 하계 일별 최대 전력부하 데이터의 모양을 보여준다.

그림. 3. 2014년 국내 하계 일별 최대 전력부하 데이터(원형, 보간데이터)

Fig. 3. Daily peak electric power load during summer season in 2014(Original and LERP data)

../../Resources/kiee/KIEE.2020.69.5.688/fig3.png

그림 3의 좌측은 원형의 하계 전력부하 데이터로 시점상으로만 살펴보면 급격한 변동성을 보여주고 있지만, 우측의 보간형 전력부하 데이터의 경우는 각 시점상으로 분석할 경우 원형보다 완만한 변화특성을 나타내고 있다. 이는 제안된 논문의 설계 의도에 맞게 이웃하는 데이터 상호간의 변동성을 완화함으로써 패턴 분석의 이점을 취할 수 있는 것으로 간주할 수 있다. 그림 4는 각 입력공간 별 퍼지집합 생성을 위해 요구되는 군집의 중심이 변화되는 모습으로 4회의 반복 과정을 거쳐 중심이 수렴되었으며, 파란색과 빨간색으로 표현된 데이터들은 두 개의 군집에 포함된 데이터군을 보여주기 위한 것이다.

그림. 4. 3개의 입력공간에 따른 K-평균 군집화 알고리즘(2014년)

Fig. 4. Result of KM algorithm for three input space(2014)

../../Resources/kiee/KIEE.2020.69.5.688/fig4.png

그림 4를 살펴보면 초기 임의의 군집 중심이 각 빨간색과 파란색으로 표현된 데이터군의 중심으로 이동되었음을 알 수 있다. 이는 퍼지 소속함수의 연산 시 군집의 중심을 기반으로 이루어지기에 소속함수의 동조 과정으로 볼 수 있다. 그림 5는 세 개의 입력공간 중 첫 번째와 두 번째 입력공간에서 IT2 퍼지집합(세 번째 도 유사한 특성)이 생성되는 과정을 보여준다.

그림. 5. 각 입력공간에 따른 IT2 퍼지집합의 모양(2014년)

Fig. 5. IT2 fuzzy set forms in each input space(2014)

../../Resources/kiee/KIEE.2020.69.5.688/fig5.png

그림 5 역시 그림 4의 반복횟수에 따라 IT2 퍼지집합의 모양이 4회 중첩되어서 나타남을 알 수 있으며 2개의 그림 모두 IT2 퍼지집합이 약간 우측으로 동조되어 가고 있음을 보여준다. 그림 6은 원형의 전력부하 데이터와 LERP 기반 T1TSK 퍼지 예측시스템의 예측 결과 및 제안된 IT2TSK 예측시스템의 예측 결과들을 보여준다.

그림. 6. LERP 데이터와 원형 데이터에 대한 제안된 예측시스템의 예측 결과

Fig. 6. Prediction results of the proposed system for LERP and original data

../../Resources/kiee/KIEE.2020.69.5.688/fig6.png

그림 6에서 검은색의 네모표식는 원형의 전력부하 데이터에 대한 그림이고 빨간색의 별표식은 T1TSK 퍼지 예측시스템에 의한 예측 결과이며 파란색의 원형표식은 제안된 IT2TSK 퍼지 예측시스템의 예측 결과를 나타낸다. 그림을 살펴보면 좌측의 LERP 데이터이든 우측의 원형의 데이터이든 T1TSK 예측시스템과 IT2TSK 예측시스템 모두 원형의 데이터를 거의 유사하게 예측함을 알 수 있다. 아래의 표 1은 LERP 기반 T1TSK 예측시스템과 IT2TSK 예측시스템의 성능을 비교한 것이다.

표 1. LERP 기반 T1TSK와 IT2TSK 퍼지 예측시스템의 성능비교

Table 1. Performance comparison between the LERP-based T1TSK and IT2TSK fuzzy prediction systems

system

index

T1TSK Fuzzy system(LERP-based)

IT2TSK Fuzzy system (LERP-based)

Learning

Testing

Learning

Testing

RMSE

38.4655

29.0774

36.0324

26.3688

MRE

0.4129

0.3468

0.3876

0.3110

그림 6표 1을 살펴볼 경우, 시스템 설계에 요구되는 데이터의 패턴이나 정보량을 증가하기 위해 적용된 LERP 방법이 효과적이었음을 알 수 있다. 이는 그림 6에서도 나타나듯 LERP를 기반으로 한 T1TSK 퍼지 예측시스템이나 IT2TSK 퍼지예측시스템 모두 원형의 데이터를 유사하게 예측하고 있음을 보여주기 때문이다. 또한, 표 1을 살펴보면 제안된 LERP 기반 IT2TSK 퍼지예측시스템이 T1TSK 퍼지 예측시스템보다 모든 지표에서 성능이 우수하게 나타났으며, 이는 IT2TSK 퍼지 모델을 기반으로 구현된 제안된 시스템이 데이터의 불명확성을 더욱 명료히 기술할 수 있음을 의미한다고 볼 수 있다.

Case 2) 2015년 국내 하계 최대전력부하 데이터

두 번째 시뮬레이션 예에서는 2015년 국내 하계 최대 전력부하 데이터에 대해 제안된 예측시스템의 성능과 다른 시스템들과의 성능을 비교분석 하였다. 먼저 그림 7은 2015년 하계 최대 전력부하 데이터에 대하여 각 입력공간 별 퍼지집합 생성에 요구되는 군집의 중심 이동 모양을 보여준다.

그림. 7. 3개의 입력공간에 따른 K-평균 군집화 알고리즘(2015년)

Fig. 7. Result of KM algorithm for three input space(2015)

../../Resources/kiee/KIEE.2020.69.5.688/fig7.png

그림 7을 살펴보면 앞선 2014년도 전력부하 데이터와 같이 군집의 중심이 데이터군의 중심으로 이동하는 모습을 알 수 있으며 이에 따라 데이터군도 변동되고 있음을 알 수 있다. 이러한 데이터군의 변동 모양은 2014년도 데이터에 비해 2015년도 데이터에서 더욱 명료하게 드러나고 있다. 그림 8그림 5와 같이 두개의 입력공간 상에서 중심의 이동에 따라 IT2 퍼지집합이 동조되는 모습을 보여준다.

그림. 8. 각 입력공간에 따른 IT2 퍼지집합의 모양(2015년)

Fig. 8. IT2 fuzzy set forms in each input space(2015)

../../Resources/kiee/KIEE.2020.69.5.688/fig8.png

그림 9는 LERP를 기반으로 한 ANN 예측시스템과 T1TSK 퍼지 예측시스템 및 제안된 IT2TSK 퍼지 예측시스템의 예측 결과를 보여준다.

그림. 9. LERP 데이터와 원형의 데이터에 대한 각 예측시스템의 예측 결과

Fig. 9. Prediction results of each system for LERP and original data

../../Resources/kiee/KIEE.2020.69.5.688/fig9.png

그림을 살펴볼 경우 LERP를 기반으로 구현된 ANN이나 T1TSK 및 IT2TSK 퍼지 예측시스템 모두 원형의 최대전력부하 데이터를 거의 정확하게 예측하고 있음을 알 수 있다. 더욱 정확한 성능을 비교하기 위하여 성능지표(MRE)를 이용하였으며, 표 2는 학습구간과 예측구간 별 각 예측시스템의 성능을 비교한 것이다.

표 2. 제안된 LERP 기반 IT2TSK 퍼지 예측시스템과 다른 시스템들과의 성능 비교

Table 2. Performance comparison between proposed LERP-based fuzzy prediction system and other systems

system

index

ANN

T1TSK

Learning

Testing

Learning

Testing

MRE

0.526

0.453

0.543

0.422

system

index

ANN-Fuzzy hybrid type

Proposed

Learning

Testing

Learning

Testing

MRE

0.5176

0.4025

0.5284

0.4031

표 2를 살펴보면 LERP 기반 ANN 예측시스템이나 T1TSK 퍼지 예측시스템도 비교적 원형의 전력부하 데이터를 정확히 예측하고 있음을 알 수 있다. 또한, 두 개의 예측시스템을 러프 집합을 이용한 예측기 운영 규칙을 생성하고 이를 통해 병렬형으로 구동하는 ANN-Fuzzy 병렬형(13)의 경우에는 ANN의 비선형적 데이터 기술능력과 퍼지의 언어적 규칙기반의 활용에 따른 데이터 취급의 용이성이 결합되어 학습구간 및 예측구간 모두에서 더욱 정확한 지표값을 보여주고 있지만, 서론에 언급되었 듯 설계의 어려움과 구조적 복잡성이 동반된다. 반면, 본 논문에서는 IT2TSK 퍼지 예측시스템의 단독 설계를 통해 데이터의 불명확성에 대한 시스템의 기술능력을 취함과 동시에 병렬형과 유사한 예측 결과를 얻을 수 있으므로 구조적 이점과 설계 과정상의 이점을 동시에 취할 수 있었다.

그림 10은 제안된 예측시스템의 설계 및 구조적 이점을 보여주기 위한 것으로 단순히 퍼지집합의 개수를 3개로 하였을 때 첫 번째 입력공간에 대한 K-평균 군집화 과정과 IT2 퍼지집합의 모양을 보여주며, 그림 11은 3개로 퍼지분할을 하였을 때의 예측 결과를 보여준다.

3개의 IT2 퍼지집합을 사용한 경우 학습구간 및 예측구간의 MRE는 각각 0.4844와 0.3696으로 상당히 개선되었으며, 이 결과는

그림. 10. 3개로 분할된 K-평균 군집화 및 IT2 퍼지집합

Fig. 10. KM algorithm and IT2 fuzzy sets divided by three clusters

../../Resources/kiee/KIEE.2020.69.5.688/fig10.png

그림. 11. 3개의 IT2 퍼지집합을 이용한 예측 결과

Fig. 11. Prediction results using three IT2 fuzzy sets

../../Resources/kiee/KIEE.2020.69.5.688/fig11.png

기존의 연구보다 매우 우수한 예측 결과이다. 따라서 이러한 시뮬레이션 결과들을 종합해 보면 제안된 시스템의 설계 방법은 기존 연구보다 단순한 구조임에도 데이터에 내재된 패턴 특성을 충분히 반영할 수 있는 구조로 볼 수 있으며, 더욱이 다른 복잡한 방법들의 접목 없이 퍼지집합의 개수만을 조절하는 것으로도 충분히 성능개선을 할 수 있으므로 매우 유용한 설계 방법으로 간주할 수 있다.

5. 결 론

본 논문에서는 국내 하계 일별 최대 전력부하를 예측하기 위한 예측시스템 설계법을 다루었다.

2014년 및 2015년 국내 하계 일별 최대 전력부하 데이터의 시뮬레이션 결과 두 경우 모두에서 제안된 예측시스템은 우수한 예측성능을 보여주었으며, 특히 2015년 하계 전력부하의 예측 결과에선 LERP 기반 IT2TSK 퍼지 예측시스템(MRE:0.4031)의 단독 운영만으로도 ANN-Fuzzy 병렬형 예측시스템(MRE:0.4025)과 거의 근접한 예측 결과를 얻었다. 또한, 퍼지집합의 개수를 3개로 시뮬레이션하였을 때 MRE가 0.3696으로 기존 연구보다 상당히 개선된 결과를 얻었다. 결국, 이러한 결과들은 제안된 시스템의 설계법이 데이터 패턴의 기술면이나 시스템의 설계 및 운용면에서 기존의 시스템보다 상당히 효과적일 수 있음을 보여주는 것으로 간주할 수 있다. 또한, 제안된 예측시스템의 설계 방법은 전력부하 데이터 분야뿐만 아니라 비선형적이고 불명확한 패턴 특성을 내재하고 있는 다양한 시계열 분야에 응용 가능할 것으로 생각된다. 마지막으로 급격한 증가 추세나 최댓값 변화 폭의 증가는 규칙의 편중 현상을 초래할 수 있고 이러한 데이터 변량의 제한법 또는 정규화 과정 등을 고려한다면, 더욱 정확한 예측성능을 보일 수 있는 시스템 설계가 가능할 것으로 판단되며, 가장 최근의 국내 전력부하 데이터에 대한 연구도 필요할 것으로 생각된다.

References

1 
James W. Taylor, Roberto Buizza, 2002, Neural network load forecasting with weather ensemble predictions, IEEE Trans. on Power Systems, Vol. 17, No. 3, pp. 626-632DOI
2 
D. Ali, M. Yohanna, M. I Puwu, B. M. Garkida, 2016, Long- term load forecast modelling using a fuzzy logic approach, Pacific Science Review A: Natural Science and Engineering, Vol. 18, pp. 123-127DOI
3 
M. Nakamura, 1984, Short Term Load Forecasting using Weekday Load Models and Bias Models, IFAC Proceedings Volumes, Vol. 17, pp. 2097-2102DOI
4 
G. Gross, F. D. Galiana, 1987, Short Term Load Forecasting, Proc. IEEE, Vol. 75, pp. 1558-1573DOI
5 
J. F. Chen, W. M. Wang, C. M. Huang, 1995, Analysis of and adaptive time-series autoregressive moving-average (ARMA) model for short-term load forecasting, Electric Power Systems Research, Vol. 34, pp. 187-196DOI
6 
M. Tamimi, R. Egbert, 2000, Short term electric load forecast- ing via fuzzy neural collaboration, Electric Power Systems Research, Vol. 56, pp. 234-248DOI
7 
J. H. Puiar, 2010, Fuzzy Ideology based Long Term Load Fore- casting, World Academy of Science, Engineering and Technology, Vol. 40, pp. 640-645Google Search
8 
E. B. UI, Islam, 2011, Comparison of Conventional and Modern Load Forecasting Techniques Based on Artificial Intelligence and Expert Systems, IJCSI, Vol. 8, pp. 504-513Google Search
9 
B. J. Chen, M. W. Chang, C. J. Lin, 2004, Load forecast- ing using support vector machines: a study on EUNITE competition 2001, IEEE Trans. on Power Systems, Vol. 19, pp. 1821-1830DOI
10 
Y. R. Gahrooei, R. A. Hooshmand, 2019, Short Term Electricity Price Forecasting by Hybrid Mutual Information ANFIS- POS Approach, Computational Intelligence in Electrical Engineering, Vol. 10, pp. 63-72Google Search
11 
M. Askari, F. Keynia, 2019, Mid-term electricity load fore- casting by a new composite method based on optimal learning MLP algorithm, IET Generation Transmission & Distribution, Vol. 14, pp. 845-852DOI
12 
A. Alshejari, V. S. Kodogiannis, S. Leonidis, 2020, Develop- ment of Neurofuzzy Architecture for Electricity Price Fore- casting, Energies, Vol. 13, pp. 1-25DOI
13 
Y. K. Bang, J. H. Kim, C. H. Lee, 2017, Daily Peak Electric Load Forecasting using Neural Network and Fuzzy system, The Transaction of the Korean Institute of Electrical Engineers, Vol. 67, pp. 96-102DOI
14 
M. Jafari, H. Molaei, 2014, Spherical Linear Interpolation and Bezier Curves, General Scientific Researchs, Vol. 2, pp. 13-17Google Search
15 
Y. K. Bang, C. H. Lee, 2011, Fuzzy Time Series Prediction using Hierarchical Clustering Algorithms, Expert Systems with Applications, Vol. 38, pp. 4312-4325DOI
16 
J. M. Mendal, 2001, Uncertain Rule-based Fuzzy Logic System: Introduction and New Directions, Prentice-Hall, Upper Saddle River, NJ 07458DOI
17 
J. M. Mendal, 2004, Computing derivatives in interval type-2 fuzzy logic system, IEEE Trans. Fuzzy Syst, Vol. 12, pp. 84-98DOI
18 
Z. Cebeci, F. Yildiz, 2015, Comparison of K-Means and Fuzzy C-Means Algorithms on Different Cluster Structures, Journal of Agricultural Informatics, Vol. 6, pp. 13-23Google Search

저자소개

방영근 (Young-Keun Bang)
../../Resources/kiee/KIEE.2020.69.5.688/au1.png

2003년 강원대(삼척) 전기공학과 졸업(석사).

2010년 강원대(춘천) 전기전자공학과 졸업(박사)

E-mail : b2y2c1@hanmail.net

이철희 (Chul-Heui Lee)
../../Resources/kiee/KIEE.2020.69.5.688/au2.png

1985년 서울대학교 전기공학과 졸업(석사).

1989년 서울대학교 전기공학과 졸업(박사).

현재 강원대학교 전기전자공학과 교수

E-mail : chlee@kangwon.ac.kr