제안된 시스템의 설계 과정은 크게 보간 데이터의 삽입, 데이터의 세분화, 병렬 형 TSK 퍼지 예측 시스템 설계과정으로 구성된다.
3.1 전력데이터의 보간
일반적으로 국내 최대 전력 부하 데이터는 산업 성장과정과 계절적 요인으로 추세성과 계절성을 포함하고 있으며, 이들을 세분화하여 분류할 경우 데이터의
양이 감소되어 시스템 설계 시 필요한 정보를 충분히 제공하지 못하거나 모수 추정에 부정확성을 초래하여 예측성능이 저하될 수 있다. 따라서 데이터의
세분화 과정을 위해선 충분한 양의 데이터가 요구되며, 이를 위해 본 논문에서는 이전 논문(11)에서 연구된 결과를 이용하여 각각의 최대 전력 부하 데이터 사이에 3개의 보간 데이터를 삽입하여 시스템을 설계 할 수 있도록 한다.
만약 $t$월에 관측된 최대 전력 부하 데이터를 $x_{t}$라 하고 다음 달에 관측된 최대 전력 부하 데이터를 $x_{t+1}$이라고 한다면, $t$월과
$t+1$월 사이에 삽입되는 보간 데이터는 식(2)와 같이 정의되어 진다.
여기서 $ix_{t}^{1}$, $ix_{t}^{2}$, 및 $ix_{t}^{3}$는 $t$월과 $t+1$월 사이에 삽입되는 첫 번째, 두 번째,
및 세 번째 보간 데이터를 의미한다.
식(2)에 의해 생성된 모든 보간데이터를 원형의 데이터에 삽입하면 시스템 설계를 위한 전체 데이터 구조는 식(3)과 같은 형태로 표현된다.
여기서 $N$은 원형의 최대 전력 부하 데이터의 길이를 의미한다.
결국 원형의 최대 전력 부하 데이터의 길이 $N$은 보간데이터로 인해 $N+(N-1)\times 3$으로 증가되므로 인접한 데이터 상호간의 상관성이나
추세와 같은 시스템 설계에 요구되는 유용한 정보를 충분히 제공할 수 있게 된다.
3.2 전력데이터의 세분화
식(3)의 전력 부하 데이터를 세분화하기 위해선 먼저 식(1)의 TSK 퍼지 논리 모델의 전반부와 후반부 회귀모형의 모수 추정을 위한 적절한 입력데이터의 개수를 정의하여야 한다. 입력 데이터의 개수는 규칙기반을
구성하는 퍼지 규칙들의 개수와 추정되는 모수의 정확성, 그리고 출력의 위한 추론 과정의 복잡성과 밀접한 관계를 가지며, 본 논문에서는 기존 논문들(7,13)에서와 같이 3개의 입력 데이터를 기반으로 예측 값을 얻는 회귀모형을 이용한다. 따라서 식(3)의 주어진 데이터를 제안된 TSK 퍼지 논리 모델에 적용하기 위해 입출력 쌍의 행렬 구조로 표현하면 다음과 같이 표현될 수 있다.
식(4)를 데이터의 형태로 치환하여 표현하면 다음과 같이 표현할 수 있다.
여기서 $d_{4N-3}$은 원형의 데이터 $x_{1},\: x_{2},\:\cdots ,\:x_{N}$에 대하여 각각의 데이터 사이에 3개의 보간
데이터가 삽입되었으므로 치환된 데이터에 의해 늘어난 길이로 표현된 데이터 $d_{1},\: d_{2},\:\cdots ,\: d_{N+(N-1)\times
3}$을 의미한다.
식(5)와 같이 데이터의 구조가 완성되면, 데이터의 추세를 분석하여 세분화 하는 과정을 거치게 된다. 여기서
식(5)의 1~3열의 모든 데이터가 TSK 퍼지 논리 모델의 회귀모형 식을 위한 3개의 입력데이터가 되며, 4열의 모든 데이터는 국부 출력 값을 의미하므로(또는
예측되어야 할 값) 추세 분석을 위해선 입력 데이터들만 요구된다.
입력데이터의 추세 분석에는 입력 데이터 쌍의 전체 구간을 기준으로 입력 데이터 쌍내의 데이터 상호간의 변화량을 다음과 같이 분석한다.
여기서 $c_{1}^{k}$는 식(5)의 $k$번째 행의 입력데이터에 대하여 입력데이터의 전체 구간의 절대 값에 대하여 첫 번째 입력데이터와 두 번째 입력데이터사이의 추세변화(기울기의
형태)를 분석하는 과정이다.
식(6)의 분석과정 종료 후 데이터 군의 세분화를 위한 경계 값은 다음과 같이 정의 된다.
여기서 $cp$는 세분화 임계값(critical point)을 의미하며, 식(7)은 식(6)에서 분석된 모든 값들에 대한 평균을 임계 값으로 정의한다는 것을 의미한다.
마지막으로 임계값을 기준으로 다음과 같이 3개의 세분화된 데이터 그룹을 생성하게 된다.
여기서 $data set^{k}$는 $k$번째 입력 데이터 쌍을 의미하고 $segmented$ $group$은 각 입력데이터 쌍을 세분화하여 구성하게
되는 집단을 의미한다.
3.3 병렬 형 TSK 퍼지 예측 시스템 설계
식(1)의 각각의 퍼지 예측기 설계에 사용되는 TSK 퍼지 논리 모델은 본 논문에서 3개의 입력 데이터와, 각 예측기의 출력 값을 추론하는 퍼지 규칙의 수를
최소화하기 위한 각 2개의 퍼지집합으로 인해 다음과 같이 수정된다.
여기서 $sg$는 3개의 세분화된 그룹 중 하나를 의미한다. 따라서 $R^{sg,\:j}$는 $sg$번째 그룹에 분류된 입력 데이터들로 설계되는 퍼지
예측기의 $j$번째 규칙을 의미하고 $d_{i}^{sg}$는 그 세분화 그룹의 $i$번째 입력을 의미한다. 또한 $F_{[1,\:2]}^{sg,\:j}$는
$sg$번째 세분화 그룹의 $j$번째 퍼지 규칙에 대하여 입력이 만족하는 두 개 중 하나의 퍼지집합을 의미한다. 마지막으로 $c^{sg,\:j}$는
$sg$번째 세분화 그룹의 $j$번째 퍼지규칙을 만족하는 입력들로부터 추정되어야 할 모수를 의미한다.
각 예측기의 퍼지 집합들의 중심은 구조가 단순하면서도 성능이 양호한 K-평균 군집화 기법을 적용하며, 다음과 같은 절차를 따른다. 먼저 $sg$번째
퍼지 예측기 설계에 사용된 모든 입력 데이터 집합을 $D^{sg}$라 하면, $sg$번째 퍼지 예측기의 초기 퍼지집합의 중심은 3개의 입력 데이터
군에 대하여 평균과, 최소 및 최대값을 이용하여 다음과 같이 정의된다.
여기서 $mean(D^{sg}(:,\:1))$는 $sg$번째 입력데이터 쌍들에서 첫 번째 열의 모든 데이터들에 대한 평균을 의미하며, 나머지도 같은
형태의 의미로 해석될 수 있다.
이렇게 초기 두 개의 퍼지집합의 중심이 설정되면, $sg$번째 퍼지 예측기의 입력 데이터들은 상응하는 예측기의 초기 중심들과의 유클리드 거리(Euclidean
distance)를 계산하여 가까운 중심의 퍼지집합으로 포함되는 과정과 군집화된 데이터들의 평균으로 퍼지 집합 중심을 갱신하는 과정을 거치게 되며,
다음 조건을 만족할 때까지 반복 수행된다.
여기서 $Z_{i+1}^{sg}$는 갱신된 중심을 의미하고 $Z_{i}^{sg}$는 갱신 전의 중심을 의미한다.
위와 같이 퍼지 집합의 분할이 완료되면, 각각의 퍼지 예측기는 3개의 입력과 2개의 퍼지 집합을 이용하므로 최대 8개의 퍼지 규칙과 이들의 점화 강도를
이용하여 추론을 수행하게 된다.
식(12)는 각 규칙의 점화강도 연산을 위해 본 논문에서 사용한 삼각형 소속함수를 보여준다.
여기서 $\mu_{L}^{sg}$는 $sg$번째 예측기의 $i$번째 입력 데이터 $d_{i}^{sg}$가 첫 번째 퍼지집합을 만족하는 소속 정도를
의미하고 $\mu_{R}^{sg}$는 같은 데이터가 두 번째 퍼지 집합을 만족하는 소속 정도를 의미한다.
식(9)의 $sg$번째 퍼지 예측기의 $j$번째 퍼지 규칙을 만족하는 입력데이터쌍이 $n$개라면 후반부 회귀식은 다음과 같은 연립방정식 형태로 표현 가능할
것이다.
여기서 $d_{i+3}^{sg,\:j}(q)$는 $sg$번째 예측기 설계에 사용된 모든 입력데이터들 중 $j$번째 퍼지 규칙을 만족한 $n$개의 입력데이터
쌍들 중 $q$번째 입력데이터 쌍의 4열값으로 모수 추정을 위한 국부 출력값을 의미한다. 또한 우항의 $d^{sg,\:j}(q)$는 나머지 세 개의
입력 데이터를 의미하고 $c^{sg,\:j}$는 이 입력들과 국부 출력으로부터 추정되는 모수들을 의미한다.
식(13)의 연립방정식은 다음과 같이 행렬과 벡터로 표현할 수 있다.
여기서 $D_{output}^{sg,\:j}=[d_{i+3}^{sg,\:j}(1)\cdots d_{i+3}^{sg,\:j}(q)\cdots d_{i+3}^{sg,\:j}(n)]^{T}$이고,
$C^{sg,\:j}=$$[c_{0}^{sg,\:j}c_{1}^{sg,\:j}c_{2}^{sg,\:j}c_{3}^{sg,\:j}]^{T}$를 의미한다.
또한 $D_{\in put}^{sg,\:j}$는 다음과 같이 표현된다.
그러므로 식(14)의 모수 벡터 $C^{sg,\:j}$는 최소자승법에 의해 다음과 같이 추정될 수 있다.
식(16)의 최소자승법에 의해 추정되는 모수들은 실제 출력 값 $D_{output}^{sg,\:j}$과 추정된 모수에 의해 연산된 시스템의 예측 값 $\hat
D_{output}^{sg,\:j}=D_{\in put}^{sg,\:j}\hat C^{sg,\:j}$사이에서 다음의 오차 제곱함수 $E^{j}$를
최소화 할 수 있는 형태로 유도되어 진다.
위와 같은 과정들은 각각의 예측기의 모든 규칙의 모수 추정에 동일하게 적용된다.
마지막으로 위와 같이 추정된 모수들을 이용한 예측 국부 출력과 규칙의 전반부에서 연산된 규칙의 점화 강도를 이용하여 시스템의 최종 출력을 얻게 된다.
하나의 입력 데이터 쌍은 여러 개의 퍼지규칙을 만족할 수 있으며, 만약 $sg$번째 예측기의 $q$번째 입력 데이터 쌍이 $M$개의 퍼지 규칙을 만족하였다면,
이 입력데이터 쌍으로부터 예측기는 다음과 같이 최종 출력을 유도하게 된다.
여기서 $f^{sg,\:j}$는 $sg$번째 예측기의 $j$번째 규칙이 점화되는 강도로 minimum연산을 통해 다음과 같이 얻어진다.
위와 같은 과정을 통해 모든 데이터에 대하여 예측을 수행한 후, 길이가 변화된 보간데이터를 원형의 데이터로 복원하는 것이 요구되며, 식(20)은 원형의 데이터에 상응하는 예측 데이터를 추출하는 과정을 보여준다.