• 대한전기학회
Mobile QR Code QR CODE : The Transactions of the Korean Institute of Electrical Engineers
  • COPE
  • kcse
  • 한국과학기술단체총연합회
  • 한국학술지인용색인
  • Scopus
  • crossref
  • orcid

  1. (Smart Power Distribution Lab., KEPCO Research Institute, Korea.)
  2. (School of Electrical Engineering, Korea University, Korea.)



Distribution planning, Mid to Long term load forecasting, Ensemble model, Spatial load allocation

1. 서 론

전통적인 전력계통은 발전의 효율성을 높이기 위해 집중화된 발전단지에서 부하가 많은 대도시로 전력을 송전하는 형태를 가지고 있다. 기존 배전계통의 역할은 송전받은 전력을 수용가에 일정하고 원활하게 공급하는 것이며, 송전계통에 비해 크게 주목받지 않았다. 하지만, 최근 세계적으로 탈탄소화(Decarbonization) 흐름에 따라, 배전계통에 연계되는 신재생에너지가 많아지면서, 배전계통의 중요성이 증대되었다. 특히, 국내의 태양광, 풍력 등의 신재생 에너지원은 2019년 기준 약 18%의 설비용량과 약 9%의 발전 비중을 차지하고 있으며, 해당 비중은 계속 증가할 것으로 전망한다(1). 신재생 에너지원의 비중이 증가하면 역조류 현상이 발생할 가능성이 커지고, 전압 불안정과 주파수 불안정 문제를 일으킬 수 있다. 따라서, 문제를 해결할 수 있는 새로운 배전계통 기술이 필요하게 되었다.

이러한 변화에 대응하기 위한 배전계통의 기술 중 한 가지는 분산전원과 부하의 증가량을 고려하여 배전계획을 수립하는 것이다. 변전소나 변압기 설치를 검토할 시, 늘어날 부하와 분산전원의 양을 알 수 있다면, 해당 지역에 적합한 배전용량을 산정할 수 있다. 이는 곧 비용의 절감으로 이어지며, 효율적으로 배전계통을 계획할 수 있게 된다. 하지만, 전통적인 배전계획기법의 예측방식은 배전계통 부하의 일정한 증가를 가정하여 설비나 선로의 용량을 산정하는 것으로, 분산전원의 연계로 인한 변화를 반영한 연구는 많지 않다. 그러나 분산전원의 연계는 기존의 부하 패턴에 변화를 일으킬 수 있으며, 조류해석 측면에서도 역방향 조류문제 등 새로운 문제를 발생시킬 가능성이 존재하기 때문에 주의해야 한다. 따라서, 증가하는 신재생에너지를 고려하여 배전계통을 설계하기 위해서는 배전계통 데이터 기반의 다양한 변수들과 외부요소들을 고려하여 예측모델을 설계할 필요가 있다.

배전계통 관련된 정보를 수집하기 위해 한전에서는 배전자동화시스템(DAS : Distribution Automation System)과 지능형검침인프라(AMI : Advanced Metering Infrastructure)를 운영 중이다. 배전자동화시스템은 배전계통을 구성하는 배전선로에 대해 원격으로 감시 및 제어하는 시스템으로, 배전선로의 부하 및 기기 정보를 취득할 수 있으며, 현재 확대보급 중인 지능형검침인프라는 수용가의 부하 정보를 지리정보시스템(GIS : Geographic Information System)과 연동하여 수집할 수 있다(2-4). 위 시스템을 활용한다면, 과거 데이터를 기반으로 부하 패턴을 알아낸 후, 미래의 부하추세를 예측하는 모델을 설계할 수 있다.

본 논문은 배전계획 수립을 위한 중장기 부하예측 방법과 모델에 관한 내용을 서술하였다. 2장에서는 배전계획을 위한 부하예측에 필요한 데이터를 분석하고, 3장에서는 과거 사용된 부하예측 방법을 서술하였으며, 4장에서는 최근 연구되는 부하예측 기법들의 장단점을 분석한 후, 5장에서는 중장기 배전계획용 부하예측 방법을 제안하였다.

2. 중장기 예측을 위한 배전계통 데이터 분석

일반적으로 예측에서는 사용할 수 있는 자원과 데이터, 비교 모델의 정확도에 따라 예측에 사용할 모델이 달라진다. 따라서, 분산전원의 발전량이나 부하를 단순하게 예측모델에 입력하기에 앞서, 배전계통에서 받을 수 있는 데이터를 정의해야 하며, 프로파일 분석을 통해 예측모델 구현을 위한 적절한 변수들을 선정하는 과정이 선행되어야 한다.

2.1 예측을 위한 배전계획 데이터 정의

예측은 기본적으로 입력변수와 출력변수 간의 상관관계를 기반으로 이뤄진다. 해당 상관관계를 정확히 알아낼수록 정확한 예측이 가능하다. 따라서, 배전계획을 위해 배전계통에서 취득 가능한 데이터를 정의하고, 경제, 지형, 기상 등 다양한 측면에서의 요소를 고려할 필요가 있다.

표 1은 한전에서 전력판매량 증감률 예측모델에 이용되는 데이터로 구성되었다(5). 해당 데이터는 배전계통 데이터로 선로별 부하예측을 위한 기초자료로 사용될 수 있다.

표 2는 분산전원 예측모델과 관련된 데이터이다. 배전계통에 연계되는 상업용이나 주거용 분산전원은 대부분 태양광 발전원이며, 각 발전량을 수집하기 힘들어, 기상 데이터와 지역 내 설치량을 기반으로 부하의 감소량과 변동성을 예측하여야 한다. 공간 데이터를 이용하면 용도별 면적을 얻을 수 있으며, 이후 용도에 따라 단위 면적 내 분산전원의 용량을 가정하는 방식을 적용할 수 있다.

표 1. 전력판매 증감률 예측을 위한 데이터 목록

Table 1. Data list for forecasting the growth rate of power demand

단위

구분

필요 데이터

선정 근거

범위

주기

단위 지역별

연도별

기존 데이터

영업 정보 시스템

(NCIS, NDIS)

기준

배전선로별

고객 종합정보

연간 요금정보

Raw Data

본부

선로별 부하예측을 위한 기초자료

지사

S/S명

S/S코드

D/L명

D/L코드

행정구역

고객번호

계약종별

계약전력

산업분류코드

집계표

전력판매량 (연도별)

사업소

행정구역

전력판매량

계약전력

표 2. 분산전원 예측을 위한 데이터 목록

Table 2. Data list for predicting the capacity of distributed power

단위

구분

필요 데이터

선정 근거

범위

주기

단위 지역별

월별

설비 데이터

용도별 태양광 발전 정보

상업용 태양광 발전소 개수

부하 및 분산전원 예측모델의 입력변수 후보군

상업용 태양광 발전량

주거용 태양광 발전기 개수

주거용 태양광 발전량

태양광설비

설치대수

설치용량

설치시기

설치 가격 및 보조금

AMI 보급률

실시간 계측 가능한 계측기 정보

-

공간 데이터

단위 지역 총 면적

부하 및 분산전원 할당 시 계약종별 토지정보

연/월

단위 지역의 용도별 면적

(발전시설 설치 가능지역)

보전관리지역 면적

계획관리지역 면적

자연환경보전지역 면적

자연취락지역 면적

공업지역 면적

단위 지역 인구

부하 및 분산전원

예측모델의 입력변수 후보군

월/일/시간

기상 데이터

일사량

전운량

습도

온도

표 3은 부하 및 분산전원 예측을 위한 데이터 목록이다. 배전계통도, AMI 데이터, 고객 데이터를 기준으로 기존의 전력 데이터와 공간 데이터를 연계하고, 공간별 부하를 예측하는 데 사용할 수 있다.

표 3. 공간정보

Table 3. Geographic Information

단위

구분

필요 데이터

선정 근거

범위

주기

단위 지역별

연/월

기타

배전선로 계통도

(지도 연계)

공간부하 할당을 위한 기준자료로 사용

연/월/

일/시

AMI 부하량시계열 데이터

연/월/

일/시

AMI 고객정보

연/월

소비자 전력요금

연/월

지역의 인구분포

연/월

도시계획, 부동산, 토지용도

2.2 데이터 분석 및 활용기법

예측모델을 설계하는 데 있어 데이터의 역할은 매우 중요하기 때문에, 다양한 관점에서 데이터 특성을 분석하여 설계하고자 하는 모델의 예측성을 가늠해야 한다. 일반적으로 부하의 경우, 기온의 영향을 크게 받고, 휴일이나 경제적인 요인에 의한 영향은 적게 받는다. 따라서, 부하와 날씨에 대한 데이터의 상관성을 기반으로 만들어진 예측모델은 높은 정확도를 보여줄 것으로 예상할 수 있다.

데이터의 특성을 나타내는 대표적인 예는 다음과 같다. 추세(trend)는 데이터가 장기적으로 증가하거나 감소할 때를 의미한다. 추세가 선형적일 필요는 없으며, 어떤 추세가 증가에서 감소로 변화하는 경우에, 추세의 방향이 변화했다고 한다. 계절성(Seasonality)은 어떤 주기마다 나타나는 것과 같이 계절성 요인이 시계열에 영향을 주는 것을 의미한다. 계절성은 빈도의 형태로 나타난다. 주기성(cycle)은 고정된 빈도가 아닌 형태로 증가나 감소하는 모습을 보일 때 주기가 나타난다. 주기적인 패턴과 계절적인 패턴은 혼동하기 쉽지만, 일정한 빈도로 나타나지 않는 변동은 주기적이다. 빈도가 변하지 않고 연중 어떤 시기와 연관되어 있다면 그 변동은 계절성이다. 일반적으로, 주기들의 평균 길이는 계절성 패턴의 길이보다 길고, 주기의 크기는 계절적인 패턴의 크기보다 좀 더 변동성이 큰 경향이 있다.

산점도는 시계열 사이의 관계를 추측하기 위한 용도로 사용될 수 있으며, 상관계수(Correlation Coefficient)는 두 변수 사이의 관련성을 추측할 때 흔히 계산하는 값이다. 두 변수 x 와 y 사이의 상관계수는 다음과 같이 주어진다. $r$은 항상 –1과 1 사이의 값을 갖고, 음수는 음의 관계를 나타내며, 양수는 양의 관계를 의미한다.

(1)
$r =\dfrac{\sum(x_{t}-\overline{x})(y_{t}-\overline{y})}{\sqrt{\sum(x_{t}-\overline{x})^{2}}\sqrt{\sum(y_{t}-\overline{y})^{2}}}$

상관계수가 두 변수 사이의 선형 관계의 크기를 측정하는 것처럼, 자기상관(Autocorrelation)은 시계열의 시차값(Lagged values) 사이의 선형 관계를 측정한다. 시차 그래프(Lag plot)에서 각 패널과 관련된 몇 가지 자기상관 계수가 있다. 예를 들면, $r_{1}$은 $y_{t}$와 $y_{t-1}$사이의 관계를 측정하고, $r_{2}$는 $y_{t}$와 $y_{t-2}$사이의 관계를 측정하는 식이다. $r_{k}$값은 다음과 같이 쓸 수 있다.

(2)
$r_{k}=\dfrac{\sum_{t=k+1}^{T}(y_{t}-\overline{y})(y_{t-k}-\overline{y})}{\sum_{t=1}^{T}(y_{t}-\overline{y})^{2}}, T: Length \enspace of\enspace Time\enspace Series$

데이터에 추세가 존재할 때, 작은 크기의 시차에 대한 자기상관은 큰 양의 값을 갖는 경향이 있는데, 이는 시간적으로 가까운 관측치들은 관측값의 크기도 비슷하기 때문이다. 그래서 추세가 있는 시계열의 자기상관함수는 양의 값을 갖는 경향을 보이며, 이러한 자기상관함수의 값은 시차가 증가함에 따라 서서히 감소한다. 데이터에 계절성이 존재할 때의 자기상관함수는 다른 시차의 경우보다 계절성 시차의 경우에 더 크게 나타날 것이다.

3. 기존 부하예측 방법론

과거 도시의 성장에 따라 사용되는 전력을 감당하기 위해 전력설비도 지속하여 증설해야 하였다. 도시계획 측면이나 전력설비 측면에서 미리 변전소 위치나 배전선로를 결정하는 것이 필요하였고, 따라서 부하추세에 대한 간단한 예측을 시작하였다. 그림 1은 시대별 부하예측 주요 방법을 나타낸 것이다. 1940년대에는 차트나 표를 이용하여 단순히 부하를 예측하였으며, 예측기간도 몇 주 단위로 길지 않았다. 1970년대에는 예측을 위해 지역 및 국가 단위로 부하 자료를 수집하였고, 10년 이내의 부하증가량을 예측하였다. 1980년대에는 컴퓨터를 이용하여 공간부하정보를 기반으로 송전 및 배전계획을 수립하는데 사용하려는 시도가 있었으며, 수~수십 년 단위의 예측이 이뤄졌다. 1990년대에는 단기 부하예측의 중요성이 증대되면서 회귀 분석, 시계열 분석 및 인공지능 기법 등 다양한 기법들이 활발하게 적용되었다. 2000년대 이후는 계통의 현대화를 통해 일련의 분석과정을 구축하였으나 신재생에너지의 연계 증가로 인한 불확실성을 제어하는 방안에 관한 연구가 필요해졌다(6).

표 4. 연대기별 주요기법 및 예측범위

Table 4. Chronicle of main technique and forecast range

시기

특징

주요기법

예측 범위

1940년대

PC 활용 이전

차트나 표를 이용한 예측

수 주

1970년대

NERC 예측

지역, 국가 부하 예측을 위한 데이터 수집

10년 이내

1980년대

공간 부하

예측

공간 정보를 기반으로 컴퓨터를 이용한 송배전계통 계획에 활용

수 년

~ 수십 년

1990년대

단기 부하

예측

회귀 분석, 시계열 분석 및 인공지능 기법 활용

시간

~ 수십 년

2000년대

스마트

그리드

계통 현대화 및 신재생에너지

불확실성을 고려한 연구

시간

~ 수십 년

3.1 연도별 부하예측 방법론 특징

시스템 신뢰성 증가를 위해 NERC(North American Electric Reliability Corporation)에서 10년 주기의 전력 부하예측을 시도하였다. NERC는 자체적인 예측 방법론을 사용하기보다는 각 전력사업자(Utility)의 예측치를 취합하는 방법을 이용하였다. 1951~1973년의 실제 전력 부하증가율이 7.8%였기 때문에, 이를 반영한 차기의 증가율도 7.5% 정도로 예측하였다. 하지만 10년 뒤, 1982년의 실제 부하증가율은 2.2%에 불과하였다.

1980년대 컴퓨팅 기술을 보편화하기 시작하면서, 부하예측 연구가 본격화되었다. Trending Methods는 과거 부하 패턴 기반의 다항 회귀 방식으로 사용의 용이성, 간편성, 최근 부하추세를 빠르게 반영할 수 있다. 하지만 과적합 및 외삽법으로 인해 장기 부하예측에 실패할 가능성이 존재한다. Simulation Methods는 지형 정보 및 업종, 부하 소비 패턴을 기반한 모델로 단기예측 정확도가 우수할 뿐만 아니라 장기 계획을 위한 유용한 정보를 제공할 수 있다. 하지만 개발 및 학습에 대한 과다한 자원을 소모해야 한다는 문제점이 있다. Hybrid Methods는 위 기법의 특징과 장점을 혼합한 모델로 최근 부하를 반영한 단기간 예측, 지형 및 업종 정보를 활용한 장기간 예측으로 우수한 성능을 보인다. 많은 북미 전력회사에서 상용목적으로 해당 기법을 사용하기도 하였다.

1990년대는 전력산업에서 정확한 단기 부하예측의 중요성이 증가하면서. 회귀 분석이나 시계열 분석과 같은 통계적 방법(Statistical Methods)이 적용되기 시작하였다. 특히, 과학 커뮤니티를 중심으로 기계학습(Machine Learning) 기반 방법론이 활용되기 시작하였으며, EPRI(Electric Power Research Institute)가 AI 기반 연구를 지원하였다. 하지만 AI 기반 모델은 Black-Box 모델로 결정도출과정을 알기 어려워 전력회사에서 정식으로 사용되지 않았으며, 몇몇 전력회사에서는 기존 방법론과 비교목적으로만 활용하였다.

2000년대에 들어서면서, 스마트 미터와 센서, 통신 장비들이 전력망에 도입되기 시작하였고, AMI를 통해 고객의 전력 부하를 직접 수집할 수 있게 되었다. 따라서 고객을 지역·업종·계약별로 분류하여 부하를 예측하는 계층적(Hierarchical) 부하예측 방법론이 대두되었다. 하지만 AMI가 모든 고객에게 보급되는 데는 예산과 시간이 많이 소모되어, 이를 보완해줄 수 있는 확률적 추론을 결합한 예측 방법론이 활발히 연구되고 있다. 대규모의 데이터를 다루고 복잡한 관계성을 지닌 변수들을 다룬다는 점에서 부하예측에 기계학습을 결합한 접근법도 많이 연구되고 있다. 신재생에너지가 도입되면서 전통적 통계 방법론에 기반한 부하예측의 어려움이 많이 증가하였으며, 태양광 발전량의 지속적인 증가 역시 부하의 불확실성에 영향을 주고 있다(6).

3.2 기존 부하예측 방법론 분석

부하를 예측하는 방법은 어떤 관점으로 바라보는지에 따라 달라질 수 있다. 즉, 어떻게 부하를 분류하는지가 중요하다. 주로 예측범위를 기준으로 예측을 구분하는 시계별 예측방법과 단위 지역의 정보를 집계하여 예측하는 계층별 부하 예측방법이 있다.

시계별 부하예측 방법은 초단기, 단기, 중기, 장기로 분류될 수 있으나, 이를 구분하는 명확한 기준은 없다. 일반적으로, 초단기와 단기예측이 비슷한 시간주기와 기법을 적용하며, 중기와 장기를 묶어 중장기 예측기법으로 표현한다. 단기예측은 주로 1시간을 기준으로 하는 예측모델이 많으며, 중장기 예측의 경우, 1일 또는 1개월을 기준으로 하는 예측모델이 대부분이다. 이는 활용목적에 따라 특성이 달라지기 때문이며, 단기예측의 경우 계통운영에서 근미래의 발전량을 산정할 목적으로 사용된다. 계통을 안정적으로 운영하기 위해서는 발전량과 부하량의 균형을 계속 조절해줘야 하며, 빠르게 변화하는 부하추세를 예측하여 공급해야 한다. 또한, 일일 부하의 변동량은 날씨에 영향을 많이 받기 때문에, 기상 변수를 주로 사용하게 된다. 위치에 따라 기상도 다르게 때문에, 예측지역 범위도 도시와 같은 지역 단위로 제한된다. 장기 예측은 계통계획 측면에서 전력설비를 설치하기 위한 목적으로 사용되며, 계통운영과는 달리 하루 내 전체부하량의 급격한 변화가 발생하지 않는다. 따라서, 월 단위의 집계된 부하량을 기반으로 예측하는 것이 편하다. 장기 예측에서는 기본적인 전력 데이터 집계 외에도 인구 정보, 계약종류, 경제지표 등 다양한 변수들을 활용한다(7).

계층별 방법론은 Top-Down 방식과 Bottom-Up 방식으로 구분한다. 먼저, Top-Down 방식은 전체 서비스 지역에 대한 날씨 지수와 거시 경제 지수를 선정하여 예측 주기에 대한 시나리오를 생성하고, 각 소득 등급에 대한 부하예측 시나리오를 적용한다. 해당 방식의 문제점은 고객의 위치 데이터를 반영하기 힘들며, 따라서 세부 패턴을 파악하기 힘들다는 점과 지역적 추세와 사업 현황에 대한 정보가 반영되기 힘들다는 점이다. Bottom-Up 방식은 고객이 다른 기후에 살고 있을 시, 각각의 지역에 특성화된 부하 예측모델을 적용 가능하며, 최근 추세나 진행되고 있는 사업에 대한 통찰력을 반영할 수 있고, 부하 예측과정에서 중/저압단의 공간적 요소, 분산전원의 영향을 고려할 수 있다. 반면, 각 지역의 예측을 집계하는 과정에서 데이터 산정 기준이 달라 예측치가 과다하게 높을 가능성이 존재하며, 각 담당 지역의 이익을 극대화하는 방향으로 운영될 시, 전력회사 전체의 이익이 낮아질 수 있다. 따라서, 전력회사들은 Top-Down 접근법의 장점을 유지하면서, 하위 지역의 부하 특성을 잘 반영할 수 있는 최적의 부하예측 솔루션을 찾고 있다. 특히, 하위 지역의 중요성이 커지고, 맞춤형 모델이 필요함에 따라 지리적 특성, 시간적 특성, 선로 특성, 소득 등급과 같이 계층 정보를 반영하는 계층적 부하예측이 필요하다(6).

4. 부하예측 방법론별 장단점 분석

4.1 통계적 모델(Statistical Model)

⦁ Regression Model는 부하에 영향을 미치는 요인 혹은 부하실적 데이터와 부하 예측치와의 관계를 기술한 회귀식을 결정하는 것으로, 과거의 부하성장을 근거로 모델식의 파라미터를 추정하여 예측식을 작성할 수 있다. 장점은 산출 근거가 명확히 제시 가능하며, 구현·업데이트·자동화가 용이하다. 단점은 선형 회귀모형으로 구성 시, 변수들 간의 관계에 대해 강한 가정이 적용되며, 변수 선정에 따라 예측성능이 크게 좌우된다.

⦁ Box-Jenkins Basic Model은 ARMA(Auto-Regressive Moving Average) 또는 ARIMA(Auto-Regressive Integrated Moving Average) 모델을 적용하여 시계열 과거 값에 대한 시계열 모델 최적합을 찾는 기법이다. 외부변수를 추가적으로 입력한 ARMAX(Auto- Regressive Moving Average with eXogenous variables) 또는 ARIMAX (Auto-Regressive integrated Moving Average with eXogenous variables) 변형 모델도 적용할 수 있다. 장점은 단기 부하예측 시 우수한 예측성능을 보이고 예측을 위해 필요한 파라미터가 적으며, 긴 시계열 데이터가 필요하지 않다. 단점은 장기 예측에 있어서 낮은 예측성능을 보이고, Regression Model 대비 구현·업데이트·자동화가 어렵다(8-10).

⦁ Kalman Filtering Algorithm은 상태 공간 추정을 위한 수학적인 방정식이다. 전력계통과 같은 잡음이 발생하는 시스템을 제어하는데 용이하다. 단점은 비선형 모델에 적용하기 힘들다는 점과 초기 추정이 틀리거나 프로세스가 옳지 않을 경우, 발산할 가능성이 존재한다(11).

⦁ Grey Model은 시스템의 복잡성에 관계없이 이용 가능한 데이터를 기반으로 시스템의 확실한 규칙을 추출한다. 장점은 모든 기간 부하예측에 적합하며, 부하 분배나 부하 성장 추세에 상관없이 모델을 만들 수 있다. 단점은 우세한 지수 성장 형태의 시스템일 때만 적절한 모델이 만들어진다(12,13).

⦁ Exponential Smoothing은 과거 관측치의 지수 가중 평균으로부터 예측을 수행한다. 최근 데이터 가중치를 높게 두고 오래된 데이터에 가중치를 작게 둔다. 장점은 모델의 정확도, 간편성, 견고성, 가격 측면에서 유리하다. 단점은 단수 지수평활법의 경우, 추세가 있는 데이터를 잘 모델링하지 못한다. 또한, 이중 지수평활법의 경우, 계절성 데이터를 잘 모델링하지 못한다(14).

4.2 기계학습 모델(Machine Learning Model)

⦁ Artificial Neural Network는 입력변수와 출력값 사이 관계 파라미터를 학습하여 예측값을 도출한다. ANN은 다양한 구조가 있으므로, 필요한 모델에 따라 적절한 구조를 선택해야 한다. 장점은 입/출력 사이 관계를 정확히 몰라도 모델을 구성할 수 있다는 점이며, 단점은 입/출력 사이 관계를 정확히 설명할 수 없다는 점이다. 또한, 학습에 많은 데이터와 시간이 필요하다(15).

⦁ Support Vector Machine은 입력 데이터를 고차원 공간좌표에 표시한 후 최적으로 영역을 분리시키는 평면을 추출하는 기법이다. 장점은 SVM 해의 복잡성과 성능은 입력 데이터에 직접 의존하지 않아 과적합이 적게 발생하고, 인공신경망에 비해 이용하기 쉽다는 점이다. 단점은 여러 조합을 시험해봐야 하며, 해석이 어렵고 복잡한 블랙박스 모델이라는 점이다(16).

⦁ Fuzzy Logic은 기상 변수와 연간 1개월 간격 최대 부하의 비선형 관계를 정립할 수 있다. 장기간 부하예측에서 인공신경망 모델과 함께 자주 쓰인다. 장점은 기상 변수와 부하 사이에 합리적인 변동성을 확인할 수 있으면 인공신경망에 비해 좋은 성능을 보인다. 시간 복잡도가 높고 메모리가 많이 드는 수학적 모델을 간단하게 만들 수 있다. 단점은 배중률에 어긋나므로, 오차 해석과 같은 정량적 분석이 매우 어렵다(17).

⦁ Genetic Algorithm은 다양한 예측모델 후보 모집단에서 발견된 최적 솔루션의 자연적 선택을 기반으로 최적화를 수행한다. 최적화할 목적함수가 필요하며, 다른 다양한 알고리즘과 결합하여 부하예측을 수행한다. 장점은 비선형 시스템과 잘 호환되는 경우가 많고, 임의적으로 최적화 문제를 풀어가므로 정확한 모델을 구성할 필요가 없다. 단점은 임의로 해를 찾기 때문에 시간이 오래 걸리며 결과가 전역 최적해가 아닐 수 있다(18).

4.3 결합 모델(Hybrid Model)

⦁ Time Series + Support Vector Regression은 시계열 기법에 적합한 변수를 찾기 위해 SVR을 이용하였으며, 다양한 변수 중 예측결과와 관련이 없는 변수를 탈락시키는 방식이다. 신경망에 비해 과적합이 적으며, convex 최적화 문제를 구축하여 단일 최적 솔루션으로 이어지기 때문에 신경망보다 강건성을 보인다(16).

⦁ Firefly Algorithm based Memetic Algorithm + SVR은 진화 알고리즘를 이용하여 SVR의 파라미터를 찾는 방법론이다. 다양한 진화 알고리즘과 예측모델을 결합한 경우에 비해 정확도가 높다(17).

⦁ LSTM + GRU는 모두 RNN에서 기초한 알고리즘으로 파라미터 개수나 식 구성에서 구분된다. GRU는 파라미터 수가 적어서 학습 시간이 더 짧게 걸리고 보다 적은 데이터로도 학습이 가능하다. 충분한 수의 데이터가 있을 경우에는 LSTM의 우수한 모델링 결과를 보여준다(18).

5. 중장기 배전계획용 부하예측 방법

중장기 배전계획을 위한 부하예측 모델을 설계하기 위해서는 여러 가지 요소에 대한 고려가 필요하다. 가장 우선시 되는 요소는 변동성 요소를 고려한 모델 설계이다. 가정용 태양광 설치나 인근 배전선로의 분산형 전원 연계는 최대부하를 예측하는 과정에서 불확실성 요소로 작용할 수 있다. 이는 실제 필요한 부하보다 더 큰 배전용량을 산정하여 설비의 효율성을 저하할 수 있다.

다음 요소는 안정적인 예측성능을 확보하는 것이다. 모델에 따라 학습 데이터에 과적합되어 데이터의 패턴이 아닌 데이터 자체를 학습하게 될 수도 있다. 해당 모델은 학습 데이터와 비슷한 조건에서는 준수한 성능을 보여줄 수도 있지만, 새로운 데이터가 입력될 경우 객관성을 유지하지 못할 수 있다. 따라서, 모델 설계 시 주어진 데이터의 패턴을 잘 학습할 수 있는 모델을 선정해야 한다.

또한, 예측에 대한 근거를 제시할 수 있어야 한다. 배전설비는 투자비용이 많이 투입되므로, 정확한 의사결정을 위한 판단근거가 제시되어야 한다. 따라서, 입출력 변수 간 관계가 안정적이면 회귀 분석 또는 시계열 분석과 같이 상관관계를 명확히 할 수 있는 White-Box 모델을 사용하고, 머신러닝 모델과 같이 상관관계를 명확히 알 수 없는 Black-Box 모델 사용 시, XAI(eXplainable AI) 기법을 통해 산출 근거를 제시할 수 있어야 한다.

5.1 현행 배전계획을 위한 부하예측 모델

현재 한전에서 사용하는 중장기 배전선로 부하예측 알고리즘은 간략하게 그림 2와 나타낼 수 있다. 해당 알고리즘에서는 행정구역별 전력판매량을 1차 선형회귀 기법을 통해 전력판매량의 증감률을 예측한다. 그리고 각 배전선로의 행정구역별 계약전력의 점유율을 도출하여 배전선로가 구역별로 담당하는 전력량을 산정한다. 이를 바탕으로 행정구역별 최대부하 증감률과 배전선로별 최대부하 증감률을 예측하고, 배전선로별로 적용하여 최대부하를 예측한다. 최대부하를 산정하는 이유는 중장기 예측에서 특정 기간 이내의 최대부하를 고려해야 배전계통 안전성을 유지하도록 선로나 전력설비를 보강할 수 있기 때문이다.

하지만, 마지막 단계인 배전선로별 최대부하를 예측하고 종합하는 과정에서 문제가 발생할 수 있다. 일반적으로 배전선로별로 부하가 균등하게 증가하지 않을 뿐만 아니라, 부하의 증감률 역시 1차 선형함수로 나타내기에는 단순하지 않다. 하지만 부하의 증감률을 배전선로에 일괄적용하여 부하를 예측할 경우, 변전소에서 예측한 부하량과 배전선로별 예측한 부하량의 합이 일치하지 않는 문제가 발생할 수 있다. 이는 Bottom-Up 방식의 알고리즘에서 발생한 문제로, 부분적인 관점에서 일괄적으로 적용한 부하의 증가량이 전체적인 관점에서 실제 부하의 증가량과 다르다는 것을 의미한다. 따라서, 기존 방법론을 적용하기 위해서는 실무자의 역량을 통한 조정 절차가 필요하다.

그림. 1. 현행 중장기 배전선로 부하예측 프로세스

Fig. 1. Mid-Long term load forecasting process of KEPCO

../../Resources/kiee/KIEE.2021.70.9.1239/fig1.png

5.2 분산전원을 포함한 중장기 배전계획 부하예측 모델 개요

현행 부하예측 모델에서는 예측 알고리즘으로 선형회귀 기법만을 채택하였다. 선형회귀 기법은 예측 주기가 길고 데이터가 적을 때 강건성이 높은 장점이 있다. 하지만, 배전계통 내 부하 및 분산전원은 날씨 및 경제 등 다양한 외부변수에 영향을 고려해야 하므로, 해당 변수들의 영향성을 분석할 수 있는 인공지능 기법들을 추가로 적용한다면 향상된 정확도를 기대할 수 있을 것이다. 본 논문에서는 데이터 활용의 편의성을 위해 기존 예측시스템과의 연속성을 확보한 머신러닝 기반의 앙상블 모델을 구성하였다.

그림. 2. 태양광 발전량 및 공간 부하를 고려한 배전선로별 최대 부하예측

Fig. 2. Peak load prediction of each distributed lines considering spatial load and PV generation

../../Resources/kiee/KIEE.2021.70.9.1239/fig2.png

5.3 중장기 배전계획 부하예측 모델 설계

중장기 부하예측을 위한 데이터의 상관성을 분석하기 위해서는 다양한 입력변수를 이용하여 실험하는 것이 필요하다. 따라서, 기존 부하데이터, 신재생에너지 사업자 위치, 기상 데이터 및 경제정책 등 기존 연구에서 자주 사용되는 데이터 외에도 D/L 접근성과 같은 공간정보 데이터를 연계하여 다양한 입력변수 후보군을 생성하는 것이 필요하다.

또한, 입력변수로 선정된 데이터를 바로 사용하기는 힘들다. 변수가 많으면 많을수록 데이터의 복잡성이 증가하기 때문에, 계산에 필요한 자원 소모가 급격하게 증가하게 된다. 따라서, 관련이 있는 두 가지 이상의 데이터를 합치는 과정이 필요하다. 이는 탐색적 데이터 분석(EDA : Exploratory Data Analysis)을 통해 시각화된 데이터가 가진 패턴과 특성을 파악할 수 있다. 예를 들어 데이터를 확률분포나 히스토그램으로 나타내고, 특정 숫자의 빈도를 확인한다. 해당 방법론을 적용하면, 기존의 표나 통계에서 파악하기 힘든 데이터의 특성이나 패턴을 좀 더 쉽게 찾아낼 수 있다는 장점이 있다.

그림 4, 5는 분산전원 도입 지역과 도입량에 대한 예측모델을 포함한 공간부하 예측을 위한 데이터 혼합과정이다. 지적도와 D/L 배치도를 기반으로 두 정보를 매칭시킨 후, 단위 지역으로 구획화한다. 단위 지역은 한 구역 내 여러 개의 배전선로가 겹치지 않도록 하며, 배전선로의 부하량을 집계하여 수치화한다. 데이터 매칭과 구획화 작업이 끝나면, 해당 크기의 구역을 최소단위 지역으로 구분한다. D/L이 위치한 단위 지역에서 멀어질수록 낮은 접근성 점수를 부여받게 되고, 모든 구역이 점수를 할당할 때까지 반복수행하게 된다.

그림. 3. 선로 예측모델을 위한 단위 지역 구획화

Fig. 3. Unit area compartmentalization for D/L forecast model

../../Resources/kiee/KIEE.2021.70.9.1239/fig3.png

그림. 4. 기기 기반 공간부하 할당 및 클러스터링 과정

Fig. 4. Spatial load allocation and clustering process based on metering device

../../Resources/kiee/KIEE.2021.70.9.1239/fig4.png

그림. 5. 분산전원 예측결과 및 시나리오 생성 예시

Fig. 5. Example of distributed power forecast result and scenario generation

../../Resources/kiee/KIEE.2021.70.9.1239/fig5.png

그림 6그림 4,5의 예측모델을 활용하여, 분산전원 증가 시나리오를 생성하는 예시다. 기존의 데이터를 입력하면 기존 선로 주위에 있는 단위 지역에 대해 분산전원의 설치 가능성과 설치용량을 도출하게 되고, 이를 기반으로 여러 가지 분산전원 시나리오를 수립할 수 있다. 생성된 시나리오는 배전계통의 안정도 평가를 위한 시뮬레이션 데이터로 활용할 수 있다. 동일한 방법으로 부하예측 시나리오를 생성할 수 있으며 분산전원과 부하예측 시나리오 합성을 통해 최종 중장기 부하예측 시나리오를 생성할 수 있게 된다.

모델의 입력을 위한 데이터 분석과정이 끝나면, 입력변수들을 각 예측모델에 대입하여 성능을 비교군을 형성하여 본다. 일반적으로 부하나 분산전원 예측은 다양한 요소에 의해 입력변수와 출력변수는 복잡한 상관관계를 가진다. 예측모델은 일부 사례에만 예측성능이 편향되면 안 되며, 일반성을 가져야 한다. 하지만, 일부 상관성을 가진 입력변수들로 인해 모델의 결과가 편향되는 다중공선성 문제가 발생할 수 있다(19). 따라서, 기존 분산전원에서 도출한 변수 외 입력변수 간의 상관관계를 그림 7과 같이 분석해야한다. 이를 통해 다양한 입력변수들 중 예측 결과를 편향시키지 않는 입력변수를 선정할 수 있다.

하지만, 단일 예측 알고리즘은 다양한 변수와 패턴을 반영하기 힘들어 필연적으로 편향 문제가 있다. 따라서, 안정적이고 높은 예측성능 확보를 위해 다수 알고리즘을 결합한 기법이 필요하다. 따라서, 다수의 예측모델의 예측치를 기반으로 최종 예측치를 산출하는 앙상블 기법을 도입하여, 단일 모델의 편향 문제를 해소해야 한다. 그림 8이 앙상블 모델을 구성하기 위한 과정을 나타낸다. 먼저, 다양한 예측 알고리즘 중에서 예측 주기, 예측 특성에 따라 후보 알고리즘을 선정한다. 예측 목적에 따라 각 알고리즘을 통해 예측을 수행하여 운영자의 기준 이상의 알고리즘을 선정한다. 각 알고리즘을 앙상블하여 개별 알고리즘 대비 향상된 예측 모델을 구성한다. 이때, 앙상블 모델은 주어진 상황에서 가장 높은 예측력을 보이는 알고리즘에 높은 가중치를 부여하는 방식이며, 편향성을 보이는 두 단일 알고리즘을 상호보완할 수 있다. 따라서 중장기 배전계획 부하예측은 기상 요인, 경제 요인, 지역 특성, 전력 정보로 구성된 입력변수 조합을 입력받는 예측모델들과 해당 예측모델들의 결과를 다시 결합하여 예측하는 앙상블 예측모델로 구성해야 한다. 선정된 입력변수 조합을 통한 앙상블 모델의 정확도 측정 및 피드백이 필요하며, 학습이 완료된 앙상블 모델을 대상 지역의 부하예측에 사용하게 된다.

그림. 6. 입력변수 간 상관관계 분석과정 예시

Fig. 6. Example of correlation analysis between input variables

../../Resources/kiee/KIEE.2021.70.9.1239/fig6.png

그림. 7. 최적 알고리즘 선별 과정

Fig. 7. Optimal algorithm selection process

../../Resources/kiee/KIEE.2021.70.9.1239/fig7.png

6. 결 론

본 논문에서는 배전계획을 위한 기존의 중장기 부하예측에 대한 기법과 모델에 대해 분석하였다. 이를 통해 분산전원 등으로 복잡성이 증가하고 있는 배전계통의 정확도 향상을 위한 중장기 부하예측 모델 설계 방안에 대해 논의하였다. 제안한 예측모델은 기존 배전계획 시 고려되지 않았던 분산전원 요소와 기존 배전시스템의 활용성 한계를 개선할 것으로 기대한다. 향후 한전의 AMI와 배전자동화시스템을 통해 제공되는 전력 빅데이터를 분석하여 데이터의 특성을 파악하고, 성능이 검증된 머신러닝 기법을 수집된 데이터에 적용하여 검증한다면 부하예측의 정확도를 개선할 수 있을 것으로 예상된다. 이를 통해 단위 지역으로 예측된 부하는 중장기적으로 지역 내 부하의 증가패턴을 나타낼 수 있으며, 이는 효율적인 배전설비 계획에 기여할 것으로 기대된다.

Acknowledgements

This work was supported by the KEPCO Research Institute under the project entitled by “A Research of Advanced Distribution Planning System for Mid-Long term (R20DA16)”.

References

1 
2020, 2019 New & Renewable Energy Propagation Statistics, KOREA ENERGY AGENCYGoogle Search
2 
K. Kim, D. Shin, B. Ha, W. Hwang, July 2010, A study on construction and design of distribution intelligent system for the field test, Korean Institute of Electrical Engineers Conference, pp. 7-8Google Search
3 
S. Kwon, B. Kim, C. Chu, S. Yun, 2017, Development of State Estimator for Distribution Management Systems, Journal of the Korean Institute of Illuminating and Electrical Installation Engineers, pp. 37-49DOI
4 
Y. Kim, S. Park, M. Choi, K. Jang, B. Park, N. Jung, 2015, Development of Meter Reading Network Management System based on AMI, Korean Institute of Electrical Engineers ConferenceGoogle Search
5 
2013, The Procedure of Forecasting Distribution Line Peak, KEPCOGoogle Search
6 
T. Hong, Jan. 2015, Load Forecasting Case Study, Eastern Interconnection States’ Planning CouncilGoogle Search
7 
T. Anwar, B. Sharma, K. Chakraborty, H. Sirohia, 2018, Introduction to Load Forecasting, International Journal of Pure and Applied Mathematics, Vol. 119, No. 15, pp. 1527-1538Google Search
8 
M. A. Hammad, B. Jereb, B. Rosi, D. Dragan, 2020, Methods and models for electric load forecasting: A comprehensive review, Logist. Sustain. Transp., Vol. 11, No. 1, pp. 51-76Google Search
9 
P. S. P. Cowpertwait, A. V. Metcalfe, 2009, Introductory Time Series with R. Springer New YorkGoogle Search
10 
A. J. Wood, B. F. Wollenberg, B. F. Wollenberg, 2013, Power Generation, Operation, and Control, WileyGoogle Search
11 
M. Gaur, A. Majumdar, 2016, One-Day-Ahead Load Forecasting using nonlinear Kalman filtering algorithmsGoogle Search
12 
J. Cheng, W. Xiong, L. Ai, 2012, Electric Load Forecasting Based on Improved Grey Neural Network, in Recent advances in computer science and information engineering, Heidelberg: Springer, Vol. 124, pp. 651-655DOI
13 
C. Herui, B. Tao, L. Yanzi, 2013, Short-term Power Load Forecasting Based on Gray Theory, ELKOMNIKA Indonesian Journal of Electrical Engineering, Vol. 11, No. 11Google Search
14 
P. Ji, D. Xiong, P. Wang, J. Chen, A Study on Exponential Smoothing Model for Load Forecasting, 2012 Asia-Pacific Power and Energy Engineering Conference, Vol. 124, pp. 1-4DOI
15 
E. A. Olajuyin, 2018, Long Term Load Forecasting Using Artificial Neural Network, American Journal of Engineering Research, Vol. 7, No. 11, pp. 14-17Google Search
16 
S. Maldonado, A. Gonzalez, S. Crone, 2019, Automatic time series analysis for electric load forecasting via support vector regression, Applied Soft Computing 83DOI
17 
D. Ali, M. Yohanna, M. I. Puwu, B. M. Garkida, 2013, Long- term load forecast modelling using a fuzzy logic approach, Pacific Science Review A: Natural Science and Engineering, Vol. 18, No. 2, pp. 123-127DOI
18 
R. R. B. de Aquino, O. N. Neto, M. M. S. Lira, A. A. Ferreira, K. F. Santos, 2007, Using Genetic Algorithm to Develop a Neural-Network-Based Load Forecasting, in Artificial Neural Networks – ICANN 2007, Vol. berlin, No. heidelberg, pp. 738-747DOI
19 
Z. Hu, Y. Bao, 2013, Electricity load forecasting using support vector regression with memetic algorithms, The Scientific World JournalDOI
20 
M. Dong, 2019, A hybrid distribution feeder long- term load forecasting method based on sequence prediction, IEEE Transactions on Smart Grid, Vol. 11, No. 1, pp. 470-482DOI
21 
H. Eom, Y. Son, S. Choi, 2020, Feature-Selective Ensemble Learning- Based Long-Term Regional PV Generation Forecasting, in IEEE Access, Vol. 8, pp. 54620-54630DOI

저자소개

Jintae Cho
../../Resources/kiee/KIEE.2021.70.9.1239/au1.png

He received the B.S. and M.S. degrees in Electrical Engineering from Korea University, Seoul, Korea, in 2006 and 2008, respectively.

He is currently pursuing an Ph.D. degree in Electrical Engineering at Korea University.

He joined KEPCO Research Institute in 2009.

He is the Senior researcher at Distribution Planning Research Group in Smart Power Distribution Lab. of KEPCO Research Institute, Daejeon, Korea.

His research interests include load forecasting and distribution power system planning included renewable energy resources.

Hongjoo Kim
../../Resources/kiee/KIEE.2021.70.9.1239/au2.png

He received the B.S. and M.S. degrees in Electrical and Electronic Engineering from Korea University, Seoul, Korea in 2010 and 2012, respectively.

From 2012 to 2014, he was with the DL E&C, Seoul, Korea, as a plant design engineer.

From 2014 to 2016, he was with the LS Electric, Anyang, Korea, as an EMS engineer.

He joined KEPCO Research Institute in 2016.

His current research interests include planning, analysis and operation of Distribution Power System.

Hosung Ryu
../../Resources/kiee/KIEE.2021.70.9.1239/au3.png

He received the B.S. and M.S. degrees in Energy System Engineering from Chung-Ang University, Seoul, Korea, in 2019 and 2021.

He joined KEPCO Research Institute in 2021.

His research interests include load forecasting based on deep learning and development of distribution planning system.

Yeunggurl Yoon
../../Resources/kiee/KIEE.2021.70.9.1239/au4.png

He received the B.E. degree in Electrical Engineering from Korea University, Seoul, South Korea, in 2021, and he is currently pursuing the M.S./Ph.D. degree in Electrical Engineering from Korea University, Seoul, South Korea.

His research interests include distribution system planning, renewable energy forecast, and transformer modeling.

Sungyun Choi
../../Resources/kiee/KIEE.2021.70.9.1239/au5.png

He received the B.E. degree in Electrical Engineering from Korea University, Seoul, South Korea, in 2002 and the M.S. and Ph.D. degrees in Electrical and Computer Engineering from Georgia Institute of Technology, Atlanta, GA, USA, in 2009 and 2013, respectively.

From 2002 to 2005, he was a Network and System Engineer, and from 2014 to 2018, he was a Senior Researcher with Smart Power Grid Research Center, Korea Electrotechnology Research Institute, Uiwang-si, Gyeonggi-do, South Korea.

Since 2018, he has been an Assistant Professor with Electrical Engineering, Korea University, Seoul, South Korea.

His research interests include microgrids, power system state estimation, sub- synchronous oscillations, renewable forecasts, and computational intelligence.