• 대한전기학회
Mobile QR Code QR CODE : The Transactions of the Korean Institute of Electrical Engineers
  • COPE
  • kcse
  • 한국과학기술단체총연합회
  • 한국학술지인용색인
  • Scopus
  • crossref
  • orcid

  1. (Dept. of Transportation Engineering, Korea University of Science and Technology, Korea)
  2. (Smart Electrical & Signaling Division, Korea Railroad Research Institute, Korea)



Load forecast, Random forest, LSTM, DC traction system, Energy efficiency

1. 서 론

탄소 배출량 저감 목적 달성을 위해 철도교통 분야에서 전기 에너지 소비 절감은 중요한 이슈 중 하나이다[1,2]. 특히, 종래의 수동적인 에너지 공급 방식의 변화를 주어 능동적인 변전소 제어를 통한 에너지 절감을 위한 여러 가지 연구가 진행되고 있다[3]. 차세대 급전시스템의 능동제어를 실현하기 위해선 차량의 부하 예측 기반 기술이 필수로 적용되어야 하며, 현재 예측을 이용한 에너지 효율 향상 방안 연구는 미비한 실정이다.

네트워크에 대한 대부분의 에너지 소비 예측 모델은 철도 차량 공급에 필요한 급전계통의 에너지 소비를 추정하는데 중점을 두고 있으며, 이는 두 가지 방법으로 나뉜다. 차량 운행 조건, 모터의 성능 등 운동 방정식을 기반으로 한 미시적 관점에서의 예측 방법과 통계 데이터를 기반으로 자동 회귀 이동 평균 모델과 같은 거시적 관점에서의 회귀 방정식이 제안되었다[4].

도시철도 급전계통의 에너지 소비 예측은 수많은 요인에 의해 영향을 받는 복잡한 비선형 문제이다. 특히, 도시철도의 특성상 높은 부하 변동성을 가지고 있어, 통계기반 예측 모델의 낮은 정확도로 한계점이 존재한다. 따라서, 본 논문에서는 앙상블 기법을 이용한 예측 기반인 random forest 예측 모델을 이용하여 철도 차량의 예측 방법을 소개하고, 나아가 Long Short Term Memory(LSTM) 방법과의 성능비교를 통해 random forest 예측 모델의 우수성을 입증하였다. 아울러, 차량 부하예측을 통한 변전소의 전력 소비량 예측 방법을 제안한다.

2. 본 론

2.1 Conventional Methodology

전기철도의 부하예측은 다양한 예측방법이 차례대로 제안되었고, 통계 기반 예측 방법인 autoregressive moving average model이나 exponential smoothing method 등과 같은 모델이 사용되었으나, 높은 부하 변동성으로 인해 예측 모델은 데이터 간의 변동 패턴을 파악하기 어려워 예측 정확도가 높지 않았다. 예측 성능 향상을 위해 장기 의존성을 갖는 LSTM 모델이나 모델 자체의 복잡성을 줄인 random forest와 같은 모델들이 제안되었다[5].

2.2 Long Short Term Memory

LSTM은 순차적 데이터에서 장기 의존성을 포착하고 소실 기울기 문제를 해결하기 위해 설계된 순환 신경망(RNN) 구조이다. 이 구조는 장기 시퀀스에 걸쳐 정보를 저장하고 검색할 수 있는 메커니즘을 포함하고 있어, 자연어 처리, 시계열 분석, 음성 인식 등 다양한 분야에서 폭넓게 활용되고 있다. 특히, 전기분야에서는 전력 사용량 예측 등에 쓰이고 있다. RNN을 수식으로 나타낸 식은 (1)과 같다[6].

(1)
$h_{t}=\sigma(Wx_{t}+V_{h}h_{t-1})$

여기서, $x_{t}$는 모델에 대한 순차적 입력, W는 입력의 가중치, $V_{h}$는 단기 메모리 $h_{t-1}$에 관련된 가중치, $\sigma$는 시그모이드 활성화 함수이다. LSTM의 메모리 셀 구조는 그림 1과 같으며, 입력 값과 이전 상태를 기반으로 값을 업데이트하여 새로운 상태를 출력한다. 메모리 셀 안에는 입력 게이트, 망각 게이트, 그리고 출력 게이트로 구성되어 있으며, 그림 1과 같다[7].

각각의 게이트 $i_{t}$, $f_{t}$, $o_{t}$, 셀상태 $c_{t}$, 그리고 히든 상태 벡터 $h_{t}$에 대한 수식은 아래와 같다.

(2)
$i_{t}=\sigma(W_{hi}h_{t-1}+W_{\xi}x_{t})$
(3)
$f_{t}=\sigma(W_{xf}h_{t-1}+W_{xf}x_{t})$
(4)
$o_{t}=\sigma(W_{ho}h_{t-1}+W_{xo}x_{t})$
(5)
$c_{t}=f_{t}\odot c_{t-1}+i_{t}\odot\tan h(W_{ia}x_{t}+V_{ia}h_{t-1}+b_{ia})$
(6)
$h_{t}=o_{t}\odot\tan h(c_{t})$

그림 1. LSTM 셀 구조

Fig. 1. Internal cell structure of LSTM

../../Resources/kiee/KIEE.2024.73.10.1774/fig1.png

2.3 Random Forest

전기철도 급전계통의 예측은 초기 자동 회귀 이동 평균 모델와 같은 통계기반 예측 모델이 제안되었다. 하지만, 높은 부하 변동성으로 데이터간 변동 패턴을 얻을 수 없어 예측 정확도가 높지 않았다[8,9]. 모델의 복잡성을 줄이기 위해 앙상블 기법을 이용한 예측 기반인 random forest를 이용한 예측 방법에 대해 많은 연구가 이루어지고 있으며, decision tree의 과적합과 불안정성으로 인한 예측 한계를 극복하기 위해 여러 개의 결정 트리를 생성하여 그 결과를 종합하여 최종 예측을 수행한다[10-12].

기존 급전계통 예측 방법의 경우, 변전소 자체 데이터를 이용해 부하예측을 수행했지만, 실질적으로 부하의 사용과 회생에너지가 발생되는 철도 차량의 예측을 통한 전철 변전소 전력 사용량 예측에 대해선 연구가 미비한 실정이다.

랜덤 포레스트는 여러 개의 의사결정 트리를 결합하여 더 정확한 예측을 제공하는 머신러닝 알고리즘이다. 사용이 편리하고 유연하여 분류와 회귀 문제에 모두 적용될 수 있는 장점이 있어, 다양한 분야에 적용되고 있다. 랜덤 포레스트는 무작위로 선택된 특성 부분집합을 사용하여 다수의 의사결정 트리를 생성하고 이를 통해 상관관계가 낮은 트리들을 만들어 편향과 과대적합을 줄일 수 있다[8]. 랜덤 포레스트 모델의 구조는 그림 2와 같다.

랜덤 포레스트는 회귀나무 모델의 단점인 일반화 성능이 낮은 단점을 해결하기 위해 Ensemble 기법을 적용하였으며, 여러 개의 예측 모델을 조합하여 최적의 예측 모델을 만들었다. 랜덤 포레스트의 핵심 아이디어는 약한 성능의 다수의 분류 및 회귀 의사결정 트리를 특정 규칙을 통해 하나의 숲으로 결합하고, 숲 내 모든 의사결정 트리의 예측 결과를 투표로 종합하여 최종 예측 결과를 도출한다. 랜덤 포레스트는 식 (7)에 나타난 바와 같이 의사결정 트리의 형태를 가지고 있다.

그림 2. 랜덤 포레스트 모델 구조

Fig. 2. Model Structure of random forest

../../Resources/kiee/KIEE.2024.73.10.1774/fig2.png
(7)
$\left\{h(X,\: \theta_{k}),\: k=1,\: 2,\: ...n tree\right\}$
여기서 X는 입력 벡터이고, $\theta_{k}$는 k번째 의사결정 트리 내에서 독립적으로 분포되는 랜덤 벡터다. 입력 벡터 X는 최대 Y개의 범주를 포함하며, 입력 벡터 X와 출력 벡터 Y가 주어진 경우, 엣지 함수는 식 (8)에 의해 주어진다.
(8)
$$K(X, Y)=a_k I\left(h\left(X, \theta_k\right)=Y\right)-\max _{j \neq Y} a_k I\left(h\left(X, \theta_k\right)=j\right)$$

도시철도는 부하의 변화가 급격히 일어나며, 여러 가지 요인에 의해 차량 일정의 지연이 발생할 수 있고, 특히 계절적으로 부하의 변화가 매우 크게 발생하여 단기적인 패턴을 잘 포착하는 random forest가 적합하다. 반면, LSTM은 장기적인 종속성을 학습하는 데 강점이 있어, 단기 패턴 예측에는 오히려 복잡성이 문제가 될 수 있다.

그림 3은 도시철도 A 운영사의 월별 변전소 전력 사용량을 비교한 그래프이다. 2019년부터 2020년까지 12개 변전소 각각의 월별 사용량을 나타내며, 각 변전소의 전력 사용량의 편차는 계절적 요인에 의해 큰 차이를 보인다. 따라서, random forest 모델은 급전계통 부하예측에 적합하며, 다른 예측기법인 LSTM 기법과 성능을 비교하였다.

그림 3. A 철도운영사 월별 전력사용량

Fig. 3. Monthly power usage of substations of line A

../../Resources/kiee/KIEE.2024.73.10.1774/fig3.png

2.4 차량 데이터 예측을 이용한 전철 변전소 예측기법

전기철도 급전계통의 부하예측은 변전소에서 사용한 전력량 데이터를 학습하여 부하예측을 수행한다. 하지만, 실제 전력을 사용하고, 회생에너지를 발생시키는 건 차량이므로, 예측의 정확성을 높이기 위해선 차량 부하 예측에 기반을 두어야 한다. 그림 4는 본 논문에서 제안하는 차량 random forest를 이용한 부하예측 방법을 기반으로 한 전철 변전소의 예측기법에 대한 flowchart이다.

그림 4. Random forest을 이용한 차량 부하예측 기반 변전소 전력량 예측 방법

Fig. 4. Flowchart of substation power forecasting method using random forecast

../../Resources/kiee/KIEE.2024.73.10.1774/fig4.png

데이터 취득과 데이터 전처리 이후 random forest를 이용해 예측한 차량의 전력 사용량과 위치 데이터를 토대로 변전소의 전력 사용량을 계산할 수 있다. 변전소의 전력 사용량은 도출된 차량의 데이터를 기반으로 Norton 등가회로를 이용하여 컨덕턴스 매트릭스를 구성할 수 있다. 차량에서 발생된 전력량을 가선전압으로 나누어 전류를 구할 수 있고, 행렬식을 이용해 가선의 손실을 도출할 수 있고, 전차선에서 발생된 총 손실 에너지 $P_{L}$은 식 (9)와 같이 도출된다.

(9)
$P_{L}=P_{S}+P_{G}-P_{R}-P_{T}$

여기서, $P_{S}$는 변전소 공급에너지, $P_{G}$는 차량에서 발생된 회생전력,$P_{R}$은 변전소에서 회수된 전력, 그리고 $P_{T}$는 차량이 소비한 에너지이다.

2.5 시뮬레이션 결과

본 논문에서는 random forest의 성능 검증을 위해 전철 변전소 전력 소비량 계산은 제외한 차량 부하 예측 결과를 도출하였다. 먼저, 부하예측 모델 학습에 앞서, 데이터의 전처리 과정을 수행하였다.

A 도시철도의 2021년부터 2022년 차량의 TCMS 데이터로 시간에 따른 위치, 속도, 가속도, 차량 전류, 차량 전압 등의 데이터를 상행선, 하행선으로 분류하고, 단위제거와 전류, 전압 값을 이용한 차량 전력 사용량 계산하여 데이터를 사용하였다. Random forest의 결과와 비교하기 위해 LSTM은 표 1의 파라미터를 적용하였고, python의 tensorflow와 keras를 사용하여 Epochs를 30번 수행하였다. 그림 4의 알고리즘을 토대로 python에 sklearn을 이용하였고, 예측 값과 실제 값을 비교한 결과는 그림 5와 같다. 그림의 x-축은 예측 결과, y-축은 실제 값을 나타낸다.

표 1 LSTM 예측모델 학습 파라미터

Table 1 Parameters of LSTM prediction model

Parameters

Values

Sequence length

10

Sequence feature

3

Batch Size

8

Activation function(LSTM)

tanh

Optimizer

Adam

Learning Rate

0.001

그림 5. 모델을 이용한 예측 모델 결과 (a) Random forest (b) LSTM

Fig. 5. Prediction result of (a) Random forest (b)LSTM model

../../Resources/kiee/KIEE.2024.73.10.1774/fig5.png

적용한 random forest 모델의 정확성과 통계적 성능을 확인하기 위해 평가지표인 MAPE, MAE, 조정된 R제곱을 사용하여 비교 대상인 LSTM 모델의 결과와 비교하였다. MAPE,MAE 지표의 값들이 낮으면, 조정된 R제곱은 값이 1에 가까우면 예측의 결과가 우수하다고 평가된다. 해당 지표들의 계산 방식은 식 (10)~(12)과 같다.

(10)
$MAE =\dfrac{1}{N}\sum_{L=1}^{N}\left |(F_{L}-O_{L})\right |$
(11)
${RMSE}=\sqrt{\dfrac{1}{{N}}\sum_{{L}=1}^{{N}}({F}_{{L}}-{O}_{{L}})^{2}}$
(12)
$Adjusted R^{2}= 1-\dfrac{(1-R^{2})(N-1)}{N-k-1}$

해당 지표들에 대한 LSTM과 Random forest 예측 결과값은 표 2와 같다.

표 2 예측모델 결과 비교

Table 2 Comparison of prediction model results

Evaluation metrics

LSTM

Random Forest

MAE

0.0479

0.0022

RMSE

0.0688

0.0468

Adjusted R-Squared

0.9659

0.9825

3. 결 론

본 논문에서는 종래 직류 도시철도 급전계통의 부하예측 방법의 변화를 주어 실질적인 에너지 소비와 회생에너지가 발생하는 차량 부하예측을 이용한 도시철도 변전소 부하예측 방안을 소개하였다. 부하예측을 위해 앙상블 기법 기반인 random forest를 이용하여 예측을 수행하였고, 다른 예측방법인 LSTM 기법과 그 결과를 비교하였다. 평가지표인 MAE, RMSE, 조정 R제곱을 이용하여 비교해본 결과, random forest가 MAE(0.0022), RMSE(0.0468), 그리고 조정 R제곱(0.9825)로 모두 우수한 결과를 도출하였다.

Acknowledgements

This research was supported by a grant from the R&D program (Development of energy-integrated smart energy operation technology for railway stations based on virtualization technology, PK2403C1) of the Korea Railroad Research Institute, Republic of Korea.

References

1 
J. Kim, H. Cho, H. Lee, M.-S. Song, J.-H. Park, and H. Jung, “A Study on the Virtual Operation of Energy Storage Devices using the Electric Railway System HILS Platform,” The Transactions of The Korean Institute of Electrical Engineers, vol. 72, no. 10, pp. 1291~1298, 2023.DOI: 10.5370URL
2 
C.-M. Yun, G.-J. Cho, H. Kim, and H. Jung, “A Study on the Train Brake Position-Based Control Method for Regenerative Inverters,” Energies, 2022.DOI
3 
J. Fabre et al., “Characterization and Implementation of Resonant Isolated DC/DC Converters for Future MVdc Railway Electrification Systems,” IEEE Transactions on Transportation Electrification, vol. 7, no. 2, pp. 854~869, June 2021.DOI
4 
Z. Tang, H. Yin, C. Yang, J. Yu, and H. Guo, “Predicting the electricity consumption of urban rail transit based on binary nonlinear fitting regression and support vector regression,” Sustainable Cities and Society, vol. 66, pp. 1~10, 2021.DOI
5 
Z. Tang, H. Yin, C. Yang, J. Yu, and H. Guo, “Predicting the electricity consumption of urban rail transit based on binary nonlinear fitting regression and support vector regression,” Sustainable Cities and Society, vol. 66, pp. 1~10, 2021.DOI
6 
I. N. Silva, D. H. Spatti, and R. A. Flauzino, Artificial Neural Networks, Springer, pp. 1~10, 2017.URL
7 
K. Greff, R. K. Srivastava, J. Koutnik, B. R. Steunebrink, and J. Schmidhuber, “LSTM: A Search Space Odyssey,” IEEE Transactions on Neural Networks and Learning Systems, vol. 28, no. 10, pp. 1~10, July 2016.URL
8 
V. Veeramsetty, K. Reddy, M. Santhosh, et al., “Short-term electric power load forecasting using random forest and gated recurrent unit,” Electrical Engineering, vol. 104, pp. 307~329, 2022.URL
9 
Q. Ma, H. Wang, P. Luo, Y. Peng, and Q. Li, “Ultra-short-term Railway traction load prediction based on DWT-TCN-PSO_SVR combined model,” International Journal of Electrical Power & Energy Systems, vol. 135, pp. 1~10, 2022.DOI
10 
V. Rodriguez-Galiano, M. Sanchez-Castillo, M. Chica-Olmo, and M. Chica-Rivas, “Machine learning predictive models for mineral prospectivity: An evaluation of neural networks, random forest, regression trees and support vector machines,” Ore Geology Reviews, vol. 71, pp. 1~10, 2015.DOI
11 
G.-F. Fan, M. Yu, S.-Q. Dong, Y.-H. Yeh, and W.-C. Hong, “Forecasting short-term electricity load using hybrid support vector regression with grey catastrophe and random forest modeling,” Utilities Policy, vol. 73, pp. 1~10, 2021.DOI
12 
N. J. J., K. Mohan, and G. Morten, “Relative evaluation of regression tools for urban area electrical energy demand forecasting,” Journal of Cleaner Production, vol. 218, pp. 1~10, 2019.DOI

저자소개

윤치명 (Chi-Myeong Yun)
../../Resources/kiee/KIEE.2024.73.10.1774/au1.png

He received a B.S. degrees in 2019, from the College of Electric and Electrical Enginnering, Seoul, Hongik University. He reveived a M.S. degree from the College of Electrical and Computer Engineering, Sungkyunkwan University, Suwon, South Korea. At present, he is enrolled in the doctor’s program in the Department of Transportation Engineering, Korea University of Science and Technology, Republic of Korea. His research interests include traction system planning and load flow analysis based on load forecasting.

김형철 (Hyungchul Kim)
../../Resources/kiee/KIEE.2024.73.10.1774/au2.png

He received a B.S. and M.S. degree from the College of Electrical Engineering, Korea University, Republic of Korea, in 1991 and 1993, respectively. He received Ph.D. degree in Texas A&M in 2003. He is currently a Principle Researcher with the Smart Electrical & Signaling Division, Korea Railroad Research Institute, Uiwang, South Korea.

정호성 (Hosung Jung)
../../Resources/kiee/KIEE.2024.73.10.1774/au3.png

He received a B.S and M.S. degree in Electrical engineering from Sungkyunkwan University, Republic of Korea, in 1995 and 1998, respectively. He received a Ph.D. degree from the Electrical Electronic and Computer Engineering from Sungkyunkwan University in 2002. He is currently a chief Researcher with the Smart Electrical & Signaling Division, Korea Railroad Research Institute, Uiwang, South Korea.