• 대한전기학회
Mobile QR Code QR CODE : The Transactions of the Korean Institute of Electrical Engineers
  • COPE
  • kcse
  • 한국과학기술단체총연합회
  • 한국학술지인용색인
  • Scopus
  • crossref
  • orcid

  1. (Dept. of Energy Grid, Sangmyung University, Korea.)



Building energy prediction, Accuracy improvement, Ensemble model, Machine learning

1. 서 론

건물 에너지 관리 전략을 효과적으로 수립하기 위해서는 정확하고 신뢰할 수 있는 에너지 예측 모델이 필수적이다. 건물 에너지 예측은 에너지 소비 및 부하 최적화, 환경에 미치는 영향 감소에 기여한다[1]. 건물 에너지 예측 모델은 과거의 에너지 사용, 외기 조건, 건물의 특성 및 운영 계획 등 다양한 요소를 통합하여 효율적인 에너지 사용계획을 수립하고, 에너지 낭비를 절감하여 전체적인 에너지 비용을 절감할 수 있다. 2021년 에너지시민연대 조사에 따르면, 소규모 상업시설에서는 고객의 편의 및 쾌적성을 위해 법정 기준 이상의 에너지를 소비하고 있는 것으로 나타났다. 이러한 현상은 에너지 절감을 위해 신뢰할 수 있는 건물 에너지 예측 모델 개발의 필요성을 야기한다.

기상 데이터 즉, 환경변수만으로는 건물 에너지 사용량의 복잡성과 다양성을 설명하기엔 불충분하다. 건물 에너지 예측의 경우 취득할 수 있는 데이터가 건물별로 한정적이고 양과 질이 일정하지 않아 예측에 어려움이 존재한다. 건물의 구조, 위치, 외부 환경, 사용자의 행동 및 장비 효율성 등이 건물 에너지 사용량에 영향을 미친다. 건물 에너지 사용량은 시간별 변화하는 외부 환경에 따라 변동이 발생하며 유동 인구로 인해 발생하는 침기로 변동성이 더욱 커진다.

새로운 예측 모델의 개발과 데이터 관리 및 분석의 최신 기술의 도입을 통해 건물 에너지 예측의 정확도는 지속해서 향상하고 있다[2]. 최신 연구에서도 정확한 건물 에너지 예측을 위해 다양한 모델 및 변수 도입을 적용하고 있다. 이러한 배경에서 Kwon & Kim(2023)은 기숙사 건물에 대해 입력 매개변수의 차이에 대한 기계학습 모델을 비교하였으며, 예측 성능 향상을 위해 실내 온도변수 도입을 제안하였다[3]. Lee & Kim(2022)은 물리적 모델과 데이터 기반 모델을 결합한 하이브리드모델을 통해 건물 에너지 예측을 수행하였다. Lee & Kim의 연구 결과에 따르면 하이브리드모델의 정확도는 TRNSYS 시뮬레이션 대비 약 6.5% 우수한 성능을 보였다[4]. Beak & Kang(2023)은 대학교 건물의 냉방기 운영에 대한 유량 예측을 위해 온습도 지수, 순환 변수를 도입하였다. 냉수 유량 예측의 경우 비교 모델 대비 XGBoost 모델의 우수성을 나타내었다[5]. Beak et al.(2021)은 건물 에너지 예측 성능 향상을 위해 주성분 분석을 통해 환경변수의 특성 추출을 수행하였다. Beak et al.(2021)의 연구에 따르면 주성분 분석을 통해 차원이 축소된 데이터를 활용하여 학습하는 방법을 이용하여 예측 오차를 감소시켰다[6]. Jeong and Chae(2017)은 학교와 상업시설에 대해 기계학습 모델을 기반으로 주요 입력변수에 대한 중요도 분석을 수행하였다. Jeong and Chae (2017)의 연구 결과에 따르면, 입력변수의 추가를 통해 예측 성능의 향상을 확인하였다[7]. Wang et al.(2018)은 학교의 시간당 전력 사용량 예측을 위해 Random Forest (RF) 모델을 적용하였다. 이 연구에서는 RF가 회귀 트리 및 서포트 벡터 회귀 모델에 비해 우수한 예측 성능을 나타냄을 확인하였다. 또한, RF의 변수 중요도 분석을 통해 다양한 학기 동안의 건물 운영 조건 변화에 따른 가장 영향력 있는 특징을 식별하여 예측 모델의 정확도를 더욱 향상시킬 수 있음을 제시하였다[8].

이처럼 기계학습 알고리즘의 건물 에너지 예측 정확도 향상을 위한 변수 도입 및 선택을 통한 선행 연구가 많이 발표되었다. 하지만 사무용 건물 및 학교 건물에 관한 연구를 중심으로 이루어지고 있으며, 편의점과 같은 소매시설에 대한 예측연구는 미흡한 상황이다. 또한, 예측 모델은 단일 건물에 수행되어 일반화 측면의 문제와 변수를 적용하기 위해 추가적인 센서 설치 또는 시뮬레이션이 필요한 한계가 있다. 따라서 취득이 용이한 환경변수를 이용하여 예측 정확도 향상을 위한 변수를 생성한다면 데이터 취득의 어려움과 시뮬레이션 부하를 감소할 수 있을 것이다.

편의점의 경우 다른 업종의 건물과 비교 시 환경변수에 대한 약한 상관관계를 나타낸다[9]. Shiel & West(2016)는 상업 건물의 에너지 소비 예측에서 외부 온도를 예측 변수로 사용하는 것의 중요성을 제안하였다. Shiel & West(2016)의 연구에 따르면, 외기온도가 다른 날씨 기반 요인에 비해 가장 중요한 예측 변수임을 검증하였다. 그러나 외기온도만을 단일 예측 변수로 사용할 경우, 에너지 사용량 예측의 정확성이 충분하지 않을 수 있다는 점을 발견했다[10].

본 논문은 편의점의 에너지 사용량 예측 정확도 향상을 목표로 기상 데이터에서 얻을 수 있는 환경변수를 기반으로 한 체감온도 및 도일 변수 도입 방법을 제안한다. 체감온도는 실제 온도와 인간이 느끼는 온도의 차이를 반영한다. 이는 편의점 내외부의 온도 변화에 따른 냉난방 장비 사용량의 변동을 예측하는 데 중요한 역할을 한다. 도일 변수는 난방이나 냉방이 필요한 기간을 정량적으로 나타내며, 계절적 변화가 편의점의 에너지 사용량에 미치는 영향을 모델에 포함한다. 이러한 변수들의 도입은 편의점 에너지 사용 예측 모델의 정확도를 향상하며, 에너지 관리의 실질적 개선을 이끌 것으로 사료된다. 편의점에서 실사용되는 1년간 전력 사용량 데이터를 확보하여 기계학습모델에 적용하였으며 이를 이용하여 일별 전력 사용량 예측을 수행하였다.

논문의 구성은 다음과 같다. 2장에서는 체감온도와 도일 변수의 배경과 예측 모델에 대한 방법론을 기술한다. 3장에서는 편의점 전력 사용 예측 모델링에 대해 기술한다. 4장에서는 구축된 예측 모델을 바탕으로 실제 편의점 데이터를 활용하여 제안된 방법의 유효성을 검증하는 사례연구를 제시하고 분석한다. 마지막으로, 5장에서는 연구 결과를 요약하고 결론을 도출하며, 향후 연구 방향에 대해 논의한다.

2. 방법론

2.1 체감온도 변수

편의점 건물의 전력 사용량은 냉동/냉장/냉난방으로 세분화하여 구분할 수 있으며, 이 중 냉난방의 전력 사용량은 비선형적으로 나타난다[11]. 편의점 건물 에너지 사용량의 주된 변동은 냉난방으로 발생하며, 냉난방은 외부 환경에 노출된 소규모 상업시설에서 고객 유치를 위해 필수적으로 운전된다. 체감온도의 도입은 비선형적 변화를 세밀하게 분석하는 데 중요한 요소로, 실내외 환경 변화에 따른 냉난방 요구 예측의 정확도를 높이는 데 기여한다. 체감온도(Apparent temperature, AT)는 인간이 느끼는 온도를 반영하는 포괄적 지표로서, 건구 온도, 상대습도, 풍속, 증기압을 종합적으로 고려하여 산정된다. 이 변수는 실제로 인간이 체험하는 환경을 더 정확하게 반영하므로, 에너지 수요 모델링에 있어서 실질적인 온도보다 더욱 유용할 수 있다. 이는 기존의 단순 건구 온도만을 고려하는 것보다 인간이 실제로 느끼는 온도를 더 잘 반영할 수 있으므로, 에너지 사용량과 냉난방 요구를 예측하는 모델의 정확도 향상을 위해 중요한 역할을 한다. 체감온도를 산정하기 위한 식은 다음 식 (1)과 같다[12]. 식 (1)에서 $Ta$는 건구 온도(℃), $rh$는 상대습도(%), $V$는 풍속(m/s), $e$는 증기압(Pa)을 의미한다.

(1)
$ AT = T_{a}+ 0.33e - 0.70V- 4.0\\ e = rh/100\times 6.105\times\exp(17.27\times T_{a}/(237.7 +T_{a}) $

2.2 도일 변수

도일법(Degree day)은 건물의 에너지 사용량 예측에 기초가 되는 개념으로, 공조시스템의 효율, 실내 온도, 그리고 실내 발열량이 비교적 일정하다는 가정하에 기준온도와 일 평균 외기온도 간의 차이에 비례하여 에너지 사용량을 추정한다[13]. 도일 변수는 온도의 변화에 따라 건물의 에너지 요구를 정량적으로 평가하는 데 사용되며, 본 연구에서는 입력 변수에 도일 변수를 적용하여 편의점 건물의 냉난방 요구량을 도입하기 위한 변수로 활용하고자 한다.

도일 변수 산정 시 외기 온도별 난방 기준온도는 20℃, 냉방 기준온도는 27℃ 및 외기온도 20~27℃는 비냉난방으로 설정하였다[14]. 도일 변수는 비냉난방, 난방 및 냉방에 해당하는 범주형 데이터와 수치형 데이터 두 가지로 생성된다. 수치형 도일 변수 산정 방법은 성능이 우수한 시간별 도일법을 기반으로[15], 일별 도일 변수를 산정한다. 도일 변수는 일 평균 외기온도에 따라 다음의 식 (2, 3)을 이용한다. $T_{mean}$은 일 평균 외기온도를 의미하며, 시간별 외기온의 평균을 적용한다.

(2)
$HDD=\dfrac{\sum_{h=1}^{24}(20-T_{mean})}{24},\: T_{mean}<20$
(3)
$CDD=\dfrac{\sum_{h=1}^{24}(T_{mean}-27)}{24},\: T_{mean}>27$

2.3 예측 모델

본 연구에서는 편의점 건물의 에너지 사용량을 예측하기 위해 체감온도 변수와 도일 변수를 활용한다. 예측 모델로는 다양한 데이터 구조와 특성을 고려하기 위해 여러 기계학습 및 앙상블 알고리즘을 적용한다. 의사결정나무 기반 앙상블 모델들은 각기 다른 방식으로 데이터의 비선형 패턴을 학습한다. RF는 다수의 결정 트리를 활용하여 예측 성능을 향상한 모델로, 각 트리는 데이터의 붓스트랩(Bootstrap)을 통해 서로 다른 부분집합에서 학습하여 다양성을 확보한다[16]. XGBoost는 최적화된 부스팅 기법을 사용하여 과적합을 방지하고 예측 성능을 개선한다[17]. CatBoost는 범주형 변수 처리에 특화된 부스팅 기반 모델이다[18]. Least Absolute Shrinkage and Selection Operator(LASSO) 모델은 복잡성을 제어하여 과적합을 방지 하고, 대규모 데이터 세트에서 중요 변수를 선별하여 모델의 효율성을 높이는 데 이점을 가진다[19]. Convolutional Neural Network(CNN)은 CNN 모델은 복잡한 데이터의 공간적 및 시간적 패턴을 학습하는 데 탁월한 성능을 보이는 심층 학습 모델이다. CNN 모델은 시간적 변동성이 큰 데이터, 패턴을 인식하고 예측하는 데 유용하다[20]. 최종적으로, Stacking 모델은 여러 개별 모델의 예측을 결합하여 정확하고 신뢰성 있는 예측 결과를 도출한다[21]. 앙상블 모델, 회귀 모델, 신경망 모델에 적용하여 체감온도와 도일 변수의 영향을 다각도로 분석하고자 한다. 또한, 다양한 모델에 대해 예측을 수행하고 앙상블 모델에 적용함으로써 편의점 건물의 에너지 사용량 예측의 정확도와 안정성을 높이고자 한다.

3. 편의점 전력 사용량 예측 모델링

본 장에서는 데이터 기반 모델의 변수 선정 및 변수들을 통합한 건물 에너지 예측 모델의 개발 과정을 논의한다. 데이터 전처리 과정 및 기존 환경변수와 체감온도와 도일 변수에 대한 변수별 상관관계 분석을 수행한다. 변수 추가에 대한 다중공선성 및 속도 개선 문제를 해결하기 위해 주성분 분석(Principal Component Analysis, PCA)을 적용한다.

3.1 예측 모델 데이터 세트

분석 대상은 전국에서 취득한 편의점 86개소이며, 지역별 지점 수는 표 1과 같다. 2022년 1월 5일~2022년 12월 31일까지의 지점별 누적 전력 사용량 측정 데이터를 연구에 사용하였다. 기상 데이터는 동일 기간 기상청에서 제공되는 1시간 단위 기상 데이터를 사용하였다. 지역별 기상 데이터는 지역별 기상청 취득 지점에 대한 평균으로 계산하였다.

표 1 지역별 데이터 취득 분석 지점 수

Table 1 Number of analysis points for regional data acquisition

지점

개소

지점

개소

강원

4

부산

6

경기

31

서울

13

경남

2

인천

4

경북

10

전남

2

광주

2

전북

1

대구

4

충남

5

대전

2

총계

86

3.2 변수별 상관관계

본 연구에서 활용한 입력 변수는 총 8개로 그림 1에서 왼쪽 위에서 순서대로 DD_category, holidays, DD, AT이며, 각각 도일 변수의 범주, 공휴일, 도일 변수, 체감온도를 의미한다. 상관관계 분석을 통해 도입 변수와 건물 지점별 정보와의 관계를 분석하였다. 상관관계는 –1~1까지의 범위를 가지며, 값이 1에 가까울수록 강한 양의 선형관계를, -1에 가까울수록 강한 음의 선형관계를 나타낸다. 0에 가까운 값은 변수 간에 선형관계가 없음을 의미한다. 분석 결과 범주형 도일 변수와 체감온도의 상관관계가 기존 환경변수보다 높은 상관관계를 보였으며, 온도 상승이 특정 건물의 에너지 수요를 증가시킬 수 있음을 의미한다. 도일 변수의 경우 대부분의 지점에서 양의 상관관계를 나타내나, 일부 지점에서는 음의 관계가 나타났다. 같은 지역에서 동일한 환경변수를 사용하므로 측정 지점과의 지리적 위치의 차이와 건물의 운영 환경에 따라 상관관계의 차이가 발생한 것으로 사료된다. 체감온도 및 도일 변수의 경우 기존 환경변수를 사용하여 산정하므로 입력 변수 간 상관관계가 높게 나타나는 문제가 발생한다.

그림 1. 충남지역 5개소 입력 변수 간 상관관계

Fig. 1. Correlation among input variables at five locations in the Chungnam province

../../Resources/kiee/KIEE.2024.73.6.939/fig1.png

3.3 주성분 분석

본 연구에서 다루는 건물 에너지 사용량 예측 모델은 다수의 변수를 포함하고 있다. 변수별 상관관계 분석 결과 체감온도와 도일 변수는 기존 환경변수를 이용하여 생성되므로 입력 변수 간 높은 상관관계를 갖는다. 변수 간 강한 상관관계는 모델의 안정성과 예측력을 저하할 수 있다[22]. 주성분 분석의 적용은 모델의 다중공선성 문제를 해결하고 모델 학습 속도 개선에 기여한다[23]. 이러한 문제를 해결하기 위해 본 연구에서는 주성분 분석을 적용한다.

3.4 하이퍼파라미터 최적화

하이퍼파라미터 최적화는 예측 모델의 성능을 극대화하고, 과적합을 방지하는 데 중요한 과정이다. 이 과정은 모델이 학습 데이터에 과적합 되는 것을 방지하고, 일반화 능력을 향상하는 데 필요하다. 본 연구에서는 광범위한 하이퍼파라미터 공간을 효율적으로 탐색하기 위해 GridsearchCV 방법을 적용하였다.

4. 시뮬레이션 결과 및 분석

변수 도입에 대한 영향분석은 모델별 예측 결과를 Coefficient of Variation of the Root Mean Squared Error (CVRMSE) 평가지표를 사용하여 비교한다. CVRMSE는 건물 에너지 예측 성능을 평가하기 위한 표준화된 평가지표로, 예측값과 실제값 사이의 상대적인 오차를 나타낸다. 이 지표는 모델의 예측 정확도를 절대적인 수치가 아닌, 상대적인 비율로 평가하여, 다양한 규모의 데이터 세트에 대한 모델 성능을 공정하게 비교할 수 있게 한다. CVRMSE는 식 (4)을 통해 계산된다. $n$은 데이터 수, $y_{i}$는 i번째 실측값, $\hat{y}_{i}$는 i번째 예측값, $\overline{y}$는 실측값의 평균을 의미한다. 낮은 CVRMSE 값은 모델의 높은 예측 정확도를 의미한다.

(4)
$CV{SE}=\dfrac{\sqrt{\sum_{{i}=1}^{{n}}\dfrac{({y}_{{i}}-\hat{{y}}_{{i}})^{2}}{{n}}}}{\hat{{y}}}\times 100$

4.1 기준 및 제안 방법

본 연구의 핵심은 기존의 실측데이터와 기상 데이터를 활용하는 기본적인 방법에 변수를 추가하여 예측 성능 개선에 초점을 둔다. 이를 위해, 본 연구는 두 경우에 대한 비교분석을 수행한다. 기존 방법의 경우 선행연구에서 공통으로 활용되는 환경변수만 이용하여 예측하는 것을 선정하였으며[10], 제안 방법은 본 논문에서 제시하는 체감온도 및 도일 변수를 추가한 방법을 의미한다. PCA를 통한 차원 축소는 두 경우에 대하여 동일한 조건에서 비교하기 위해 3차원으로 입력 변수의 수 축소한다. 예측 방법에 대한 구조도는 다음 그림 2와 같다.

그림 2. 기준 및 제안 방법 구조도

Fig. 2. Baseline and proposed model diagram

../../Resources/kiee/KIEE.2024.73.6.939/fig2.png

4.2 편의점 86개소 예측 결과

본 연구는 86개 편의점에 대한 건물 에너지 전력 사용량을 예측하며, CVRMSE를 사용하여 비교 분석한다. 체감온도 및 도일 변수의 도입이 예측 성능에 미치는 영향을 중점적으로 살펴본다. 86개 지점에 대한 평균 예측 오차는 다음 표 2과 같다. 기준과 제안 방법에 대한 모델별 평균 CVRMSE 비교 결과는 RF, CatBoost 모델에서 약 1.4% 개선을 보였으며, LASSO와 CNN 모델의 경우 각 약 0.2, 0.7의 낮은 성능 개선 효과를 보였다. 회귀 및 신경망 모델보다 트리 기반 모델에서 더 높은 개선을 보였다. 이는 도입 변수가 냉난방 및 건물의 필요성을 표현하는 유용한 정보를 제공하며, 기상 데이터만을 사용할 때 발생할 수 있는 변동성을 감소시킨 것으로 사료된다. 기준방법과 제안 방법에 대해 CatBoost와 Stacking 모델의 정확도가 높은 것으로 나타났다. 본 연구에서 제안하는 체감온도 및 도일 변수 도입을 통해 예측 정확도 향상을 확인하였다. 그림 3에서 모든 알고리즘의 기존 방법 대비 제안 방법의 오차율 분포가 감소하였으며, RF 모델과 XGBoost 모델에서 특히 오예측 결과에 대해 개선이 두드러지게 나타났다. 체감온도 및 도일 변수 변수를 도입함으로써 예측의 일관성과 안정성이 개선됨을 알 수 있다.

표 2 예측 모델별 평균 CVRMSE(%)

Table 2 Average CVRMSE (%) by prediction model

예측 모델

기준방법

제안 방법

RF

9.6269

8.1498

XGboost

9.9953

8.2934

Catboost

9.3928

7.9707

LASSO

12.9634

12.7335

CNN

10.3881

9.6846

Stacking

9.2895

8.0457

그림 3. 모델별 편의점 86개소 예측 결과 Box plot

Fig. 3. Box plot of prediction results for 86 convenience stores by model

../../Resources/kiee/KIEE.2024.73.6.939/fig3.png

그림 4는 A 지점에 대한 실측값과 모델별 예측 결과를 나타낸다. 실제값은 검은색, RF, XGBoost, Catboost, LASSO, CNN, Stacking 모델들의 예측값은 각각 하늘색, 주황색, 회색, 노란색, 파란색, 연두색으로 표시된다. 대부분 모델이 실제 에너지 사용량의 변동 추세를 따라가는 것으로 나타났지만, LASSO와 CNN 모델의 경우 특정 시점에서 실제값과 차이가 발생한다. 두 모델이 데이터의 특정 패턴이나 비선형성을 충분히 포착하지 못한 것으로 사료된다. 나머지 앙상블 모델의 경우 실제값과 유사한 패턴을 나타내었으며, CatBoost와 Stacking 모델의 안정성과 일관성이 높게 나타났다.

그림 4. 제안 방법을 통한 A 편의점 건물 예측 결과

Fig. 4. Proposed method for predicting the energy usage of convenience store A

../../Resources/kiee/KIEE.2024.73.6.939/fig4.png

표 3 기준방법 지역별 평균 CVRMSE(%)

Table 3 Baseline method for average CVRMSE(%) by region

지역

RF

XG

Boost

Cat

Boost

LASSO

CNN

Stack

-ing

강원

8.46

8.72

8.09

11.89

8.58

7.78

경기

9.71

10.32

9.45

12.7

10.67

9.26

경남

7.22

7.13

6.75

9.32

9.44

6.61

경북

8.87

9.03

8.56

12.32

9.52

8.82

광주

12.3

12.57

12.13

16.81

11.64

11.83

대구

10.74

10.79

10.87

18.2

10.46

9.96

대전

8.10

8.35

7.99

10.98

9.00

8.14

부산

7.40

7.38

7.14

10.29

9.23

7.32

서울

10.53

11.04

10.39

14.13

11.13

10.36

인천

11.97

12.18

11.85

14.19

12.00

11.79

전남

9.33

9.34

8.73

12.92

9.67

8.77

전북

8.03

8.27

7.91

10.13

9.71

7.95

충남

9.63

9.85

9.38

12.54

10.53

9.23

표 4 제안 방법 지역별 평균 CVRMSE(%)

Table 4 Proposed method for average CVRMSE(%) by region

지역

RF

XG

Boost

Cat

Boost

LASSO

CNN

Stack -ing

강원

7.28

7.55

6.93

11.87

8.41

7.27

경기

8.22

8.46

8.17

12.43

9.97

8.11

경남

5.99

6.05

5.99

9.21

8.74

5.71

경북

7.46

7.79

7.36

12.18

9.12

7.59

광주

9.56

9.58

9.79

15.92

10.44

10.25

대구

9.97

9.61

9.13

18.43

10.15

9.14

대전

7.08

7.27

7.24

11.23

9.63

7.09

부산

6.15

6.44

6.13

10.09

8.66

6.33

서울

8.85

8.71

8.31

13.92

9.78

8.42

인천

10.03

10.16

9.95

13.81

11.15

10.03

전남

8.42

8.46

7.8

12.77

9.54

8.33

전북

7.07

7.39

7.18

9.54

10.12

7.35

충남

7.98

7.99

7.86

11.95

9.38

7.94

4.3 지역별 예측 결과 비교

본 연구에서는 체감온도 및 도일 변수를 추가한 제안 방법과 기준방법을 비교하여 지역별 예측 모델의 성능 차이를 평가하였다. 표 3-4에서 전반적으로 모든 지역에서 제안 방법을 적용하는 경우 기준방법에 비해 예측 오차가 감소하였다. 이는 체감온도 및 도일 변수의 도입이 전반적인 예측 성능의 향상에 기여했음을 나타낸다.

지역별 최적 예측 모델은 표 5과 같다. CatBoost 모델은 강원, 경북, 대구, 부산, 서울, 인천, 전남, 충남 등 다수의 지역에서 최적의 예측 모델로 선정되었다. 이는 CatBoost 모델이 다양한 지역 조건과 데이터 특성에 잘 적응하며 뛰어난 예측 성능을 제공한다는 것을 나타내며, 부산 지역에서는 CVRMSE가 6.13%로 가장 낮은 예측 오차를 나타냈다. Stacking 모델은 경기와 경남 지역에서 가장 좋은 성능을 나타내며, 경남에서는 모든 지역에서 가장 높은 정확도로 5.71%를 기록하였다. 이는 Stacking 모델이 복잡한 데이터 구조와 다양한 패턴을 잘 포착하여 높은 예측 정확도를 달성한 것으로 사료된다. RF 모델은 광주, 대전, 전북에서 최적의 모델로 선정되었다. 이 모델은 전통적으로 안정적인 성능과 함께 변수 중요도 파악에 유리한 특성 덕분에 특정 지역에서 뛰어난 결과를 보인 것으로 사료된다.

표 5 제안방법을 통한 지역별 최적 예측 모델

Table 5 Regional optimal prediction models through the proposed method

지역

Best Model

CVRMSE(%)

강원

CatBoost

6.93

경기

Stacking

8.11

경남

Stacking

5.71

경북

CatBoost

7.36

광주

RandomForest

9.56

대구

CatBoost

9.13

대전

RandomForest

7.08

부산

CatBoost

6.13

서울

CatBoost

8.31

인천

CatBoost

9.95

전남

CatBoost

7.80

전북

RandomForest

7.07

충남

CatBoost

7.86

5. 결 론

에너지 관리 전략 수립을 위해 정확한 예측은 필수적이다. 본 연구에서는 편의점 전력 사용량 예측 정확도 향상을 위해 냉난방 필요성을 고려하기 위한 체감온도 및 도일 변수를 도입하여 수행하는 방법을 제안한다. 전국 편의점 86개소에서 얻은 건물 에너지 사용량 데이터와 기상청으로 제공받은 환경변수를 이용하여 데이터를 구축하였다. 환경변수를 바탕으로 체감온도 및 도일 변수를 산정하여 기계학습 모델에 반영하였다. 데이터의 형태에 따라 건물 에너지 예측 평가를 진행하기 위해 변수 도입 전후에 대한 사례연구를 수행하였다. 예측 결과는 CVRMSE 평가지표를 사용하여 평가되었다. 본 연구에서 제안하는 변수 도입을 통해 모든 예측 모델에 대해 정확도 향상을 모든 지역에서의 성능 개선을 확인하였다. 특히 CatBoost 모델이 다수의 지역에서 최고의 성능을 보였으며, 경남에서는 Stacking 모델이 5.71%로 가장 높은 정확도를 보였다. 제안하는 방법을 통해 기존 건물에 추가적인 설비 도입 없이 건물 에너지 관리의 효율성을 극대화하고, 에너지 소비 최적화에 기여할 것으로 사료된다. 본 연구의 한계점으로는 건물별 특성에 대한 반영이 부족하다. 향후 연구에서는 소규모 소매시설로 연구의 범위를 확장하고 재실 상황에 대한 변수를 통해 예측을 수행하고 환경변수를 개별 건물의 지리적 조건에 대한 공간 모델링 연구를 수행하고자 한다.

Acknowledgements

This work was supported by Korea Institute of Energy Technology Evaluation and Planning(KETEP) and the Ministry of Trade, Industry & Energy(MOTIE) of the Republic of Korea (NO. RS202300238487)

References

1 
A. A. A. Gassar, and S.-H. Cha, “Energy prediction techniques for large-scale buildings towards a sustainable built environment: A review,” Energy and Buildings, vol. 224, 110238, 2020.DOI
2 
Q. Qiao, A. Yunusa‐Kaltungo, and R. E. Edwards, “Towards developing a systematic knowledge trend for building energy consumption prediction,” Journal of Building Engineering, vol. 35, 101967, 2021.URL
3 
O.-I. Kwon, and Y.-I. Kim, “Review of Machine Learning for Building Energy Prediction,” Journal of the Architectural Institute of Korea, vol. 39, no. 5, pp. 133-140, 2023.URL
4 
T.-K. Lee, and J.-U. Kim, “A Hybrid Model for Predicting Power Consumption in Buildings,” The Transactions of the Korean Institute of Electrical Engineers, vol. 71, no. 7, pp. 1015-1022, 2022.URL
5 
Y. Baek, and H. Kang, “Predictive Model of Cooling Energy Consumption of Buildings with Central Cooling Systems using XGBoost,” KIISE Transactions on Computing Practices, vol. 29, no. 9, pp. 418-426, 2023.URL
6 
J.-Y. Baek, S.-W. Min, D.-H. Baek, and S.-J. Chang, “LSTM-based Prediction of Building Power Consumption with PCA Based Data Dimension Change - Centered on a Campus Building in Daejeon -,” Journal of the Architectural Institute of Korea, vol. 37, Issue 9, pp. 137-144, 2021.DOI
7 
J.-H. Jeong, and Y.-T. Chae, “Assessment of Input Variable Importance and Machine Learning Model Selection for Improving Short Term Load Forecasting on Different Building Types,” Journal of Korean Institute of Architectural Sustainable Environment and Building Systems, vol. 11, Issue 6, pp. 586-598, 2017.URL
8 
Wang Z., Wang Y., Zeng R., Srinivasan R., & Ahrentzen S., “Random Forest based hourly building energy prediction,” Energy and Buildings, vol. 171, pp. 11-25, 2018.DOI
9 
M.-y. Jang, J.-i. Lee, N.-j. Jung, Y.-j. Koh, “The Interpolation Method of Electricity Consumption Data by Business Using LSTM and GRU,” The transactions of the Korean Institute of Electrical Engineers, vol. 72, no. 3, pp. 413-418, 2023.URL
10 
P. Shiel, R. West, “Effects of Building Energy Optimisation on the Predictive Accuracy of External Temperature in Forecasting Models,” Journal of Building Engineering, vol. 7, pp. 281-291, 2016.Google Search
11 
D. Lee, S.-H. Kim, and S. Pyo, “Measurement and Analysis for Freezing / Refrigeration / Cooling·Heating Power Consumption of Convenience Store,” The Transaction of the Korean Institute of Electrical Engineers P, vol. 69P, no. 4, pp. 298-303, 2020.URL
12 
R. G. Steadman, “Norms of apparent temperature in Australia,” Aust. Met. Mag, vol. 43, pp. 1-16, 1994.URL
13 
P. Ihm, S.-S. Jung, and D. Seo, “Estimating Cooling and Heating Degree Days for Variable Base Temperature,” Korean Journal of Air-Conditioning and Refrigeration Engineering, vol. 26, no. 2, pp. 79-85, 2014.DOI
14 
S.-H. Lim, and S.-J. Park, “Analysis of Building Energy Demand by Unheated Space Temperature Calculation Method,” Journal of Korean Institute of Architectural Sustainable Environment and Building Systems, vol. 17, no. 5, pp. 308-319, 2023.URL
15 
M. Mourshed, “Relationship between annual mean temperature and degree-days,” Energy and Buildings, vol. 54, no. 11, pp. 418-425, 2012.DOI
16 
L. Breiman, “Random forests,” Machine learning, vol. 45, no. 1, pp. 5-32, 2001.URL
17 
T. Chen, and C. Guestrin, “XGBoost: A scalable tree boosting system,” in Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, pp. 785-794, 2016.URL
18 
Y. Pan, and L. Zhang, “Data-driven estimation of building energy consumption with multi-source heterogeneous data,” Applied Energy, vol. 268, 114965, 2020.DOI
19 
R. Tibshirani, “Regression shrinkage and selection via the lasso,” Journal of the Royal Statistical Society: Series B (Methodological), vol. 58, no. 1, pp. 267-288, 1996.URL
20 
A. Krizhevsky, I. Sutskever, and G. E. Hinton, “ImageNet classification with deep convolutional neural networks,” in Advances in Neural Information Processing Systems, pp. 1097-1105, 2012.URL
21 
B. Pavlyshenko, “Using Stacking Approaches for Machine Learning Models,” 2018 IEEE Second International Conference on Data Stream Mining & Processing (DSMP), pp. 255-258, 2018.URL
22 
J. Daoud, “Multicollinearity and Regression Analysis,” Journal of Physics: Conference Series, vol. 949, 2017.DOI
23 
A. Gwelo, “Principal Components to Overcome Multicollinearity Problem,” Oradea Journal of Business and Economics, vol. 4, Issue 1, pp. 79-91, 2019.URL

저자소개

김기한(Ki-Han Kim)
../../Resources/kiee/KIEE.2024.73.6.939/au1.png

He received the B.S degree from the Sangmyung University.

He is currently a M.S candidate in Sangmyung University.

His research interests include photovoltaic power forecasting, building energy forecasting.

김정욱(Jeong-Uk Kim)
../../Resources/kiee/KIEE.2024.73.6.939/au2.png

He received the M.S and Ph.D. degree from the Korea Advanced Institute of Science and Technology. He is currently a Professor of Electrical Engineering.

His research interests include network algorithm, building automation system, energy performance analysis.