The Korean Meteorological Society 1

Current Issue

Atmosphere - Vol. 34 , No. 1

[ Article ]
Atmosphere - Vol. 34, No. 1, pp. 23-34
Abbreviation: Atmos
ISSN: 1598-3560 (Print) 2288-3266 (Online)
Print publication date 29 Feb 2024
Received 13 Oct 2023 Revised 14 Nov 2023 Accepted 21 Nov 2023
DOI: https://doi.org/10.14191/Atmos.2024.34.1.023

연속 순위 확률 점수를 활용한 통합 앙상블 모델에 대한 기온 및 습도 후처리 모델 개발
복혜정 ; 김준수* ; 김연희 ; 조은주 ; 김승범
기상청 수치모델링센터 수치자료응용과

Enhancing Medium-Range Forecast Accuracy of Temperature and Relative Humidity over South Korea using Minimum Continuous Ranked Probability Score (CRPS) Statistical Correction Technique
Hyejeong Bok ; Junsu Kim* ; Yeon-Hee Kim ; Eunju Cho ; Seungbum Kim
Numerical Data Application Division, Numerical Modeling Center, Korea Meteorological Administration, Daejeon, Korea
Correspondence to : *Junsu Kim, Numerical Data Application Division, Numerical Modeling Center, Korea Meteorological Administration, 189, Cheongsa-ro, Seo-gu, Daejeon 35208, Korea. Phone: +82-42-481-7538, Fax: +82-42-476-0365 E-mail: junsukim@korea.kr


© 2024 Korean Meteorological Society

Abstract

The Korea Meteorological Administration has improved medium-range weather forecasts by implementing post-processing methods to minimize numerical model errors. In this study, we employ a statistical correction technique known as the minimum continuous ranked probability score (CRPS) to refine medium-range forecast guidance. This technique quantifies the similarity between the predicted values and the observed cumulative distribution function of the Unified Model Ensemble Prediction System for Global (UM EPSG). We evaluated the performance of the medium-range forecast guidance for surface air temperature and relative humidity, noting significant enhancements in seasonal bias and root mean squared error compared to observations. Notably, compared to the existing the medium-range forecast guidance, temperature forecasts exhibit 17.5% improvement in summer and 21.5% improvement in winter. Humidity forecasts also show 12% improvement in summer and 23% improvement in winter. The results indicate that utilizing the minimum CRPS for medium-range forecast guidance provide more reliable and improved performance than UM EPSG.


Keywords: Medium-range forecast guidance, Minimum CRPS, Post-processing

1. 서론

전 지구적인 기온 상승으로 인하여 기후변화가 가속화됨에 따라 폭염과 같은 극한 기상 현상이 빈번해질것으로 예상된다(Frich et al., 2002; Meehl and Tebaldi, 2004). 이러한 이유로 극한 기상 현상에 따른 피해를 최소화하기 위하여 농업, 전력 수요 예측 등 다양한 분야에서 5일 이상의 날씨 정보를 제공하는 중기 수치예보에 대한 수요가 점점 증가하고 있다(Freebairn and Zillman, 2002; Hong et al., 2013). 또한 극한 기상 현상에 관한 정보는 사회적‧경제적 비용과 직결되므로 조기에 탐지하여 정확히 예보하는 것이 중요하다(Yang et al., 2004; Lazo et al., 2009; Kim et al., 2012). 하지만, 대기의 비선형적인 특징과 카오스적 성질에 따라 수치 모델의 예측 기간이 길어질수록 모델의 오차는 커진다(Lorenz, 1969). 모델이 가지는 한계로 인해 단기 수치예보에 비하여 예측 기간이 긴 중기 수치예보의 정확도가 크게 낮다(Mailier, 2010).

수치 모델이 가지는 계통 오차를 최소화하고, 예보의 정확도를 향상시키기 위한 후처리(post-processing)기법에 대한 연구가 활발히 진행되어 왔다. 예를 들어, 기상 관측 자료와 예보 요소 간 관계식을 산출하여 수치예보 자료에 관계식을 적용하는 완전 예단법(Perfect Prognostic Method, PPM; Klein et al., 1967), 수치예보 모델의 계통 오차를 설명하고 특정 지점에 대한 예보 요소를 생산하는 모델 출력 통계법(Model Output Statistics, MOS; Dallavalle, 1996) 등 단일 모델에 가능한 다양한 후처리 기법들이 과거부터 개발되었다. 또한, 앙상블 모델의 오차를 제거하고 보다 신뢰할 수 있는 중기 예보자료를 얻기 위하여 Ensemble Model Output Statistics (EMOS; Gneiting et al., 2005; Buizza and Richardson, 2017; Schultz et al., 2021)와 Bayesian Model Averaging (BMA; Raftery et al., 2005)등의 후처리 기법을 적용한 앙상블 예보의 품질을 개선하는 시도들이 있어 왔다(Zhang et al., 2019).

최근 들어 통계 기법인 연속 순위 확률 점수(Continuous Ranked Probability Score, CRPS)를 적용하여 앙상블 모델의 계통 오차를 줄이려는 많은 선행 연구가 진행되었다(Ashkboos et al., 2022). CRPS는 일반적으로 확률 예측 모델의 성능을 평가하는 통계지표 중 하나로써, 모델 예측 값의 누적 분포와 관측의 누적 분포차이를 계산하고 그 차이의 크기에 따라 예측 성능을 평가하는 방법이다(Rasp and Lerch, 2018; Grönquist et al., 2021; Haiden et al., 2021; Ashkboos et al., 2022). 일반적으로 CRPS는 모델의 예측 성능을 평가하는 지표로 사용되지만, 회귀모델로 이루어진 EMOS 등의 앙상블 모델 후처리 기법에 적용하여 모델의 편향된 값을 보정하는 것에도 활용된다(Gneiting and Raftery, 2007; Jang and Kim, 2017; Hwang and Kim, 2018). Gneiting et al. (2005)는 EMOS에서 사용하는 회귀계수에 CRPS가 최소가 되는 지점을 이용하여 평균 제곱근 오차(Root Mean Square Error, RMSE)와 절대 평균 오차(Mean Absolute Error, MAE)를 각각 9%, 7% 향상시키는 결과를 보였다. 또한 Rasp and Lerch (2018)에서도 후처리 기법으로 신경망 모델을 적용한 후, 신경망 모델의 매개변수를 추정할 때 CRPS가 최소가 되는 지점을 이용하여 예측 성능을 개선함으로써 앙상블 모델의 최소 CRPS 적용 가능성을 제시하였다.

앞서 언급한바와 같이 앙상블 후처리 기법에는 대표적으로 EMOS 방법이 쓰여지고 있다. EMOS는 비동질성 회귀 모형으로 확률론적 앙상블 모델의 예측편향과 과소산포를 해결하는 것에 특화된 기술이다(Gneiting et al., 2005). 회귀 모델로 이루어진 EMOS의 분산 계수와 회귀 계수를 찾을 때 CRPS가 최소가 되는 지점을 찾아 최적화하는 방법들이 사용되어 왔다(Gneiting et al., 2005; Seong et al., 2015; Han et al., 2016; Hwang and Kim, 2018). 본 연구는 기상청현업 모델인 통합 앙상블 모델(United Model Ensemble Prediction System of Global, UM EPSG)을 기반으로 한 EMOS에 통계적 기법인 최소 CRPS를 적용하여 중기 수치예보 가이던스를 개선 하고자 한다. 현재 중기 가이던스는 예측 시간 12일까지 3시간 간격의 지점 예측자료를 생산하여 예보관에게 제공하고 있다. 하지만 수치 모델의 계통 오차를 최소화하는 후처리 기법이 적용되지 않고 있기 때문에, 정확한 자료를 요구하는 수요를 충족시키지 못하고 있다. 이에 기온과 습도에 대하여 더 정확한 중기 수치예보 가이던스를 개발하였다. 개선된 중기예보 가이던스의 평균적인 성능을 평가하기 위해 계절별 검증 기간을 가졌고, 더 나아가 여름철과 겨울철 극한 기상에 대해서도 평가해 보았다. 2장에서는 사용된 자료와 CRPS를 적용한 방법론을 기술하였다. 3장에서는 모델의 성능을 계절별로 분석하였고, 중기예보 가이던스의 중요한 성능지표인 여름철 최고 온도와 겨울철 최저 온도를 평가하여 극한 기상 현상인 폭염과 한파의 예측 가능성을 살펴보았다. 마지막으로 4장에서는 이 연구의 결과에 대해 논의하였다.


2. 자료 및 연구방법
2.1 자료

기온과 습도에 대한 정확도 높은 예보의 중요성은 여러 분야에서 대두되고 있다. 예를 들어 농업, 전력수요 예측, 산불 예측 등 다양한 분야에서 중요한 정보로 사용된다(Teisberg et al., 2005; Han et al., 2009; Kang et al., 2016). 이에 본 연구에서도 기온과 습도의 중기 수치예보 가이던스를 개선하고자 하였다. 연구에서는 기상청 현업 운영 중인 전지구 앙상블 예측시스템인 UM EPSG의 3시간 간격 기온, 최고 온도, 최저 온도, 습도 자료를 사용하였다. UM EPSG는 총 25개 앙상블 멤버로 구성되어 있으며, 수평해상도는 32 km, 연직 층수는 70층이다. 또한 12일(~288시간)까지 예측을 하며 0000, 1200 UTC 하루 총 2번의 3시간 간격 예측 자료를 생산한다. UM EPSG의 사용 기간은 2017년 12월부터 2023년 2월까지 총 5년 3개월이며, 이 중 2017년 12월부터 2021년 2월까지는 학습자료로, 2021년 3월부터 2023년 2월까지는 검증자료로 사용하였다.

학습과 검증을 위해서 사용된 관측자료로는 종관기상관측소(Automated Synoptic Observing system, ASOS) 91개 지점과 자동기상관측소(Automatic Weather Station, AWS) 156개 지점 자료를 통합하여 전국 247개 지점의 2017년 12월부터 2023년 2월까지 총 5년 3개월의 자료이다. 모델(UM EPSG)과 마찬가지로 사용된 관측자료의 전체 기간 중 앞의 3년 3개월은 학습자료로, 나머지 2년 자료는 검증 자료로 설정하였고 사용변수도 모델과 동일하다.

관측 지점은 기상청에서 검증지점으로 사용하고 있는 247개 지점 위치를 사용하였다. 특히 모델 예측 자료를 선형 보간법을 이용하여 내삽하였고, 계절별로 학습을 진행하였다. 이때, 모델 격자는 각 관측 지점 위경도의 가장 가까운 모델 격자를 사용하였다. 학습한 자료의 정확도 평가는 6시간부터 288시간까지 예측 시간별로 이루어졌다.

2.2 연속 순위 확률 점수(CRPS)

Gneiting et al. (2005)이 제시한 것처럼 비 동질성 회귀 모델인 EMOS를 예측치들이 갖는 분산의 선형결합으로 나타내면 식(1)과 같은 정규 분포로 표현할 수 있다.

Na+b1X1+b2X2++bmXm,c+dS2(1) 

본 연구에서는 식(1)의 회귀계수 추정방법으로 CRPS를 최소로 만드는 방법을 사용하였다. Gneiting et al.(2005)에 따르면 최소 CRPS 추정법을 이용한 계수 최적화는 최대 우도추정법에 비해 과대 분산 추정을 방지하는 장점이 있다. 이에 연구에서 사용된 CRPS 정의는 식(2)와 같다.

CRPSF,y=-F(x)-1xy2dx(2) 

식(2)F(x)와 관측 값 y가 주어질 때의 정의이며, F(x)는 누적 분포 함수로써 예측된 확률 분포에서 값 x 보다 작거나 같은 확률을 나타낸다. 여기서 1(xy)은 지시 함수로써, 특정 값이 집합에 속한다면 1을 의미하고 속하지 않는다면 0을 의미한다. F(x)와 관측 누적 분포 y 사이의 차이를 F(x) - 1로 표현하며, 이 차이가 0보다 작으면 모델이 관측 값보다 과소 모의한 것이며, 0보다 크면 모델이 관측 값에 비해 과대 모의한 것으로 해석한다. 또한, F(x)와 y의 차이를 제곱하여 예측의 오차를 양수로 만들어 계산하는데, 이는 값이 작을수록 모델 예측이 관측 값과 부합하여 예측 성능이 뛰어남을 의미한다.

본 연구에서는 CRPS 값이 작을수록 모델 예측 성능이 뛰어난 것으로 해석 할 수 있는 정의를 이용하여, Fig. 1과 같이 CRPS가 최소값이 될 때의 y 값을 모델의 값으로 추정하여 보정하였다. 특정 시각 관측과 예측 간의 차에 대하여 +6시간부터 +288시간까지 3시간 간격으로 기온과 습도에 대하여 적용하였다.


Fig. 1. 
Schematic diagram of CRPS. CRPS is calculated as the sum of the red area. ya represents the point where the sum is at their minimum values.


3. 결과

평균 제곱 오차(Mean Square Error, MSE)를 최소화하는 것은 정규 분포를 따르는 모델의 성능을 극대화하는데 필수 과제이다(Murphy, 2012). 이에 따라, 본 연구의 주요 목표 중 하나는 MSE를 개선하여 중기 수치예보 가이던스 성능을 향상시키는 것이다. 검증기간 동안 기온과 습도의 MSE는 Table 1Table 2에 각각 정리하였다. 기온과 습도는 평균 35% 이상 MSE 개선을 보인다. 2022년 0000 UTC 기준 평균 기온 MSE 개선율은 계절별로 봄 4 6.1%, 여름 32.6%, 가을 38.9%, 겨울 38.4%이며, 습도는 봄 45%, 여름 20%, 가을 36.9%, 겨울 38.5% 개선되었다. 상세한 분석 결과는 다음 절에서 기술하였다.

Table 1. 
Bias squared, variance, and mean square error of surface air temperature for both 0000 and 1200 UTC forecasts from UM EPSG and CRPS.
UM EPSG
Season Bias squared Variance MSE Bias squared Variance
MSE MSE
0000 1200 0000 1200 0000 1200 0000 1200 0000 1200
UTC UTC UTC UTC UTC UTC UTC UTC UTC UTC
2021 Spring 2.07 2.03 8.71 8.85 10.78 10.88 19.22 18.69 80.78 81.31
Summer 0.77 0.67 5.52 5.53 6.29 6.20 12.28 10.86 87.72 89.14
Autumn 0.76 0.76 7.70 7.52 8.46 8.28 9.03 9.19 90.98 90.82
Winter 0.97 0.99 10.32 10.15 11.29 11.14 8.61 8.92 91.40 91.08
2022 Spring 3.34 3.25 9.12 9.04 12.46 6.71 26.8 26.48 73.21 75.53
Summer 0.80 0.66 6.07 6.06 6.87 4.63 11.6 9.79 88.37 90.22
Autumn 0.78 0.76 9.09 9.09 9.87 6.03 7.9 7.74 92.08 92.27
Winter 1.49 1.56 12.08 12.07 13.57 8.36 11.0 11.44 89.05 88.57
CRPS
Season Bias squared Variance MSE Bias squared Variance
MSE MSE
0000 1200 0000 1200 0000 1200 0000 1200 0000 1200
UTC UTC UTC UTC UTC UTC UTC UTC UTC UTC
2021 Spring 0.07 0.07 6.83 7.01 6.89 7.08 0.95 1.00 99.05 99.00
Summer 0.10 0.11 3.74 3.75 3.84 3.85 2.58 2.73 97.43 97.27
Autumn 0.06 0.06 5.11 4.92 5.17 4.98 1.22 1.21 98.79 98.80
Winter 0.05 0.09 7.16 7.08 7.21 7.18 0.65 1.32 99.36 98.68
2022 Spring 0.12 0.11 6.59 6.57 6.71 6.67 1.80 1.60 98.20 98.40
Summer 0.01 0.02 4.62 4.61 4.63 4.64 0.32 0.49 99.68 99.51
Autumn 0.05 1.76 5.98 5.95 6.03 4.00 0.91 1.00 99.10 99.17
Winter 0.16 1.17 8.20 8.21 8.36 8.34 1.88 1.56 98.13 98.44

Table 2. 
Same as Table 1 but for relative humidity.
UM EPSG
Season Bias squared Variance MSE Bias squared Variance
MSE MSE
0000 1200 0000 1200 0000 1200 0000 1200 0000 1200
UTC UTC UTC UTC UTC UTC UTC UTC UTC UTC
2021 Spring 131.89 131.13 293.34 298.82 425.21 429.94 31.02 30.50 68.99 69.50
Summer 21.22 19.52 108.74 109.96 129.96 129.48 16.33 15.08 83.67 84.93
Autumn 22.28 21.93 175.66 177.43 197.93 199.35 11.25 11.00 88.75 89.00
Winter 82.80 87.49 259.09 262.68 341.88 350.15 24.22 24.99 75.78 75.02
2022 Spring 175.25 171.60 267.73 267.39 442.97 438.98 39.56 39.09 60.44 60.91
Summer 21.90 20.55 120.35 122.80 142.24 143.34 15.39 14.33 84.61 85.67
Autumn 65.63 66.84 214.60 216.38 280.22 283.21 23.42 23.60 76.58 76.40
Winter 70.99 70.40 267.57 263.67 338.54 334.06 20.97 21.07 79.04 78.93
CRPS
Season Bias squared Variance MSE Bias squared Variance
MSE MSE
0000 1200 0000 1200 0000 1200 0000 1200 0000 1200
UTC UTC UTC UTC UTC UTC UTC UTC UTC UTC
2021 Spring 0.93 0.87 269.22 274.39 270.14 275.25 0.34 0.32 99.66 99.69
Summer 0.26 0.35 96.51 97.13 96.77 97.48 0.27 0.36 99.73 99.65
Autumn 0.28 0.45 143.04 144.47 143.31 144.91 0.19 0.31 99.81 99.70
Winter 2.66 3.11 195.58 196.76 198.24 199.86 1.34 1.56 98.66 98.45
2022 Spring 3.06 2.69 240.43 239.19 243.48 241.87 1.26 1.11 98.75 98.89
Summer 0.44 0.47 113.32 115.31 113.76 115.78 0.39 0.41 99.61 99.60
Autumn 5.22 5.12 171.52 172.69 176.73 177.80 2.95 2.88 97.05 97.12
Winter 8.96 8.70 199.40 200.60 208.34 209.29 4.30 4.16 95.71 95.85

3.1 MSE 성분 분해 결과

평가 지표인 MSE성분 분해는 향후 모델 개선 방향의 지표로 사용되어 왔다(Geman et al., 1992; Kioutsioukis and Galmarini, 2014; Sinha et al., 2014; Mazrooei et al., 2015; Lyu et al., 2022). 이에 대하여 식(6)로 나타낼 수 있다.

MSE=1ninmi-oi2   di=mi-oi(3) 
=1nind-d-+d-2(4) 
=1nΣind-d-2+21nΣind-d-d-+d-2(5) 
=1nind-d-2+d-2(6) 

여기서 mioi는 예측 시간에서의 모델값과 관측값을 나타내며, di = mi - oi는 모델과 관측의 차이(편차), d-는 편차의 평균을 나타낸다. 식(5)21nΣind-d-d-항이 0에 수렴하므로 식(6)과 같이 MSE는 모델과 관측간의 편차 제곱항과 분산항으로 표현할 수 있다. 여기서 분산 성분은 모델이 관측의 변동성을 재현하는 정도를 정량화한 것이며, 편차 제곱항은 모델이 관측의 평균 특성을 재현하는 성능을 정량화한 것이다.

평가 지표인 MSE를 세분화하여 UM EPSG 모델과 후처리 기법을 적용한 중기 수치예보 가이던스(CRPS)에서 발생한 오차 원인을 진단하고, MSE 구성 요소의 개선 정도를 상세하게 분석하였다. 식(6)을 기반으로 MSE 개선은 크게 두 가지 측면에서 해석할 수 있다. 첫째, MSE 구성 성분의 절대적인 크기 변화를 바탕으로 이해 가능하다. Table 1은 검증기간 동안 UM EPSG와 CRPS의 0000UTC와 1200UTC 지상 기온편차 제곱항, 분산, MSE 등의 통계적 지표를 계절별로 나타낸 것이다. MSE에서 약 85% 이상을 차지하고 있는 분산항의 크기가 검증기간 동안 평균적으로 약 3.24oC 이상 감소하였으며, 나머지 15%를 차지하고 있는 편차 제곱항의 크기는 약 1.54oC 감소하였다. 즉, MSE를 구성하고 있는 성분 중 분산항의 개선이 크게 이루어졌음을 확인 할 수 있다. 이는 CRPS를 적용한 후처리 기법이 관측의 변동성 재현에 있어서 UM EPSG보다 더 우수함을 나타낸다.

둘째로 MSE를 구성하는 성분들의 비율 측면에서 이해할 수 있다. UM EPSG에서 발생하는 MSE 성분비율이 CRPS에서 어떻게 변하는지를 분석함으로써, 어떤 성분을 개선하는 것이 모델의 전체 성능 향상에 더 효과적인지 판단 가능하다. 이러한 분석은 모델의 오차 특성을 더 깊이 이해 할 수 있다. 예를 들어, MSE에서 차지하는 편차 제곱항의 비율이 감소함에 따라 CRPS에서 큰 개선이 일어난다면, 편차 제곱항에 더 많은 자원을 할당하여 모델의 예측 정확성을 향상시킬 수 있을 것이다. Table 1에서 모델 개선 전후에 대한 오차를 구성하는 성분 비율 변화를 확인해보았다. 개선 전 모델인 UM EPSG는 MSE 중 편차 제곱항의 비율이 10% 내외를 차지했으나, CRPS는 그 비율이 1% 내외로 크게 줄었다. 이는 CRPS 후처리 기법 적용 시 MSE를 구성하고 있는 성분 중 편차 제곱항의 개선이 크게 일어났음을 의미한다. 즉, MSE의 남아있는 오차 대부분은 모델과 관측 사이의 변동성이기 때문에 MSE를 감소시키기 위해 분산항의 오차를 줄일 수 있는 기술을 향후 개발할 필요가 있다.

특히 CRPS 후처리 기법을 적용하였을 때 편차 제곱항의 개선이 분산항 개선보다 더 우세함을 알 수 있다. 습도의 경우 기온보다 UM EPSG에서 MSE 중편차 제곱항이 차지하는 비율이 평균적으로 더 높게 나타났다. 예를 들어, 2021년 봄철 0000UTC기온의 MSE 중 편차 제곱항은 19.22%였지만(Table 1), 습도는 31.02%이다(Table 2). 또한 다른 계절에 비하여 봄철의 기온과 습도 모두 UM EPSG에서 큰 편차 제곱항이 나타나는데, CRPS 후처리 방법을 적용한 경우에는 편차 제곱항 값이 다른 계절과 유사한 수준으로 개선됨을 알 수 있다. 이는 CRPS가 오차의 성분 중 편차 제곱항 개선에 뛰어나 관측의 평균 특성을 재현하는 것에 있어서 특화됨을 나타낸다.

한편, 검증기간 중 2022년 봄철은 CRPS 후처리 적용 시 2021년도에 비하여 기온과 습도의 MSE가 더 크게 개선되었다. 예를 들어, 기온의 경우 2021년은 36% [= (10.78 - 6.89)/10.76]이고 2022년은 46%의 개선율을 보인다. 또한, 습도는 각각 36%, 45%의 개선율을 보인다. 이러한 차이는 2022년 봄철의 UM EPSG 편차 제곱항이 상대적으로 컸기 때문에 나타나는 경년 변동성으로 분석된다. 2022년 봄철의 전국 평균 기온이 평년 대비 +1.3oC로 최근 50년 중 가장 높았고, 이동성 고기압의 영향을 받는 기간인 1월부터 5월까지 평균 강수량이 평년에 비해 매우 작았다(KMA, 2022). 즉, 2022년 봄철은 학습자료에 사용된 관측자료 기간(2018~2020년 봄철)에 비하여 온도가 높고 건조하였기 때문에 2022년의 편차가 다른 년도에 비해서 컸음을 추정할 수 있다. 예를 들면, 2022년 UM EPSG의 봄철 편차 제곱항 크기가 다른 검증 년도인 2021년 보다 높았다. 2021년 0000UTC의 편차항의 비중은 19.22%이고, 2022년의 경우 26.8%이다(Table 1). 다만, 사용한 검증 기간이 2년 밖에 되지 않아 추후 검증기간 확대를 통하여 추가 분석이 필요할 것으로 사료된다.

3.2 계절별 예측 성능 평가

본 장에서는 계절별 평균적인 예측 성능을 평가하고자 한다. Figure 2는 전체 검증기간 2년 동안 계절별 온도와 습도에 대한 편차와 RMSE의 box plot을 보여준다. 계절별로 보았을 때, 여름철의 RMSE 값이 낮은 것을 확인 할 수 있다. 2022년 0000UTC UM EPSG의 계절별 기온 RMSE는 봄 3.5oC, 여름 2.2oC, 가을 3.1oC, 겨울 3.7oC로 여름철 RMSE 크기가 다른 계절에 비해 작다. 본 연구에서는RMSE를 기반으로한 여름철 기온의 계절 예측 신뢰도가 다른 계절에 비해 높은 것을 보인 Hyun et al. (2020)과 비슷한 결과임을 확인하였다.


Fig. 2. 
Box plot of bias (left) and RMSE (right) for surface air temperature (top) and relative humidity (bottom) for UM EPSG (black) and CRPS (red) from both 0000 UTC initial forecasts.

UM EPSG 기온은 관측에 비해 대부분의 계절에서 과소 모의하는 경향을 보인다(Fig. 2a). CRPS 후처리 기법을 적용하였을 때 과소 모의하던 평균값이 개선되고, 평균값의 범위 역시 모든 계절에서 감소한 것을 확인하였다. 습도의 경우 관측에 비해 과대 모의하던 경향이 개선되고, 기온과 마찬가지로 값의 분포도 모든 계절에서 줄어들었다(Fig. 2c). 온도의 계절별 RMSE 평균 개선율이 2 3.5%, 17.5%, 20%, 21.5%로 크게 개선되었으며, 습도 또한 23%, 12%, 17.5%, 23% 개선되었다. 2년 중 같은 계절 동안 RMSE의 변동폭은 비슷한 양상을 보인다. 예를 들어, 기온의 경우 2021과 2022년 봄은 각각 3.3oC (UM EPSG)와 2.6oC(CRPS)에서 3.5oC와 2.6oC로 그 크기 변화에 차이가 없었으며, 습도의 경우도 20.5%와 16.4%에서 21.0%와 15.6%로 변하였다.

CRPS를 활용한 기온 보정은 관측 지점별로 이루어졌으며, 이는 기온 보정이 지역적 특성에 따라 다를 수 있다는 점을 감안하였다. 예를 들어, 산악 지형이나 해안과 내륙 간의 비열 차이와 같은 지역적 변동요소는 보정 효과에 영향을 미칠 수 있기 때문에, 가정을 검증하기 위해 다양한 지역에서 기온 보정을 시도하였다(Fig. 3). 실험 결과 대부분의 검증 지역에서 기온 보정의 정도에 지역적 차이가 있음을 관찰하였다. 예를 들어, 제주도와 강원도 해안 및 소백산맥 등에서 계절에 상관없이 높은 개선율을 보여준다. 일반적으로 수치예보모델은 실제 지형고도보다 낮게 표현하기 때문에, 고도가 높은 지역에서 더 큰 오차를 보이는 경향이 있다(Yun et al., 2021). 이러한 오차 개선은 주로 경험적인 방법인 PPM 등의 고도보정을 통해 이루어진다. 본 연구에서도 CRPS를 적용하여 이에 대한 개선을 확인할 수 있었다. 반대로, 상대적으로 지형이 낮은 우리나라 서부 지역은 개선율이 낮다.


Fig. 3. 
Improvement rate of RMSE for surface air temperature (top) and relative humidity (bottom) from 0000 UTC initial forecasts in 2022. The rate is computed by the following equation: (1 – RMSECRPS/RMSEUM EPSG).

검증 지점별 기온 RMSE 개선율을 분석한 결과, 모든 계절에서 개선이 나타났다(Fig. 3). 계절별 편차가 가장 컸던 봄에서 RMSE 개선율의 향상이 크게 일어났으며, 여름철 몇 지점들을 제외하고는 대부분의 지점에서 RMSE가 10% 이상 감소하였다. 여기서 흥미로운 점은 여름철에 대한 RMSE 개선율이 다른 계절에 비해 상대적으로 낮고 봄철에 대한 개선율은 높다는 것이다.

Improvement rate of RMSE=1-RMSECRPSRMSEUM EPSG(7) 

식(7)과 같이 CRPS RMSE와 UM EPSG RMSE 크기 비율이 작을 때 개선율은 증가한다. 하지만 여름 개선율은 봄에 비해 2배 이상 낮다. 식(7)에서 설명하는 CRPS와 UM EPSG 사이의 RMSE 비율이 크기 때문에, 개선율이 크지 않은 것으로 보인다. RMSE 지표로 평가하였을 때, 여름철 UM EPSG 모델은 상대적으로 정확하게 예측하고 있으며, 이는 후처리 기법인 CRPS를 통해서 개선의 여지가 낮음을 의미한다. 따라서 앞으로의 연구에서는 UM EPSG의 기온 예측이 상대적으로 어려운 봄철과 겨울철에 대한 보정 모델 개발에 더 많은 노력이 필요할 것으로 보이며, 지역적 특성을 고려한 보정 모델 설계와 적용을 통해 보다 정확한 결과를 얻을 수 있을 것으로 판단된다.

기온과 습도에 대한 지표 간의 정량적 평가를 위해 테일러 도표(Taylor diagram) 분석을 수행하였다(Taylor, 2001). 테일러 도표는 모델 데이터가 관측과 얼마나 근접하게 일치하는가에 대하여 표준 편차와 중앙 RMSE (Centered Root Mean Square Error) 그리고 관측과의 상관 관계에 대하여 나타내는 평가 방법 중 하나이다. 테일러 도표에서 상관관계가 1이고, 중앙 RMSE가 0 일 때 모델이 관측과 일치함을 의미한다(Fig. 4). 즉, 모델 예측 데이터가 관측에 유사하고 상관 관계가 높을 수록 모델의 모의성능이 우수하다.


Fig. 4. 
Taylor diagram of (left) surface air temperature and (right) relative humidity by season. Symbols represent the forecasts at 1, 3, 5, 7, and 10 days. The red, blue, green, and cyan colors indicate spring, summer, autumn, and winter, respectively.

Figure 4는 UM EPSG와 CRPS의 기온과 습도에 대한 계절별 1, 3, 5, 7, 10일 전 예측 성능을 보여준다. 기온에 대한 UM EPSG의 10일 동안 예측은 관측과의 상관계수가 0.3~0.7 정도였으나 CRPS는 0.6~0.9로 높은 상관계수를 보였다. 또한, 표준 편차도 UM EPSG에 비하여 1에 가까워지며 관측값과 유사하게 모의하였다. UM EPSG에 비해 CRPS 적용 시 관측과의 상관계수가 1에 가까워지며, 표준 편차 비율 또한 관측에 가까워진다. 하지만 중기 수치예보 가이던스에서 중요한 5일 이후의 예측은 여전히 기온은 0.6 이하, 습도는 0.4 이하의 상대적으로 낮은 상관계수를 보이므로 중기 수치예보 가이던스에 대한 추가적인 개선이 필요한 것으로 보인다.

테일러 도표에서 확인할 수 있는 흥미로운 점은 여름과 겨울철의 성능에 대한 해석이 평가 지표별로 다르다는 점이다. 여름철의 예측 성능은 RMSE를 기반으로 보면 좋으며, 겨울철은 상대적으로 낮다(Figs. 2b, d). 하지만, 테일러 도표에서 확인할 수 있는 상관계수와 중앙 RMSE는 여름철의 성능이 겨울철에 비해서 낮게 나타난다. 예를 들어 기온의 경우 여름철 상관계수는 0.6~0.8이며, 겨울철은 0.8~0.9로 나타난다. 앞서 언급했듯이 중앙 RMSE는 관측과 모델 사이 편차를 제거하고 개선의 유사정도를 보는 지표이다. 그래서 RMSE와 달리 중앙 RMSE는 여름철이 겨울철에 비해 그 거리가 길게 나타나며, 여름철의 예측성능이 떨어지는 것을 확인할 수 있다.

3.3 극한 기온 예측 성능 평가

본 장에서는 CRPS 후처리 기법을 적용한 중기 수치예보 가이던스의 여름철 일최고 기온 및 겨울철 일 최저 기온, 즉 여름철 폭염과 겨울철 한파에 관한 예측 성능 평가에 대한 결과를 분석하였다.

앞 절과 마찬가지로 MSE를 편차 제곱항과 분산항으로 분해하여 여름철 일 최고 기온과 겨울철 최저기온에 적용하였다(Table 3). 평균 기온과 마찬가지로, UM EPSG에 비하여 CRPS를 적용하였을 경우 평균적으로 MSE가 37.7% 감소하여 절대적인 크기를 차지하는 분산항의 크기가 줄어들고, MSE 중 편차 제곱항의 비율이 약 31% 줄어들었다. 다만, 2022년 겨울철 최저 기온의 경우 CRPS 후처리 기법을 적용하였을 때 분산의 크기가 줄어듦에 따라 MSE 크기는 감소하였지만, 편차 제곱항이 UM EPSG보다 증가하는 특이한 경향을 보인다. MSE 중 편차 제곱항의 비율은 몇 1.38%에서 7.04%로 증가하였지만, 값은 0.22oC에서 0.7oC로 분산항의 크기에 비해 그 값이 크지 않아 무시할 수 있을 것으로 사료된다.

Table 3. 
Same as Table 1, but for daily maximum temperature in summer and minimum temperature in winter.
UM EPSG
Season Bias squared Variance MSE Bias squared Variance
MSE MSE
2021 Summer 2.61 7.34 09.95 26.23 73.77
Winter 1.33 13.00 14.33 9.26 90.75
2022 Summer 0.73 8.40 9.13 8.01 91.99
Winter 0.22 15.55 15.76 1.38 98.62
CRPS
Season Bias squared Variance MSE Bias squared Variance
MSE MSE
2021 Summer 0.03 4.93 4.96 0.54 99.47
Winter 0.06 9.44 9.50 0.60 99.40
2022 Summer 0.03 6.31 6.34 0.44 99.56
Winter 0.70 9.30 10.00 7.04 92.96

Figure 5는 예측 시간에 대하여 2021년과 2022년의 여름철 최고 기온과 겨울철 최저 기온의 편차와 RMSE를 보여준다. 2021년과 2022년 모두 CRPS 후처리를 적용하였을 때 여름철 최고 기온의 편차는 모든 예측시간에 대하여 거의 0에 수렴하였고, RMSE 또한 모든 예측 시간에 대하여 감소하여 개선되었다. 다만, Table 3의 편차 제곱항과 마찬가지로 2022년 겨울철 최저 기온은 CRPS 적용시 UM EPSG에 비하여 편차가 증가하는 것을 확인할 수 있는데, 이는 2021년과 달리 2022년 겨울에만 나타나는 특징으로 보인다. 즉, 건조하고 기온이 높았던 2022년 겨울이 다른 평년에 비해 특징이 달라서 학습을 통한 그 편차 제거에 어려움이 있었다(KMA, 2022). 향후 10년 이상 긴 기간의 자료를 확보하여 학습을 진행한다면 그 편차를 해소할 수 있을 것으로 추정된다.


Fig. 5. 
Time series of (top) bias and (bottom) RMSE from (left) daily maximum air temperature in summer and (right) minimum air temperature in winter. Solid and Dashed lines denote 2021 and 2022, respectively.

현재 기상청에서 사용하는 폭염주의보 정의는 일 최고기온 33도 이상이 2일 이상 지속될 때이다. 또한, 한파주의보는 10월과 4월 중 아침 최저기온이 전날보다 10도 이상 하강하여 3도 이하이고 평년값 보다 3도가 낮을 것으로 예상될 때 혹은 아침 최저기온이 -12도 이하로 2일 이상 지속될 것으로 예상될 때로 정의한다. 폭염 사례에 대해서는 2022년의 여름철 중 폭염이 있던 사례 중 지속기간이 3일 이상이고, 가장 많은 지역에서 폭염 주의보가 발생한 7월 2일로 선정하였고, 한파의 경우 지속기간이 2일 이상이고 한파주의보가 가장 많은 지역에서 발생한 12월 20일로 선정하였다. 7월 2일 한반도는 강한 고기압의 영향과 남부지방의 강한 지면가열 영향으로 폭염이 지속되었고, 12월 20일은 북쪽 찬 공기의 남하로 인하여 한파가 지속되었다.

폭염 지속 기간이었던 7월 2일과 한파가 발생한 12월 20일의 중기 수치예보 예측 성능에 대하여 테일러 도표를 통해 평가하였다. Figure 6의 각 지점은 폭염일과 한파일을 기준으로 1일부터 10일 전의 예측일을 의미한다. 폭염 기간동안 UM EPSG는 관측과의 상관계수가 0.03~0.3이었으나, CRPS를 적용하였을 때 크게 개선되어 0.7~0.85를 보였다. 한파의 경우도 0.65~0.75의 상관계수가 0.9~0.95로 향상됨을 확인할 수 있었다. 특히, UM EPSG의 5일 이상 예보의 경우 폭염 기간에 관측과의 상관계수가 0.1이하로 다소 낮은 예측 성능을 보여주었는데, 후처리 결과 적용 후 상관관계 및 RMSE 모두 개선되어 CRPS 적용시 폭염과 한파와 같은 극한 기상 사례에 대해서도 개선된 중기 수치예보 가이던스의 성능을 보였다.


Fig. 6. 
Taylor diagram of (left) daily maximum air temperature during heat wave period and (right) minimum air temperature during cold wave period. Symbols represent every 1 day forecast. The blue and red colors indicate UM EPSG and CRPS, respectively.


4. 요약 및 결론

본 연구에서는 앙상블 모델을 활용할 때 유용한 통계 기법인 EMOS의 계수 최적화를 위하여 최소 CRPS가 적용된 기온과 습도의 후처리 기법을 개발하여 중기 수치예보 가이던스 예측 성능을 향상시키고자 하였다. 총 3년 3개월의 자료를 계절별로 학습하고, 2년의 검증 기간을 바탕으로 계절별 예측 성능을 평가하였다. 또한, 극한 기상 현상 예측에 대한 중기 수치예보 가이던스 성능을 확인하기 위하여 여름철 최고 온도와 겨울철 최저 온도를 분석하였다.

CRPS는 모델 예측값과 관측값의 누적분포 함수 유사도를 최소로 만드는 기법으로 그 정확도를 MSE로 평가해 보았다. MSE는 편차 제곱항과 분산항으로 분해할 수 있다. CRPS 적용시 기온과 습도 모두 MSE를 구성하는 성분 중 분산항의 절대적인 크기가 감소하였고, MSE를 구성하는 편차 제곱항의 비율이 크게 개선됨을 보였다. 또한 RMSE도 계절별로 온도는 Fig. 6. 23.5%, 17.5%, 20%, 21.5%와 습도는 2 3%, 12%, 17.5%, 23% 개선되었다. 즉, CRPS 적용 시 UM EPSG가 가지고 있던 관측과의 변동성을 보정하고, 관측의 평균 특성을 재현하는 것을 알 수 있었다.

또한 여름철 최고 온도와 겨울철 최저 온도의 예측성능에 대해서도 MSE는 각각 4 0%, 35% 개선되었다. 마찬가지로 MSE 성분을 분해하여 오차의 성분을 분석하였을 때, 2021년 여름철 최고 온도와 겨울철 최저 온도 모두 편차 제곱항과 분산항이 개선되는 것을 보였다. 하지만 2022년 겨울철 최저 온도의 MSE는 개선되었지만 편차 제곱항은 오히려 커짐으로써 모든 사례에서 편차 제곱항이 개선되는 것은 아님을 알 수 있었다.

최근 활발히 진행되는 기계학습 연구에 의하면, MSE가 작은 모델을 만들기 위하여 편차와 분산의 크기를 줄이려고 노력하고 있다. 식(6)과 같이 편차와 분산항은 한 항이 커지면 다른 항이 작아지는 트레이드오프(trade-off) 관계를 가지고 있어 두 항 모두 최소 지점을 찾는 것이 가장 이상적이다(Neal et al., 2018). 하지만 본 연구에서 사용한 최소 CRPS는 편차를 줄이는 것에 특화되어 있으므로, 관측과 모델의 변동성을 의미하는 분산항 개선에는 한계가 있었다. 향후 후처리 기법을 적용한 중기 수치예보 가이던스 연구는 편차와 분산항이 최소가 되는 지점을 찾는 민감도 실험 등을 통하여 편차와 분산항 모두 최소가 되는 지점을 찾는 방법을 적용하는 추가적인 연구가 필요할 것이다.


Acknowledgments

본 논문을 심사해주신 두 분 심사위원님들께 깊은 감사드립니다. 이 연구는 기상청 수치모델링센터 『 수치예보 및 자료응용 기술개발(KMA2018-00721)』 과제의 일환으로 수행되었습니다.


REFERENCES
1. Ashkboos, S., L. Huang, N. Dryden, T. Ben-Nun, P. Dueben, L. Gianinazzi, L. Kummer, and T. Hoefler, 2022: ENS-10: A Dataset For Post-Processing Ensemble Weather Forecasts. Adv. Neural Inf. Processing Syst., 35, 21974-21987.
2. Buizza, R., and D. Richardson, 2017: years of ensemble forecasting at ECMWF. ECMWF Newsletter, 153, 20-31.
3. Dallavalle, J. P., 1996: A perspective on the use of model output statistics in objective weather forecasting. Conference on Weather Analysis and Forecasting, Amer. Meteor. Society, 15, 479-482.
4. Freebairn, J. W., and J. W. Zillman, 2002: Economic benefits of meteorological services. Meteor. Appl., 9, 33- 44.
5. Frich, P., L. V. Alexander, P. Della-Marta, B. Gleason, M. Haylock, A. K. Tank, and T. Peterson, 2002: Observed coherent changes in climatic extremes during the second half of the twentieth century. Climate Res., 19, 193-212.
6. Geman, S., E. Bienenstock, and R. Doursat, 1992: Neural networks and the bias/variance dilemma. Neural Comput., 4, 1-58.
7. Gneiting, T., A. E. Raftery, A. H. Westveld, and T. Goldman, 2005: Calibrated probabilistic forecasting using ensemble model output statistics and minimum CRPS estimation. Mon. Wea. Rev., 133, 1098-1118.
8. Gneiting, T., A. E. Raftery, A. H. Westveld, and T. Goldman, 2007: Strictly proper scoring rules, prediction, and estimation. J. Amer. Stat. Assoc., 102, 359-378.
9. Grönquist, P., C. Yao, T. Ben-Nun, N. Dryden, P. Dueben, S. Li, and T. Hoefler, 2021: Deep learning for postprocessing ensemble weather forecasts. Philos. Trans. Roy. Soc. A, 379, 20200092.
10. Haiden, T., M. Janousek, F. Vitart, Z. Ben-Bouallegue, L. Ferranti, and F. Prates, 2021: Evaluation of ECMWF forecasts, including the 2021 upgrade, ECMWF technical memoranda 884. European Centre for Medium Range Weather Forecasts, 56 pp.
11. Han, C.-H., J.-W. Lee, and K.-K. Lee, 2009: Analyzing information value of temperature forecast for the electricity demand forecasts. Korean Manage. Sci. Rev., 26, 77-91.
12. Han, K., C. Kim, and C. Kim, 2016: Probabilistic forecast of temperature in Pyeongchang using homogeneous and nonhomogeneous regression models. J. Climate Res., 11, 87-103.
13. Hong, H., W. Kim, J. Kim, and B.-J. Kim, 2013: Analysis of demand characteristics for long-term forecasts. J. Climate Res., 8, 117-126.
14. Hwang, Y., and C. Kim, 2018: A combination and calibration of multi-model ensemble of PyeongChang area using ensemble model output statistics. Atmosphere, 28, 247-261.
15. Hyun, Y.-K., J. Park, J. Lee, S. Lim, S.-I. Heo, H. Ham, S.-M. Lee, H.-S. Ji, and Y. Kim, 2020: Reliability assessment of temperature and precipitation seasonal probability in current climate prediction systems. Atmo sphere, 30, 141-154.
16. Jang, D. H., and C. Kim, 2017: Probabilistic forecast of temperature using station-specific nonhomogeneous regression model. J. Climate Res., 12, 277-287.
17. Kang, S.-C., M.-S. Won, and S.-H. Yoon, 2016: Large fire forecasting depending on the changing wind speed and effective humidity in Korean red pine forests through a case study. J. Korean Assoc. Geographic Inf. Stud., 19, 146-156.
18. Kim, K., J. Shin, and S.-I. Lee, 2012: An overview of methodologies for socio-economic value evaluation of long-range weather forecasts in energy industry. J. Climate Res., 7, 98-118.
19. Kioutsioukis, I., and S. Galmarini, 2014: De praeceptis ferendis: good practice in multi-model ensembles. Atmos. Chem. Phys., 14, 11791-11815.
20. Klein, W. H., F. Lewis, and G. P. Casely, 1967: Automated nationwide forecasts of maximum and minimum temperature. J. Appl. Meteor. Climatol., 6, 216-228.
21. KMA, 2022: Weather yearbook, Korea Meteorological Administration, 416 pp (in Korean).
22. Lazo, J. K., R. E. Morss, and J. L. Demuth, 2009: 300 billion served: Sources, perceptions, uses, and values of weather forecasts. Bull. Amer. Meteor. Soc., 90, 785- 798.
23. Lorenz, E. N., 1969: Atmospheric predictability as revealed by naturally occurring analogues. J. Atmos. Sci., 26, 636-646.
24. Lyu, Y., X. Zhi, H. Wu, H. Zhou, D. Kong, S. Zhu, Y. Zhang, and C. Hao, 2022: Analyses on the multimodel wind forecasts and error decompositions over North China. Atmosphere, 13, 1652.
25. Mailier, P. J., 2010: Can we trust long-range weather forecasts? Manage. Wea. Climate Risk in the Energy Industry, 227-239.
26. Mazrooei, A., T. Sinha, A. Sankarasubramanian, S. Kumar, and C. D. Peters-Lidard, 2015: Decomposition of sources of errors in seasonal streamflow forecasting over the US Sunbelt. J. Geophys. Res. Atmos., 120, 11809-11825.
27. Meehl, G. A., and C. Tebaldi, 2004: More intense, more frequent, and longer lasting heat waves in the 21st century. Science, 305, 994-997.
28. Murphy, K. P., 2012: Machine learning: a probabilistic perspective. MIT press, 1067 pp.
29. Neal, B., S. Mittal, A. Baratin, V. Tantia, M. Scicluna, S. Lacoste-Julien, and I. Mitliagkas, 2018: A modern take on the bias-variance tradeoff in neural networks. arXiv preprint arXiv:1810.08591.
30. Raftery, A. E., T. Gneiting, F. Balabdaoui, and M. Polakowski, 2005: Using Bayesian model averaging to calibrate forecast ensembles. Mon. Wea. Rev., 133, 1155-1174.
31. Rasp, S., and S. Lerch, 2018: Neural networks for postprocessing ensemble weather forecasts. Mon. Wea. Rev., 146, 3885-3900.
32. Schultz, M. G., C. Betancourt, B. Gong, F. Kleinert, M. Langguth, L. H. Leufen, A. Mozaffari, and S. Stadtler, 2021: Can deep learning beat numerical weather prediction? Philos. Trans. Roy. Soc. A, 379, 20200097.
33. Seong, M.-G., C. Kim, and M.-S. Suh, 2015: Inter-comparison of prediction skills of multiple linear regression methods using monthly temperature simulated by multi-regional climate models. Atmosphere, 25, 669- 683.
34. Sinha, T., A. Sankarasubramanian, and A. Mazrooei, 2014: Decomposition of sources of errors in monthly to seasonal streamflow forecasts in a rainfall-runoff regime. J. Hydrometeor., 15, 2470-2483.
35. Taylor, K. E., 2001: Summarizing multiple aspects of model performance in a single diagram. J. Geophys. Res. Atmos., 106, 7183-7192.
36. Teisberg, T. J., R. F. Weiher, and A. Khotanzad, 2005: The economic value of temperature forecasts in electricity generation. Bull. Amer. Meteor. Soc., 86, 1765- 1772.
37. Yang, Y., I. Kang, J. Yoo, and K. An, 2004: Analysis of economical & social impact of meteorological information. J. Korean Meteor. Soc., 40, 159-175.
38. Yun, J., Y.-H. Kim, and H.-W. Choi, 2021: Analyses of the meteorological characteristics over South Korea for wind power applications using KMAPP. Atmosphere, 30, 1-15.
39. Zhang, H., M. Chen, and S. Fan, 2019: Study on the construction of initial condition perturbations for the regional ensemble prediction system of North China. Atmosphere, 10, 87.