The Korean Meteorological Society
[ Article ]
Atmosphere - Vol. 33, No. 4, pp.355-365
ISSN: 1598-3560 (Print) 2288-3266 (Online)
Print publication date 31 Aug 2023
Received 04 Apr 2023 Revised 09 Jun 2023 Accepted 13 Jun 2023
DOI: https://doi.org/10.14191/Atmos.2023.33.4.355

DePreSys4의 동아시아 근미래 기후예측 성능 평가

최정1), * ; 임슬희2) ; 손석우1) ; 부경온3) ; 이조한3)
1)서울대학교 지구환경과학부
2)APEC 기후센터
3)국립기상과학원 기후연구부
Assessment of Near-Term Climate Prediction of DePreSys4 in East Asia
Jung Choi1), * ; Seul-Hee Im2) ; Seok-Woo Son1) ; Kyung-On Boo3) ; Johan Lee3)
1)School of Earth and Environmental Sciences, Seoul National University, Seoul, Korea
2)APEC Climate Center, Busan, Korea
3)Climate Research Department, National Institute of Meteorological Sciences, Jeju, Korea

Correspondence to: *Jung Choi, School of Earth and Environmental Sciences, Seoul National University, 1 Gwanak-ro, Gwanak-gu, Seoul 08826, Korea. Fax: +82-2-883-4972 E-mail: jungchoi@snu.ac.kr

Abstract

To proactively manage climate risk, near-term climate predictions on annual to decadal time scales are of great interest to various communities. This study evaluates the near-term climate prediction skills in East Asia with DePreSys4 retrospective decadal predictions. The model is initialized every November from 1960 to 2020, consisting of 61 initializations with ten ensemble members. The prediction skill is quantitatively evaluated using the deterministic and probabilistic metrics, particularly for annual mean near-surface temperature, land precipitation, and sea level pressure. The near-term climate predictions for May~September and November~March averages over the five years are also assessed. DePreSys4 successfully predicts the annual mean and the five-year mean near-surface temperatures in East Asia, as the long-term trend sourced from external radiative forcing is well reproduced. However, land precipitation predictions are statistically significant only in very limited sporadic regions. The sea level pressure predictions also show statistically significant skills only over the ocean due to the failure of predicting a long-term trend over the land.

Keywords:

DePreSys4, Near-Term Climate Prediction, Decadal Hindcasts, Deterministic Prediction, Probabilistic Prediction

1. 서 론

인류활동에 의한 지구온난화는 과거와는 다른 양상의 기상재해를 빈번하게 발생시킴으로써 ‘기후변화’를 넘어 ‘기후위기, 기상재난’으로 불릴 만큼 심각한 사회경제적 피해를 초래하고 있다. 이에 기상재해를 대비하고, 신속하고 효율적인 대처를 통해 인명과 재산 피해를 최소화하고자 보다 정확한 미래 기후예측에 대한 중요성이 커지고 있다. 이와 관련하여, 전세계 주요 현업기관 및 기후예측센터들은 지표기온, 강수 등과 같은 주요 대기변수들에 대해 1개월, 3개월, 6개월에 대한 계절기후예측 정보를 제공하고 있으며, 기후변화에 관한 정부간 협의체(Intergovernmental Panel on Climate Change, IPCC)는 2100년까지의 장기기후 전망에 대한 보고서를 약 7년마다 발간하고 있다.

반면 계절기후예측과 장기기후전망 사이 시간 규모의 기후상태를 예측하는 근미래 기후예측(near-term climate prediction)은 여전히 논의단계이다. 근미래 기후예측에 대한 연구는 계절예측모델과 기후모델 사이의 이음새 없는 예측 시스템(seamless prediction system)의 구축을 위해 시작되었지만, 최근 들어 적극적인 기후정책 결정과 기후재해 대비를 위한 사회적 요구의 증가로 인해 보다 활발히 연구되고 있다. 이에 2010년부터 영국 Met Office를 중심으로 주요 기후모델링 센터들이 자체 모델을 이용하여 근미래 기후예측 결과를 비공식적으로 교류하기 시작했다(Smith et al. 2013). 이후 세계기상기구(World Meteorological Organization, WMO)는 1~10년 기후예측을 위한 선도 센터(LeadCentre for Annual to Decadal Climate Predictions, LC-ADCP)를 2017년 설립하였다(Hermanson et al. 2022). LC-ADCP에서는 2020년 5월부터 연간 및 향후 5년까지의 기후예측 정보를 매년 제공하고 있으며, 현재 11개의 기후모델이 참여하고 있다. 또한 유럽연합으로부터 지원을 받는 Copernicus Climate Change Service (C3S)는 독일, 스페인, 영국, 이탈리아 등 4개의 기후모델 예측결과를 바탕으로 4개의 산업분야(농업, 에너지, 기반시설, 보험)에서 필요로 하는 근미래 기후예측정보를 2020년부터 제공하고 있다(Dunstone et al., 2022).

수십년 이후의 기후상태는 이산화탄소 및 에어로졸 농도와 같은 외부강제력에 주된 영향을 받기 때문에 여러가지 시나리오를 바탕으로 미래 기후의 불확실성을 진단한다. 반면 근미래의 기후상태는 외부강제력뿐만 아니라 기후시스템 내에 존재하는 다양한 자연 변동성의 상태에 따라 달라진다. 따라서 해양 및 대기의 내부변동성 상태를 기후예측모델의 초기조건으로 고려함으로써 근미래 기후예측 성능을 향상시킬 수 있다(Meehl et al., 2021). 이와 같은 초기화 예측(initialized prediction)은 Coupled Model Intercomparison Project (CMIP) 5단계(CMIP5)에서 공식화되었으며(실험명: decadal hindcast), CMIP 6단계(CMIP6)의 하위 프로젝트 Decadal Climate Prediction Project (DCPP)에서는 보다 체계적인 초기화 과거예측 및 미래 전망 결과를 제공하고 있다.

현재 우리나라 기상청에서는 평균기온과 강수량에 대해 1개월, 3개월 기후예측 결과와 계절별 기후전망을 발표하고 있으며, APEC 기후센터(APEC Climate Center, APCC)에서는 동아시아와 전지구에 대한 3개월, 6개월 기후예측 결과를 제공하고 있다. 이보다 더 긴 시간규모의 근미래 기후예측시스템을 도입하기 앞서, 예측에 대한 신뢰도를 평가하기 위해 과거예측(hindcast) 자료를 이용하여 기후예측모델의 성능을 검증하는 과정이 선행되어야 한다. 이에 본 연구에서는 기상청 현업 기후예측시스템인 GloSea6와 동일한 모델이자 영국 Met Office의 근미래 기후예측시스템인 DePreSys4의 동아시아 예측성능을 검증 및 평가하였다.


2. 자료 및 방법론

2.1 DePreSys4

영국 Met Office Hadley Centre에서는 근미래 기후예측을 위해 초기화된 10년 예측시스템(Decadal Prediction System, DePreSys)를 운영하고 있다. 최초의 DePreSys는 Hadley Centre Coupled Model version 3 (HadCM3) 기반 예측시스템이었으며(Gordon et al., 2000), CMIP5 decadal hindcast에 참여하였다(Smith et al., 2007). DePreSys2 (Knight et al., 2014)부터 Hadley Centre Global Environmental Model version 3 (HadGEM3; Hewitt et al., 2011)이 사용되었으며, DePreSys3 (Dunstone et al., 2016)에서는 새로운 Global Coupler (GC) version 2 (Williams et al., 2015)가 적용되었다. 가장 최신의 시스템인 DePreSys4는 GC3.1 (Williams et al., 2017)이 적용되었으며, HadGEM3-GC31-MM 이름으로 CMIP6 DCPP에 참여 중이다.

DePreSys4 대기 모델의 수평 해상도는 약 60 km, 연직 격자는 총 85층이며, 해양 모델의 해상도는 수평 0.25도에 연직 75층이다. 이는 국립기상과학원의 현업 기후예측시스템 Global Seasonal forecast system version 6 (GloSea6)와 동일한 대기, 해양 모델이나, GloSea6의 경우 일부 모수화 방안들이 개선된 GC3.2를 사용하고 있다(Kim et al., 2021; Hyun et al., 2022). 초기화과정은 해양, 대기, 해빙의 관측 값에 대해 full-field 자료동화 방법이 수행되었다. 해양의 온도와 염분은 전지구 공분산에 의해 구해진 월별 분석장(Smith and Murphy 2007)으로 10일 시간규모로 완화(relaxation) 되며 넛징(nudging)되었고, 대기의 초기장은 European Centre for Medium-Range Weather Forecasts Reanalysis-(ERA)40/Interim (Dee et al., 2011) 재분석자료의 온도와 바람이 6시간 시간규모로 넛징되었다. 해빙 초기화에는 월별 HadISST (Rayner et al., 2003)가 사용되었고, 1일 시간규모로 넛징되었다. 외부강제력 조건은 CMIP6 historical experiment의 조건을 따랐으며, 2015년부터는 Shared Socioeconomic Pathways (SSP)2-4.5 시나리오의 강제력이 처방되었다.

2.2 자료

본 연구에서 사용된 자료는 DePreSys4의 과거예측자료이다. 1960년부터 2020년까지 매년 11월 1일에 초기화 되었으며, 총 61개의 초기화 실험이 사용되었다. 각 실험은 125개월씩 적분 되어, 2020년 11월 1일에 초기화된 자료의 경우 2031년 3월까지의 자료가 존재한다. 매 실험마다 10개의 앙상블 멤버가 존재하기 때문에, DePreSys4의 총 적분 기간은 약 6,100년(61개 초기화 x 10개 앙상블 멤버 x 10년 예측)이다.

예측성능 검증에는 WMO LC-ADCP의 자료를 참고하여 연평균과 계절별 장기 평균을 사용하였다. 연평균은 선행시간(lead time)이 2~13개월인 자료의 평균(1~12월의 평균)으로 정의하였고, 계절별 장기 평균은 5~9월(MJJAS) 여름철과 11~3월(NDJFM) 겨울철의 1~5년 평균자료를 이용하였다.

검증을 위해 ERA version 5 (ERA5)의 지표기온과 해면기압을 사용하였으며(Hersbach et al., 2020), 관측 강수는 Global Precipitation Climatology Centre (GPCC) 자료를 이용하였다(Schneider et al., 2017). 재분석자료 및 관측자료는 0.25o의 해상도를 DePreSys4의 해상도(0.8o 경도 × 0.6o 위도)에 맞춰 내삽한 후 분석하였다.

본 연구에서는 경년변동성과 장기적인 변화를 모두 포함하는 예측성능을 검증하기 위해 모델과 관측의 선형적 추세를 제거하지 않았다. 대신 외부 기후강제력이 근미래 기후예측에 미치는 영향을 진단하기 위해 동일모델의 비초기화(uninitialized) 실험과 비교하였다. 비초기화 실험은 과거 1961~2014년의 기후강제력만 고려된 CMIP6의 historical simulation이며 총 4개의 앙상블 멤버를 평균하여 사용하였다.

2.3 예측성능 검증

2.3.1 오차보정(bias correction)

일반적으로 초기화 과거예측 실험에서는 시간에 따라 모델 자체의 기후값으로 편향되는 현상이 나타난다(Fig. 1에서 무지개색 점의 분포). 모델 드리프트(model drift)라 불리는 이 현상은 1) 매우 빠르게 나타나는 초기화과정의 구조적 오차(initialization shock), 2) 모델이 모의하지 못하는 경년-장주기 기후변동성의 변화, 3) 불확실한 외부강제력, 4) 불충분하고 불완전한 관측값 등의 원인으로 발생한다. 따라서 분석에 앞서 다음과 같은 방법으로 모델의 평균 오차(mean bias)를 제거한 후에 예측성능을 검증하였다(ICPO, 2011).

M^jτ=O-τ+M^raw ,jτ-M-raw ,τ(1) 
Fig. 1.

Surface air temperature (SAT) averaged over East Asia (75-150oE, 15-60oN) from ERA5 (black line) and the uninitialized DePreSys4 simulation (historical experiments, thick gray line). Thin gray lines with rainbow dots indicate the DePreSys4 predictions as a function of lead year. Black, purple, and red straight lines are the linear trend of ERA5, year 1 and year 10 predictions, respectively. Year 1 predictions (purple dots) compare well with ERA5 (black line), but drift (progression of purple dots to red dots) towards the model’s systematic error state represented by the uninitialized state (thick gray line).

여기서 M^은 오차가 제거된 모델의 개별 앙상블 멤버, M^raw 는 개별 앙상블 멤버의 원시자료, Mraw는 원시자료의 앙상블 평균이다. O는 재분석자료 또는 관측자료를 의미하며, τ는 선행시간, j는 각 초기화 실험(총 61개 = n)을 나타낸다. 윗줄(‾)은 기후 평균으로 모델과 관측의 각 1991~2020년 평균으로 정의하였다.

2.3.2 진단예측(deterministic prediction)

앙상블 평균을 이용하는 진단예측의 성능평가를 위해 Anomaly Correlation Coefficient (ACC)와 Mean Squared Skill Score (MSSS)를 다음과 같은 식을 이용하여 계산하였다.

ACCτ=1nj=1nMjτ'Ojτ'1nj=1nMjτ'21nj=1nOjτ'2(2) 
MSSSτ=ACCτ2-ACCτ-σMτ'/σOτ'2(3) 

M'O'은 1991~2020년 기후값(세계기상기구의 정의와 동일)에 대한 모델의 앙상블 평균 아노말리와 관측의 아노말리(anomaly)를 의미하며, σ는 표준편차이다. 따라서 ACC는 변동성의 위상(부호) 예측에 대한 성능을 진단할 수 있으며, MSSS에는 변동성의 크기에 대한 진단이 추가적으로 포함된다(Choi et al., 2016, Son et al., 2020).

ACC와 MSSS의 통계적 유의성은 bootstrap resampling을 1,000번 수행하여 0이상의 값에 대해서만 검증하였다(one-tailed test). 즉, 무작위로 계산된 1,000개의 ACC, MSSS 중 음수의 비율이 5%(50개)보다 작을 경우, ACC와 MSSS는 95%의 신뢰수준에서 유의미한 값을 갖는 것으로 해석하였다(Goddard et al., 2013; Choi and Son, 2022).

2.3.3 확률예측(probabilistic prediction)

관측자료 1991~2020년 기간에서의 33, 67퍼센타일(percentile)값을 기준으로 다음과 같은 식을 이용해서 Ranked Probability Skill (RPS)을 계산할 수 있다.

RPS=i=1C-1Pi-Oi2(4) 

여기서 C는 전체 카테고리의 수(3분위이므로 C = 3)이며, PiOi는 각 모델과 관측에서 i번째 카테고리의 누적확률이다. i = C일때의 누적확률은 모델과 관측 모두 1로 같으므로, C -1까지의 합으로 RPS를 계산한다. 관측에서의 3분위 확률은 해당 카테고리에서만 1의 값을 갖고 나머지는 0이기 때문에, 관측 누적확률(Oi)은 계단 함수의 형태를 갖는다. 모델에서의 누적확률(Pi)은 다음과 같이 구할 수 있다.

Pi=k=1ipk
pk=NkthNe

Ne는 전체 앙상블 멤버 수(= 10)이고, Nkth는 k번째 카테고리에 포함되는 개별 앙상블 멤버의 수이다. RPS는 Mean Squared Error (MSE)처럼 오차의 크기를 거리(distance)의 개념으로 진단한 것이므로 0에 가까울수록 예측결과가 우수함을 의미한다. 최종적으로 다음 식으로부터 Ranked Probability Skill Score (RPSS)를 이용한 3분위 확률예측의 성능을 검증하였다.

RPSS=1-RPS¯RPSref ¯(5) 

식(5)의 윗줄(‾)은 전체 사례에 대한 평균을 의미하며, RPSref는 기후값으로부터 얻는 RPS(즉, 모든 카테고리에서 p = 1/3)를 나타낸다. 따라서 RPS¯=0이 될 때 RPSS = 1로 최대값(perfect forecast)을 갖는다. 한편, 오차의 크기를 나타내는 RPS¯ 값이 RPSref ¯ 보다 커지면 RPSS < 0이 되는데, 이 경우 모델 확률예측의 신뢰성은 없는 것으로 진단하였다.


3. 결 과

3.1 모델 오차

Figure 1의 검정색 선은 동아시아 지역(75-150oE, 15-60oN)에서 평균된 ERA5 지표대기온도의 연평균 변화와 선형추세를 나타낸다. DePreSys4의 과거예측자료는 무지개색 점으로 표시되었으며, 선행시간이 가장 짧은 1년 예측은 보라색 점이고 가장 긴 10년 예측은 빨간색 점이다. 모델의 선행시간이 길어질수록(보라색 점 빨간색 점) 굵은 회색선으로 표시된 비초기화된 실험(historical experiment)으로부터 구한 모델 고유의 평균상태 값과 유사해지는 것을 확인할 수 있다. 이와 같은 모델 드리프트 때문에, DePreSys4의 평균 지표기온은 ERA5보다 낮은 상태인 차가운 오차(cold bias)가 존재한다.

장기추세에도 뚜렷한 모델오차가 존재한다. 재분석자료에서 나타나는 동아시아 온난화 추세는 0.23K decade-1인 반면, DePreSys4의 1년 예측(보라색 선)에서는 0.28K decade-1로 다소 강하게 나타났으며, 모델에서의 강한 온난화 추세는 선행시간이 길어질수록 더 뚜렷하게 나타났다(10년 예측, 빨간색 선: 0.42 K decade-1).

Figure 2는 모델의 평균오차를 변수별(지표기온, 강수, 해면기압)로 1991~2020년에 대해 구한 값이다. 지표기온은 우리나라를 포함한 30oN 이상의 대륙지역에서는 음의 오차(cold bias)를 보이며, 해양과 인도북부 지역에서는 약한 양의 오차(warm bias) 형태를 보인다. 육지강수의 경우 전반적으로 양의 오차(wet bias)를 보인다. 해면기압은 연직으로 외삽한 값을 이용하기 때문에 복잡한 산악지형이 존재하는 티벳고원 근처에서 큰 오차를 보이고 있다. 이외의 지역에서는 한반도 북쪽으로 양의 오차를 보이는 반면, 남쪽으로는 음의 오차를 보인다. 이러한 주요 변수의 평균오차는 분석 기간을 전 기간(1961~2021년)으로 확장하여도 유사하게 나타났다. Figure 3부터 보인 모델의 예측성능은 이러한 오차들을 제거 한 후에 평가하였다.

Fig. 2.

Mean bias of DePreSys4 in (a) SAT, (b) precipitation (Pr), and (c) sea level pressure (SLP) during the period of 1991~2020 for the lead time of year 1 (i.e., 2~13 lead month). The precipitation dataset is shown for land only.

Fig. 3.

Anomaly correlation coefficient (ACC) of (a) SAT, (b) Pr, and (c) SLP of DePreSys4 ensemble mean prediction for the lead time of year 1. (d, e, and f) Same as (a, b, and c) but for the mean-squared skill score (MSSS). The statistically significant prediction skill at the 95% confidence level, based on a bootstrap resampling method, is dotted.

3.2 연평균 1년 예측

주요 변수들의 연평균 값에 대한 예측성능을 Fig. 3에 나타냈다. 3개의 대기변수 중 지표기온의 예측성능이 가장 우수한 것으로 나타났다. 지표기온의 경우 동아시아 대부분 지역에서 95% 신뢰수준에서 통계적으로 유의미한 ACC가 나타났고, 특히 우리나라 일부, 중국, 일본에서는 MSSS 또한 유의미한 값을 보였다. 이는 DePreSys4가 우리나라 주변 연평균 지표기온 변동성의 위상 및 크기를 95% 신뢰수준에서 통계적으로 유의미하게 예측하고 있다는 것을 의미한다. 그러나 육지강수의 경우, 통계적으로 유의미한 ACC의 값이 매우 산발적으로 나타나고 있으며(Fig. 3b), MSSS는 동아시아 전 지역에서 0에 가까운 값을 보였다(Fig. 3e). 해면기압의 1년 예측은 주로 해양에서 유의미한 ACC와 MSSS 값을 보인다(Figs. 3c, f). 지표기온에 비해 대륙의 강수와 해면기압의 근미래 예측성능이 낮은 결과는 WMO LC-ADCP의 다중 모델 앙상블 결과와 유사하다(https://hadleyserver.metoffice.gov.uk/wmolc/).

확률예측 성능 검증을 위한 주요 변수별 RPSS 값을 Fig. 4에 표시하였다. 앞서 언급한 바와 같이, RPSS > 0인 경우에만 모델의 확률예측이 3분위 기후값에 기반한 기대값(= 1/3)보다 우수한 성능을 보이는 것이라 해석할 수 있다. 지표기온의 경우 동아시아 대부분의 지역에서 0 이상의 값을 보인다(Fig. 4a). 특히 중국대륙, 일본, 북서태평양에서 0.5 이상의 RPSS 값이 나타나는데, 이는 ACC, MSSS로 진단한 앙상블 평균의 예측성능과 유사하다(Fig. 4a3ad를 비교). 연평균 육지강수의 RPSS 또한 ACC와 유사하게 산발적으로 0이상의 값을 보이고 있다. 해면기압의 RPSS 또한 인도북부, 북서태평양 지역에서만 양수의 값을 보이는 등 ACC의 결과와 유사하다. RPSS와 ACC의 유사성은 선행연구에서 언급된 바 있다. Tippett et al. (2019)은 모델의 예측확률이 joint-Gaussian 분포를 따를 경우, RPSS1-1-ACC2 로 근사됨을 보였다. 따라서 Fig. 3에서 통계적으로 유의미한 ACC의 값이 0.4 근처임을 고려할 때, 위의 근사식에 의해 RPSS = 0.1임을 알 수 있고, 이와 유사한 값이 Fig. 4에 도출되었다.

Fig. 4.

Same as Figs. 3a-c but for the ranked probability skill score (RPSS) for the lead time of year 1.

근미래 기후예측 성능은 과거동안의 장기추세변화와 경년변동성 모두의 영향을 받는다. 특히 지표기온의 경우 장기추세변화의 영향이 매우 크다(Choi et al., 2016). DePreSys4의 장기추세변화 모의 능력을 알아보기 위해, 주요 변수별 지난 61년간의 선형추세 값을 Fig. 5에 표시하였다. Figure 1과 마찬가지로 기온의 추세값은 재분석 자료에 비해 모델의 1년 예측에서 다소 크게 나타났으며, 기존에 잘 알려진 기후모델들의 특성처럼 북반구 고위도로 갈수록 온난화 현상이 강해진다(Previdi et al., 2021). 재분석자료와 모델에서 나타나는 지표기온의 선형추세의 유사성으로 인해 동아시아에서 높은 ACC가 진단되었다(Fig. 3a).

Fig. 5.

Linear trend of (a) ERA5 SAT, (b) GPCC Pr, and (c) ERA5 SLP during the period of 1961~2021. (d, e, and f) Same as (a, b, and c) but for DePreSys4 ensemble mean prediction for the lead time of year 1.

강수의 경우 중국에서의 강한 증가 추세가 관측된다(Fig. 5b). 계절별 분석 결과에 의하면 겨울철에도 강수량의 증가 추세가 나타나지만, 여름철의 증가가 더 뚜렷한 것으로 나타났다(not shown). 우리나라의 연평균 강수에서는 뚜렷한 변화가 관측되지 않았다. 모델에서의 강수는 50oN 이상 고위도에서 약하게 증가하는 추세가 나타나는데, 이러한 특징은 기후모델들이 모의하는 1950년대 이후의 강수 추세변화와 유사하다(Vicente-Serrano et al., 2022). 지표기온의 추세가 재분석자료와 모델에서 유사한 반면, 해면기압의 경우 전반적으로 ERA5와 다른 추세가 모델에서 나타난다(Figs. 5c, f). 이는 CMIP5와 CMIP6에 참여한 많은 기후모델들이 북반구중위도 해양에서의 양의 추세는 약하게 모의하고, 동아시아 대륙의 해면기압 경향성을 반대로 모의하는 특징과 유사하다 (Wills et al., 2022). 이러한 선형추세 모의의 오차로 인해 동아시아 연평균 해면기압의 예측성능이 특히 대륙에서 낮게 나타났다(Figs. 3c, f).

관측과 모델에서 나타나는 선형추세는 대부분 이산화탄소의 대기 중 농도 증가와 같은 외부강제력에 의한 것으로 여겨지나, 이것에 의한 기후모델의 예측성능이 항상 선형적으로 나타나는 것은 아니기 때문에, 비초기화 실험과의 비교를 통해 외부강제력과 모델초기화가 동아시아 근미래 기후예측에 미치는 영향을 살펴보았다. 비초기화 실험은 2014년까지만 제공되므로, 예측성능의 비교는 초기화/비초기화 실험 모두 1961년부터 2014년까지의 연평균 값을 사용하였다. Figures 6a-c는 비초기화 실험에서 나타나는 연평균 기온, 육지강수, 해면기압의 ACC 값이며, Figs. 6d-f는 초기화 실험과 비초기화 실험의 ACC 값의 차이이다. 즉, 양수의 경우 모델초기화로 인해 예측성능이 향상되었음을 의미하며, 음수의 경우 외부강제력만을 고려했을 때의 예측성능이 더 높음을 의미한다.

Fig. 6.

ACC of (a) SAT, (b) Pr, and (c) SLP of DePreSys4 uninitialized historical simulation during the period of 1961~2014. The statistically significant prediction skill at the 95% confidence level is dotted. Skill difference between the initialized hindcasts and uninitialized historical simulation of (d) SAT, (e) Pr, and (f) SLP. Positive (negative) values denote skill improvements (degradation) by model initialization.

기온예측의 경우 모델초기화로 인해 해양에서의 예측성능이 다소 향상되었으며, 육지에서의 통계적으로 유의미한 ACC 값은 대부분 외부강제력에 의한 것으로 진단되었다. 연평균 해면기압의 경우, 비초기화 실험에서는 해양에서의 유의미한 ACC 값이 나타나지 않는데(Fig. 6c), 이는 해양의 예측성능은 대부분 모델 초기화에 의한 것임을 의미한다. 이 결과들은 동아시아 육지에서의 기온과 해면기압의 근미래 예측성능 향상을 위해서는 지면 초기화과정의 고도화가 필요함을 시사한다.

이에 반해 육지강수 예측의 경우, 외부강제력에 의한 반응만을 고려할 때 보다 모델초기화에 의한 내부 변동성의 모의가 일부 지역의 연평균 강수예측 성능을 향상시키는 것으로 나타났다. 앞서 언급한 바와 같이 50oN 이상의 고위도 육지강수의 예측성능은 대부분 외부강제력으로부터 기인하였으나, 30oN 근처 중국에서의 강수와 일본 남부의 강수 예측성능은 초기화 실험이 비초기화 실험보다 우수한 예측성능을 보인다(Figs. 3b, 6b, 6e). 이는 내부변동성에 의한 강수 모의 또한 연평균 육지강수의 예측성능 향상에 중요함을 의미한다.

3.3 계절별 1~5년 예측

앞서 연평균 예측에서 MSSS는 지표기온을 제외하고는 대부분의 동아시아 지역에서 통계적으로 유의미하지 않은 값을 보였다. 이에 주요 대기변수의 계절별 근미래 예측은 ACC로만 예측성능을 평가하였다. 지표기온의 경우, 여름철과 겨울철 모두 동아시아 대부분의 지역에서 0.7 이상의 높은 ACC 값이 나타났다(Figs. 7a, d). 이는 1~5년 평균으로 인해 주요 경년변동성들이 사라지고 장기추세만 남았기 때문이다.

Fig. 7.

ACC of May-to-September (MJJAS) (a) SAT, (b) Pr, and (c) SLP of DePreSys4 ensemble mean prediction for the lead time of year 1~5. (d, e, and f) Same as (a, b, and c) but for November-to-March (NDJFM).

강수의 경우, 전반적으로 겨울철의 예측성능이 여름철에 비해 우수한 것으로 나타났고, 이러한 특징은 고위도 지역에서 더 뚜렷하게 나타났다. 중국에서의 강수 증가 추세는 여름철에 더 강하게 관측됨에도 불구하고, 겨울철의 ACC 값이 더 크게 진단되었다. 이는 계절별 강수 증가의 원인이 다르기 때문인 것으로 사료된다. 중국의 겨울철 강수 증가는 인도양과 태평양 해수면온도의 변화로부터 기인한 대규모 대기순환에 의한 수증기 유입의 증가로 설명되고 있다(Liu et al., 2022). 이에 반해 여름철 강수의 증가 추세는 주로 일일 강수의 빈도와 강도 증가로부터 기인한 것으로 알려져 있다(Li et al., 2022). 관측에서의 강한 추세가 여름철이 더 큼에도 불구하고 겨울철 ACC가 높은 것은, 모델이 대규모 대기순환의 변화는 잘 모의하는 반면, 짧은 시간 규모의 강수 변화는 예측하지 못했기 때문으로 추정된다.

해면기압의 예측은 중국 동북부 만주지방과 해양에서 ACC 값의 차이가 뚜렷하게 나타났다. 여름철 해면기압은 동아시아 대륙 전지역에서 양의 추세가 관측되는데, 모델이 이를 모의하지 못했기 때문에 인도 북부를 제외한 대륙에서는 유의미한 ACC 값이 나타나지 않는다(Fig. 7c). 그러나 만주지방에서는 겨울철 해면기압이 감소하는 것으로 관측되는데, 모델이 이 지역 음의 추세 변화를 잘 모의하기 때문에 통계적으로 유의미한 ACC 값을 보이고 있다(Fig. 7f). 해양의 경우, 관측 해면기압의 추세 변화가 겨울철에만 더 강하게 나타나서 이로 인해 유의미한 ACC 값이 도출된 것으로 추정된다.

Figure 8에 보인 RPSS의 형태는 ACC의 결과와 유사하지만, RPSS > 0인 지역이 ACC에 비해 좁게 나타난다. 이는 확률예측에서 앙상블 크기가 작을 경우, 예측 오차의 크기가 상대적으로 커진다고 알려져 있는데(Corti et al., 2012), 본 연구에 사용된 앙상블 멤버의 수가 10개로 제한적이기 때문이다. 따라서 이 결과들은 근미래 기후변화 확률예측의 성능향상을 위해서는 보다 많은 앙상블 멤버가 필요함을 시사한다.

Fig. 8.

Same as Fig. 7 but for RPSS.


4. 요약 및 토의

본 연구에서는 영국 Met Office DePreSys4의 국내 운영에 앞서 동아시아에서의 근미래 기후예측 성능을 평가하였다. 1960년부터 2020년까지 매년 11월에 초기화된 총 61개의 실험과 10개의 앙상블 멤버를 이용하여 연평균 예측과 계절별 5년 평균에 대한 진단 및 확률 예측 검증을 수행하였다. 육지기온의 근미래 예측성능은 강한 온난화 추세로 인해 비초기화/초기화 실험 모두에서 높은 예측 성능을 보였고, 해양기온의 경우 모델초기화 과정으로 인해 예측 성능이 일부 향상되었다. 육지강수의 경우, 강수 추세 변화의 원인에 따라 계절별 예측 성능이 다르게 나타나는 것으로 평가되었다. 특히 고위도 연평균 강수의 ACC는 대부분 외부강제력으로 설명되는 것에 비해, 중국 동부와 일본 남부의 연평균 강수는 모델초기화에 의해 예측 성능이 향상된 것으로 진단되었다. 해면기압의 예측 성능은 다른 기후모델들이 갖고 있는 문제처럼 육지에 대해서는 매우 낮게 나타난 반면, 해양에서의 성능은 통계적으로 유의미 한 것으로 평가되었다.

본 연구에서는 WMO LC-ADCP의 가이드에 따른 기후요소의 평균장 예측에 대해서만 다루었지만, 향후 DePreSys4의 개선이나 예측성의 원천을 파악하기 위해서는 여러 기후변동성이나 대기 순환장과 같은 요소들의 근미래 예측에 대한 추가적인 분석과 다른 모델과의 비교검증이 요구된다. 또한 최근 들어 극한 기상의 근미래 예측에 대한 연구들이 보고되고 있으며(Borchert et al., 2019; Delgado-Torres et al., 2023), 이들 연구들에 의하면 폭염과 같이 장기적인 추세 변화가 있는 극한기상의 경우, 최신의 기후예측시스템들이 신뢰할 수 있는 예측 성능을 갖는 것으로 보고되었다. 따라서 동아시아의 극한기상 추세변화에 대한 분석과, 이들의 예측성능에 대한 진단이 요구된다. 그리고 근미래 예측에 있어 같은 기후인자라 할 지라도 계절에 따라 사용되는 모델 종류의 수와 앙상블 멤버 수의 상대적 중요성이 달라지는 것으로 보고되었다(Choi and Son, 2022). 따라서 과거 예측자료를 기반으로 근미래 시간규모에서의 동아시아 기후예측의 특성을 파악하고, 예측 성능 향상을 위한 추가적인 연구가 필요하다.

Acknowledgments

본 연구는 기상청 “가까운 미래 기후예측을 위한 검증 및 평가기술 개발(KMI2022-01114)”의 지원을 받아 수행되었습니다. 논문을 검토해주신 두 분의 심사위원께 감사드립니다.

References

  • Borchert, L. F., H. Pohlmann, J. Baehr, N.-C. Neddermann, L. Suarez-Gutierrez, and W. A. Müller, 2019: Decadal predictions of the probability of occurrence for warm summer temperature extremes. Geophy. Res. Lett., 46, 14042-14051. [https://doi.org/10.1029/2019GL085385]
  • Choi, J., S.-W. Son, Y.-G. Ham, J.-Y. Lee, and H.-M. Kim, 2016: Seasonal to interannual prediction skills of near-surface air temperature in the CMIP5 decadal hindcast experiments. J. Climate, 29, 1511-1527. [https://doi.org/10.1175/JCLI-D-15-0182.1]
  • Choi, J., and S.-W. Son, 2022: Seasonal-to-decadal prediction of El Niño-Southern Oscillation and Pacific Decadal Oscillation. npj Climate and Atmos. Sci., 5, 29. [https://doi.org/10.1038/s41612-022-00251-9]
  • Corti, S., A. Weisheimer, T. N. Palmer, F. J. Doblas-Reyes, and L. Magnusson, 2012: Reliability of decadal predictions. Geophys. Res. Lett., 39, L21712. [https://doi.org/10.1029/2012GL053354]
  • Dee, D. P., and Coauthors, 2011: The ERA-Interim reanalysis: configuration and performance of the data assimilation system. Quart. J. Roy. Meteor. Soc., 137, 553-597. [https://doi.org/10.1002/qj.828]
  • Delgado-Torres, C., M. G. Donat, A. Soret, N. González-Reviriego, P.-A. Bretonnière, A.-C. Ho, N. Pérez-Zanón, M. S. Cabré, and F. J. Doblas-Reyes, 2023: Multi-annual predictions of the frequency and intensity of daily temperature and precipitation extremes. Environ. Res., Lett., 18, 034031. [https://doi.org/10.1088/1748-9326/acbbe1]
  • Dunstone, N., D. Smith, A. Scaife, L. Hermanson, R. Eade, N. Robinson, M. Andrews, and J. Knight, 2016: Skilful predictions of the winter North Atlantic Oscillation one year ahead. Nat. Geosci., 9, 809-814. [https://doi.org/10.1038/ngeo2824]
  • Dunstone, N., and Coauthors, 2022: Towards Useful Decadal Climate Services. Bull. Amer. Meteor. Soc., 103, E1705-E1719. [https://doi.org/10.1175/BAMS-D-21-0190.1]
  • Goddard, L., and Coauthors, 2013: A verification framework for interannual-to-decadal predictions experiments. Climate Dyn., 40, 245-272. [https://doi.org/10.1007/s00382-012-1481-2]
  • Gordon, C., C. Cooper, C. A. Senior, H. Banks, J. M. Greg ory, T. C. J ohns, J. F. B. M itchell, a nd R . A. Wood, 2000: The simulation of SST, sea ice extents and ocean heat transports in a version of the Hadley Centre coupled model without flux adjustments. Climate Dyn., 16, 147-168. [https://doi.org/10.1007/s003820050010]
  • Hermanson, L., and Coauthors, 2022: WMO global annual to decadal climate update: A prediction for 2021~25. Bull. Amer. Meteor. Soc., 103, E1117-E1129. [https://doi.org/10.1175/BAMS-D-20-0311.1]
  • Hersbach, H., and Coauthors, 2020: The ERA5 global reanalysis. Quart. J. Roy. Meteor. Soc., 146, 1999-2049. [https://doi.org/10.1002/qj.3803]
  • Hewitt, H. T., D. Copsey, I. D. Culverwell, C. M. Harris, R. S. R. Hill, A. B. Keen, A. J. McLaren, and E. C. Hunke, 2011: Design and implementation of the infrastructure of HadGEM3: the next-generation Met Office climate modelling system. Geosci. Model Dev., 4, 223-253. [https://doi.org/10.5194/gmd-4-223-2011]
  • Hyun, Y.-K., and Coauthors, 2022: The KMA Global Seasonal forecasting system (GloSea6) - Part 2: Climatological mean bias characteristics. Atmosphere, 32, 87-101. [https://doi.org/10.14191/Atmos.2022.32.2.087]
  • ICPO, 2011: Data and Bias Correction for Decadal Climate Predictions. CMIP-WGCMWGSIP Decadal Climate Prediction Panel. International CLIVAR Project Office Publication Series No. 150, 5 pp.
  • Kim, H., J. Lee, Y.-K. Hyun, and S.-O. Hwang, 2021: The KMA Global Seasonal forecasting system (GloSea6) - Part 1: Operational system and improvements. Atmosphere, 31, 341-359. [https://doi.org/10.14191/Atmos.2021.31.3.341]
  • Knight, J. R., and Coauthors, 2014: Predictions of climate several years ahead using an improved decadal prediction system. J. Climate., 27, 7550-7567. [https://doi.org/10.1175/JCLI-D-14-00069.1]
  • Li, M., C. Li, Z. Jiang, X. Zhang, and F. W. Zwiers, 2022: Deciphering China’s complex pattern of summer precipitation trends. Earth’s Future, 10, e2022EF002797. [https://doi.org/10.1029/2022EF002797]
  • Liu, B., Y. Fang, S. Sun, G. Yang, Y. Duan, and C. Tana, 2022: Increasing precipitation in early winter over the southern China during the past 40 years. Geophy. Res. Lett., 49, e2022GL101134. [https://doi.org/10.1029/2022GL101134]
  • Meehl, G. A., and Coauthors, 2021: Initialized Earth system prediction from subseasonal to decadal timescales. Nat. Rev. Earth Environ., 2, 340-357. [https://doi.org/10.1038/s43017-021-00155-x]
  • Previdi, M., K. L. Smith, and L. M. Polvani, 2021: Arctic amplification of climate change: a review of underlying mechanisms. Environ. Res. Lett., 16, 093003. [https://doi.org/10.1088/1748-9326/ac1c29]
  • Rayner, N. A., D. E. Parker, E. B. Horton, C. K. Folland, L. V. Alexander, D. P. Rowell, E. C. Kent, and A. Kaplan, 2003: Global analyses of sea surface temperature, sea ice and night marine air temperature since the late nineteenth century. J. Geophys. Res. Atmos., 108, 4407. [https://doi.org/10.1029/2002JD002670]
  • Schneider, U., P. Finger, A. Meyer-Christoffer, E. Rustemeier, M. Ziese, and A. Becker, 2017: Evaluating the hydrological cycle over land using the newly-corrected precipitation climatology from the Global precipitation Climatology Centre (GPCC). Atmosphere, 8, 52. [https://doi.org/10.3390/atmos8030052]
  • Smith, D. M., and J. M. Murphy, 2007: An objective ocean temperature and salinity analysis using covariances from a global climate model. J. Geophys. Res. Oceans, 112, C02022. [https://doi.org/10.1029/2005JC003172]
  • Smith, D. M., S. Cusack, A. W. Colman, C. K. Folland, G. R. Harris, and J. M. Murphy, 2007: Improved surface temperature prediction for the coming decade from a global climate model. Science, 317, 796-799. [https://doi.org/10.1126/science.1139540]
  • Smith, D. M., R. Eade, and H. Pohlmann, 2013: A comparison of full-field and anomaly initialization for seasonal to decadal climate prediction. Climate Dyn., 41, 3325-3338. [https://doi.org/10.1007/s00382-013-1683-2]
  • Son, S.-W., H. Kim, K. Song, S.-W. Kim, P. Martineau, Y.-K. Hyun, and Y. Kim, 2020: Extratropical prediction skill of the subseasonal-to-seasonal (S2S) prediction models. J. Geophy. Res. - Atmospheres, 125, e2019-JD031273. [https://doi.org/10.1029/2019JD031273]
  • Tippett, M. K., M. Ranganathan, M. L’Heureux, A. G. Barnston, and T. DelSole, 2019: Assessing probabilistic predictions of ENSO phase and intensity from the North American Multimodel Ensemble. Climate Dyn., 53, 7497-7518. [https://doi.org/10.1007/s00382-017-3721-y]
  • Vicente-Serrano, and Coauthors, 2022: Do CMIP models capture long-term observed annual precipitation trends? Climate Dyn., 58, 2825-2842. [https://doi.org/10.1007/s00382-021-06034-x]
  • Williams, K. D., C. M. Harris, A. Bodas-Salcedo, and Coauthors, 2015: The Met Office Global Coupled model 2.0 (GC2) configuration. Geosci. Model Dev., 8, 1509-1524. [https://doi.org/10.5194/gmd-8-1509-2015]
  • Williams, K. D., and Coauthors, 2017: The Met Office Global Coupled model 3.0 and 3.1 (GC3.0 and GC3.1) configurations. J. Adv. Model. Earth Sys., 10, 357-380. [https://doi.org/10.1002/2017MS001115]
  • Wills, R. C. J., Y. Dong, C. Proistosecu, K. C. Armour, and D. S. Battisti, 2022: Systematic climate model biases in the large-scale patterns of recent sea-surface temperature and sea-level pressure change. Geophys. Res. Lett., 49, e2022GL100011. [https://doi.org/10.1029/2022GL100011]

Fig. 1.

Fig. 1.
Surface air temperature (SAT) averaged over East Asia (75-150oE, 15-60oN) from ERA5 (black line) and the uninitialized DePreSys4 simulation (historical experiments, thick gray line). Thin gray lines with rainbow dots indicate the DePreSys4 predictions as a function of lead year. Black, purple, and red straight lines are the linear trend of ERA5, year 1 and year 10 predictions, respectively. Year 1 predictions (purple dots) compare well with ERA5 (black line), but drift (progression of purple dots to red dots) towards the model’s systematic error state represented by the uninitialized state (thick gray line).

Fig. 2.

Fig. 2.
Mean bias of DePreSys4 in (a) SAT, (b) precipitation (Pr), and (c) sea level pressure (SLP) during the period of 1991~2020 for the lead time of year 1 (i.e., 2~13 lead month). The precipitation dataset is shown for land only.

Fig. 3.

Fig. 3.
Anomaly correlation coefficient (ACC) of (a) SAT, (b) Pr, and (c) SLP of DePreSys4 ensemble mean prediction for the lead time of year 1. (d, e, and f) Same as (a, b, and c) but for the mean-squared skill score (MSSS). The statistically significant prediction skill at the 95% confidence level, based on a bootstrap resampling method, is dotted.

Fig. 4.

Fig. 4.
Same as Figs. 3a-c but for the ranked probability skill score (RPSS) for the lead time of year 1.

Fig. 5.

Fig. 5.
Linear trend of (a) ERA5 SAT, (b) GPCC Pr, and (c) ERA5 SLP during the period of 1961~2021. (d, e, and f) Same as (a, b, and c) but for DePreSys4 ensemble mean prediction for the lead time of year 1.

Fig. 6.

Fig. 6.
ACC of (a) SAT, (b) Pr, and (c) SLP of DePreSys4 uninitialized historical simulation during the period of 1961~2014. The statistically significant prediction skill at the 95% confidence level is dotted. Skill difference between the initialized hindcasts and uninitialized historical simulation of (d) SAT, (e) Pr, and (f) SLP. Positive (negative) values denote skill improvements (degradation) by model initialization.

Fig. 7.

Fig. 7.
ACC of May-to-September (MJJAS) (a) SAT, (b) Pr, and (c) SLP of DePreSys4 ensemble mean prediction for the lead time of year 1~5. (d, e, and f) Same as (a, b, and c) but for November-to-March (NDJFM).

Fig. 8.

Fig. 8.
Same as Fig. 7 but for RPSS.