The Korean Meteorological Society
[ Technical Note ]
Atmosphere - Vol. 34, No. 1, pp.55-67
ISSN: 1598-3560 (Print) 2288-3266 (Online)
Print publication date 29 Feb 2024
Received 04 Nov 2023 Revised 22 Nov 2023 Accepted 28 Nov 2023
DOI: https://doi.org/10.14191/Atmos.2024.34.1.055

기상청 기후예측시스템(GloSea)의 앙상블 확대를 통해 살펴본 신호대잡음의 역설적 특징(Signal-to-Noise Paradox)과 예측 스킬의 한계

현유경* ; 박연희 ; 이조한 ; 지희숙 ; 부경온
국립기상과학원 기후연구부 기후모델개발팀
Characteristics of Signal-to-Noise Paradox and Limits of Potential Predictive Skill in the KMA’s Climate Prediction System (GloSea) through Ensemble Expansion
Yu-Kyung Hyun* ; Yeon-Hee Park ; Johan Lee ; Hee-Sook Ji ; Kyung-On Boo
Climate Model Development Team, Climate Research Department, National Institute of Meteorological Sciences, Jeju, Korea

Correspondence to: *Yu-Kyung Hyun, Climate Model Development Team, Climate Research Department, National Institute of Meteorological Sciences, 33, Seohobuk-ro, Seogwipo, Jeju 63568, Korea. Phone: +82-64-780-6622, Fax: +82-64-738-9072 E-mail: ykhyun@korea.kr

© 2024 Korean Meteorological Society

Abstract

This paper aims to provide a detailed introduction to the concept of the Ratio of Predictable Component (RPC) and the Signal-to-Noise Paradox. Then, we derive insights from them by exploring the paradoxical features by conducting a seasonal and regional analysis through ensemble expansion in KMA’s climate prediction system (GloSea). We also provide an explanation of the ensemble generation method, with a specific focus on stochastic physics. Through this study, we can provide the predictability limits of our forecasting system, and find way to enhance it. On a global scale, RPC reaches a value of 1 when the ensemble is expanded to a maximum of 56 members, underlining the significance of ensemble expansion in the climate prediction system. The feature indicating RPC paradoxically exceeding 1 becomes particularly evident in the winter North Atlantic and the summer North Pacific. In the Siberian Continent, predictability is notably low, persisting even as the ensemble size increases. This region, characterized by a low RPC, is considered challenging for making reliable predictions, highlighting the need for further improvement in the model and initialization processes related to land processes. In contrast, the tropical ocean demonstrates robust predictability while maintaining an RPC of 1. Through this study, we have brought to attention the limitations of potential predictability within the climate prediction system, emphasizing the necessity of leveraging predictable signals with high RPC values. We also underscore the importance of continuous efforts aimed at improving models and initializations to overcome these limitations.

Keywords:

Signal-to-Noise Paradox, RPC, GloSea, Ensemble expansion, Climate prediction, Stochastic physics, SKEB2, SPT, Potential predictability

1. 서 론

앙상블 예측은 초기의 작은 차이로부터 도래하는 결과의 차이로 예측 불확실성의 범위를 가늠할 수 있게 해주며, 이와 함께 예측성의 한계를 제시해 준다. 또한 개별 앙상블들의 평균을 통해 예측 불가능한 노이즈를 제거하고 예측 가능한 시그널을 남김으로써 최대한의 예측 스킬을 확보할 수 있게 해 준다. 이와 같이 불확실성의 범위를 감안하여 최선의 예측 정보를 이끌어 내려는 앙상블 예측시스템의 전략은 단기 기상 예보를 넘어 연장 중기와 계절 및 기후변화 전망에 까지 널리 활용되고 있다.

따라서 전산 자원이 증대됨에 따른 앙상블의 확대가 예측성에 미치는 영향에 대한 연구들이 지속적으로 수행되어 왔으며, 많은 연구들에서 앙상블 크기 증가에 따라 얻게 되는 이점을 다양한 관점으로 연구해왔다(Murphy, 1990; Talagrand et al., 1997; Raynaud and Bouttier, 2017; Ahn et al., 2018; Kim, 2019; Weisheimer et al., 2019; Hyun et al., 2020; Park et al., 2021).

이 중 Park et al. (2021)은 기상청 기후예측시스템(Global Seasonal Forecasting System version 5, GloSea5)의 앙상블 수를 한 초기시간당 3개에서 14개로 5배 가까이 증가시켜, 여름과 겨울 계절 예측에 사용되는 앙상블을 총 12개에서 56개까지 늘렸다. 그리고 이를 과거 20년 기간에 대해 생산하여 앙상블 증가에 따른 기온, 기압, 강수 변수들의 오차와 상관계수, 신호대 잡음비 등의 개선도를 분석하였으며, 변수별로 앙상블 증가에 민감한 지역과 패턴을 제시하였다. 결과적으로 앙상블 증가에 따라 개선도가 크게 나타난 지역은 강수를 제외하고는 모두 고위도 지역으로 나타났다. 강수의 경우는 평균 강수량 및 변동성이 큰 적도 지역이 앙상블 증가에 따른 개선도가 컸다.

이와 관련하여 Eade et al. (2014), Scaife et al. (2014), Scaife and Smith (2018)는 기후예측시스템에서의 앙상블 예측 스킬(상관계수)을 평가하면서, 겨울철 고위도 특히 북대서양의 NAO (North Atlantic Oscillation) 진동에 영향을 받는 지역의 예측 스킬이 상대적으로 좋은 신호대잡음의 역설(Signal-to-Noise Paradox)을 이야기하였다. 신호대잡음의 역설에 대해서는 3장에서 기술할 것이지만, 핵심은 기후예측시스템의 이론적인 최대 잠재 예측 스킬보다 실제 예측스킬이 더 좋은 역설적인 경우가 있음을 지적한 것이다. 그리고 왜 잠재 예측 스킬이 낮게 평가되었는지에 대한 질문으로부터, 기후예측시스템이 원격상관에 반응하는 시그널이 너무 약한 한계를 지적하고 있다. 그리고 신뢰도 있는 계절 예측을 위해서는 많은 앙상블 멤버를 생산하여 가능한 노이즈를 모두 줄이고 최대한 활용 가능한 시그널을 확보하는 것이 필요함도 제안하고 있다.

이렇듯 신호대잡음의 역설은 기후예측시스템의 근본적인 예측성 개선을 위한 실마리를 제안하고 있는 중요한 개념이다. 국내 연구에서는 아직 이에 대해 분석되거나 논의된 바가 없어 이 논문에서 그 개념과 선행 연구를 자세히 정리하고자 한다. 그리고 기상청기후예측시스템을 활용하여 앙상블을 확대한 실험(Park et al., 2021)을 가지고, 이 역설적인 특징이 앙상블 확대에 따라 어떻게 향상되어 가는지에 살펴보았다. 특히 선행 연구의 중심이 되었던 겨울철 북대서양의 NAO 지역뿐만 아니라, 북극진동의 영향을 받는 북태평양 지역도 이와 같은 역설적인 특징이 나타나는지 살펴보고, 이 외 다른 지역별 특징도 함께 비교 기술하였다. 최종적으로는 기후예측시스템에서 앙상블을 증가시켰을 때 계절별 지역별 실제 예측 스킬과 최대한 도모할 수 있는 잠재 예측 스킬을 살펴보고자 하였으며, 동아시아와 이외 각 지역에서 기후예측에 활용 가능한 시그널의 특징을 제시하고자 하였다.

선행 논문들에서 기상청 기후예측시스템(GloSea)의 앙상블 생성 방법에 대하여 많이 소개하고 있으나(Ham et al., 2017; Ham et al., 2019; Kim et al., 2021a; Kim et al., 2021b; Park et al., 2021; Hyun et al., 2022), 주로 시간지연을 통한 개별 앙상블의 생산과 이를 다소 복잡한 체계로 평균하고 아노말리를 생산하는 구조에 대해 주로 초점을 맞추어 설명하고 있다. 따라서 이 논문에서는 앙상블 생성 방법 중 추계물리 앙상블 생성법에 대해 좀 더 초점을 맞추어 소개하고자 한다. 이어 신호대잡음 역설에 대한 내용을 자세히 소개하고, 이 후 그 특징적인 모습을 확인해 보았다.


2. 불확실성의 반영을 위한 앙상블 생성 기법

모델이 예측 결과를 생산하는 과정에서 발생하는 불확실성은 정확하지 않은 초기조건에서도 올 수 있고, 완전하게 알지 못하는 모델의 내부과정, 즉, 역학과정, 물리모수화 과정 그리고 결합 과정들에서도 올 수 있다. 기후예측시스템에서는 이 중 초기조건에서 오는 불확실성을 반영하기 위하여 초기장의 날짜를 달리하여 다른 리드타임의 예측을 앙상블 평균하는 시간지연(Time-Lagged) 방법을 사용하고, 내부과정에서의 오는 불확실성을 반영해 주기 위해 물리과정 방정식에 통계적 섭동을 주는 추계물리(Stochastic Physics)방법을 혼합하여 앙상블을 생산한다.

2.1 시간지연법(Time-Lagged)

기상청 기후예측시스템의 예측장은 매일, 과거 기후예측장의 경우는 각 달에 4번(1st, 9th, 17th, 25th) 예측 결과를 생산한다. 그리고 초기조건에서 오는 불확실성을 반영하기 위하여, 앙상블 평균 시 특정 기간의 시간 범위를 두고 그 기간 동안 시간 지연된 결과를 모두 사용하여 앙상블 평균하는 방법을 사용한다.

가까운 기간을 예측할 수록 짧은 시간범위를, 긴 기간을 예측할 수록 긴 시간범위를 쓰게 되는데, 예를 들어 주별로 예측을 할 때에는 최근 일주일 이내의 결과를, 월별 예측을 할 때에는 최근 한 달 이내의 결과를 사용하여 앙상블 평균에 사용하는 식이다. 시간범위를 길게 할수록 더 많은 앙상블을 확보할 수 있겠으나 먼 날짜의 초기장을 쓴 결과가 포함되게 되고, 반대로 짧은 시간범위를 쓸 수록 앙상블 수는 적어지는 대신 최근 초기장 만을 사용한 예측 결과를 얻을 수 있다. 이는 가까운 기간의 예측 일수록 초기 시간이, 먼 기간 일수록 초기 시간보다는 앙상블의 수가 더 중요하게 작용하는 것을 반영하고 있기 때문이다.

참고로 현업에서 과거 기후 예측장을 매일 생산하지 않고 한 달에 4번만 생산하는 이유는, 기후 평균을 생산하기 위하여 수십 년간 매일의 앙상블을 생산하는 것은 전산 자원이 너무 많이 들기 때문이다. 또한 이를 위해서는 초기장을 위한 재분석 또한 과거 모든 날짜에 대해 생산되어야 하는데, 대기의 경우는 초기장으로 사용되는 ECMWF (European Centre for Medium-Range Weather Forecast) 재분석이 매 일자에 있지만, 해양의 경우는 따로 자료동화를 통해 재분석장을 생산해야 한다. 그리고 해양 모델의 버전이 업그레이드 되면, 이 때마다 새로운 재분석을 다시 생산해야 하는 부담도 매우 크다. 따라서 효율성을 위해 최소한의 일자에 대해서만 재분석 자료를 생산하는 전략을 취하고 있는데, 한 달에 4번 해양 재분석장을 생산하여 초기화 함으로써 어떠한 날짜에 앙상블 평균을 하더라도 가장 멀리 떨어진 초기장 날짜가 일주일이 넘지 않도록 하고 있다.

한 달에 4번이라고 하여도 20~30년의 기후기간 동안 매 달 80~120개의 앙상블이 생산되므로 이 결과를 평균하여 모델 기후값을 생산하는 데에는 전혀 무리가 없다. 또한 과거 기후예측장을 가지고 모델의 계절 예측 성능을 평가할 때에도 최근 한 달 간의 초기장, 혹은 연구 목적에 맞는 초기장을 선택하여 계절 예측성을 평가하는 데에 무리가 없다. 오히려 계절 예측에 있어 초기화 횟수를 늘리기보다는 같은 자원을 사용한다면 과거 기후평균 기간을 더 늘리는 것이 계절 예측 신뢰도를 높이는 데 더 효율적임을 Hyun et al. (2020)은 제시한 바 있다.

그러나 과거 기후예측장을 가지고 계절내 예측 성능을 보고자 할 때에는 최근 일주일 이내에 초기장을 사용하게 되는데, 7~9일 간격으로 띄워져 있는 결과로는 한 날짜의 예측 밖에는 사용하지 못하게 되고 앙상블의 수가 현저하게 적어진다. 기후예측시스템이 애초 계절 예측을 목표 구성되었으나 그 예측 범위와 중요성이 계절 내까지 확장되어 내려오면서 고려되어야 할 부분이라고 하겠다.

또한 기후예측시스템을 현업 운영하고 있는 세계 다른 기관들 또한 초기화 하는 날짜나 앙상블 하는 전략을 다르게 구성하고 있어서 모델 성능을 서로 비교 분석하는데 걸림돌이 되고 있기도 하다. 향후 기상청의 전산 자원이 더 확보되고 해양재분석에 대한 자료동화시스템이 운영될 수 있다면, 과거 기간에도 매일 초기화 한 앙상블을 생산하고, 계절 내 예측성을 위한 분석과 활용을 고려해 볼 수 있을 것이다.

기상청 기후예측시스템의 시간지연을 통한 앙상블의 생산과 이를 평균하여 아노말리를 생산하는 자세한 구조에 대해서는 선행 논문들을 참고 할 수 있다(Ham et al., 2017; Ham et al., 2019; Kim et al., 2021a; Kim et al., 2021b; Park et al., 2021; Hyun et al., 2022).

2.2 추계물리법(Stochastic Physics)

모델 내부 과정에서 오는 불확실성은 모델 역학 과정(차분이나 적분, 수송, 안정화 과정)이나, 모델 물리 과정 모수화(장단파 복사, 대류, 미세구름물리, 대기조성, 경계층, 난류 혼합, 중력파 항력 모수화), 결합 과정(대기, 지면, 해양, 해빙)으로부터 발생하게 된다. 그리고 이 중 물리과정 모수화로부터 오는 불확실성은 해상도의 한계로 인하여 방정식 근사를 피할 수 없기 때문에 발생하는 것이며, 에너지 과정이 업스케일 되는 과정에서 더욱 크게 증폭될 수도 있다.

기상청 기후예측시스템의 대기모델인 통합모델(Unified Model, UM)에서는 이러한 모수화 과정에서의 불확실성을 반영하기 위해 초기에 랜덤 파라메터 기법(Random Parameter scheme, RP)과 추계적 대류와도 기법(Stochastic Convective Vorticity scheme, SCV)이 개발되어 사용되었으며, 다음으로 추계적 운동에너지 후방산란 기법1 (Stochastic Kinetic Energy Backscatter scheme version 1, SKEB1)이 사용되었다. 그리고 이 후 SKEB1에 대류와 이류과정에서 가정된 운동에너지 손실 효과를 포함하여 SKEB2 (Stochastic Kinetic Energy Backscatter scheme version 2) 로 향상되었으며, 이 후 추계적 섭동 경향 기법(Stochastic Perturbed Tendencies scheme, SPT)이 통합되었다(Beare et al., 2019).

이러한 방법들에서는 불확실성에서 오는 섭동을 반영해 주기 위해 랜덤 넘버(Random Number) 방정식을 사용한다. 랜덤 넘버의 순서는 랜덤 시드(Random Seed)에 의해 조정되며, 예측 가능한 순서를 따르게 된다. 랜덤 시드는 컴퓨터 클락 타임에 기반하여 생산될 수도 있고 예측 날짜, 특정 앙상블 멤버 수에 의해 생산될 수도 있으며 사용자가 정해줄 수도 있으나 기상청 현업 기후예측시스템(GloSea)에서는 앙상블 멤버 수에 의해 랜덤 시드가 정해지도록 되어 있다. 랜덤 넘버가 앙상블 넘버에 따라 예측 가능한 순서를 따르게 됨으로써 예측이 실패하여 재실행 하였을 때에도 똑같은 결과가 재 생산될 수 있게 된다(Beare et al., 2019).

GloSea에서 사용되고 있는 추계물리 앙상블 생성기법은 누락된 에너지를 바람 증분의 형태로 더해주는 운동에너지 후방산란 기법2 (Stochastic Kinetic Energy Backscattering scheme version2, SKEB2; Shutts, 2005; Bowler et al., 2009; Tennant et al., 2011)와 U, V, T, Q의 경향 방정식(tendency equation)에 섭동을 더해주는 추계적 섭동 경향 기법(Stochastic Perturbed Tendencies scheme, SPT)을 이용하는데, 2022년 이전까지 현업 운영된 GloSea5의 경우는 SKEB2만을, 2022년부터 업그레이드 되어 현업 운영되고 있는 GloSea6의 경우는 SKEB2와 SPT를 같이 사용하고 있다. 따라서 이곳에서는 두 방법을 모두 소개하도록 하겠다(Shutts, 2005; Shutts and Palmer, 2007; Berner et al., 2009; Palmer et al., 2009; Sanchez et al., 2016; Beare et al., 2019).

a) SKEB2

SKEB2는 모델에서 누락된 운동 과정, 즉 모델 내부의 수평확산과 이류과정에서 과도하게 소산되는 운동에너지의 일부를 재도입하는 추계적 기법 중 하나이다(Shutts, 2005; Palmer et al., 2009; Beare et al., 2019).

실제로 대기에 존재하는 물리과정에서 에너지는 작은 규모에서 큰 규모의 흐름으로 업스케일 되기도 반대로 다운스케일 되기도 한다. 이러한 업, 다운스케일되는 에너지의 범위는 정량화도 어렵고 적절하게 모델링 하기도 어렵다. 특히 수치모델에서 업스케일 요소는 포함되고 있지 못하며, 모의되지 못하는 작은 규모의 에디 에너지들은 열의 형태로 확산·소멸하게 된다. 예로 대류과정, 특히 큰 중규모 대류 복합체의 대류과정에서 질량플럭스(mass-flux)와 배기(detrainment)과정은 운동에너지의 소스로써의 역할을 하지만, 모델에서는 이러한 과정들이 포함이 되지 못하고 운동에너지의 순손실을 초래하게 된다. 따라서 에너지 후방산란 기법에서는 이러한 운동에너지 소스를 찾아 다시 모델에 주입하는 방법으로 누락된 과정에 의한 불확실성을 고려하게 된다. 후방산란 알고리즘의 물리적인 정의는 Shutts (2005)를 따르며, 이를 적용하여 실행한 결과는 Berner et al. (2009)을 참고할 수 있다.

후방산란 에너지는 모델에서 바람 증분의 형태로 들어가게 되는데, 대기를 계산하는 서브루틴의 매 타임스텝마다, 모델 물리과정에서 이 증분을 계산하여 유선함수의 강제력 함수인 에 다음과 같이 반영해주게 된다.

Fφ=bRD12F*(1) 

bR는 후방산란 비율로써 스케일링 계수이며, D는 누락된 운동에너지의 총 국지소산율을 추정한 값이다. F*가 시간에 따라 변하는 랜덤 패턴장으로써, 공간적인 하모닉스로 표현되는 스펙트럼 값이다. 이 값은 자기 회귀식을 써서 계산하는데, 이를 통해 단위 면적당 에너지 후방 산란율을 정의하여 반영하게 된다.

F*(t+Δt)=ϕF*(t)+ρη(t)(2) 

여기서 ϕ∆t시간 동안 점차 자기 상관이 점차 약해지는 것을 반영하는 값으로 지수적으로 감소하도록 작용한다. ρ는 스펙트럼 파워의 공간 상관 값으로, 여기에 랜덤 수 η가 곱해져 불확실성에 의한 섭동 효과를 반영하게 된다.

b) SPT

SPT 기법은 모델 격자 규모 내에서 발생하는 물리 과정들로 인한 변동의 평균적인 효과를 반영한 것으로써, 다음과 같이 간단히 물리 모수화 과정에서의 경향 방정식에서 섭동을 더해준다(Shutts and Palmer, 2007; Sanchez et al., 2016; Beare et al., 2019).

dXdt=Rx+Px+FψPx(3) 

즉, 예단 변수 U, V, T, Q의 경향 방정식에서 통계적인 강제력 패턴 값, FΨ·Px을 추가하는데 여기서 X는 모델의 예단 변수이고, Rx는 모의 가능한 규모의 경향, Px는 격자보다 작은 모수화 규모의 경향이다. 즉 모수화 된 경향 값, Px에 통계적 강제력 패턴 값, FΨ을 곱하여 섭동을 주는데 FΨ은 앞서 SKEB2 방법에서 사용한 값과 비교하여 스펙트럼 파워를 계산하는 함수를 다르게 사용하는 것 외에는 기본적으로 같은 방법을 써서 구한다.

이 방법은 간단한 방법임에도 불구하고, 앙상블 예측시스템에서의 물리 모수화 과정에서 불확실성을 성공적으로 잘 표현하고 있으며, 앙상블 스프레스를 증가시키고 앙상블의 에러를 낮추는데 도움이 되고 있다고 알려지고 있으며(Buizza et al., 1999; Charron et al., 2010), 대류 규모의 고해상도 모델에서도 적용되어, 미세물리과정이나 난류 에디와 관련된 불확실성을 표현하는 데에도 사용되고 있다. 참고로 SPT와 SPPT(Stochastically Perturbed Parametrization Tendencies)는 유사한 방법으로 SPPT는 U, V, T, Q의 연직적인 경향 프로파일에 비례하여 섭동을 줌으로써 불확실성을 표현한 방법이다(Palmer et al., 2009).


3. 신호대잡음의 역설

3.1 개념

신호대잡음의 역설(Eade et al., 2014; Scaife et al., 2014; Scaife and Smith, 2018)은 기후 모델에서의 예측가능요소(Predictable Components, PC)를 평가하면서 여기서 나타나는 역설적인 모습을 지적한 것이다.

예측 가능 요소라는 것은 불확실성을 항상 내포하고 있는 앙상블 예측에서 예측 가능한 시그널의 크기를 보는 값으로써, 총 분산(시그널 +노이즈 분산)에 대한 시그널 분산의 비로 다음과 같이 정의할 수 있다.

PC=VARsignal /VARtotal : 'predictable component'

그리고 어떤 한 변수에 대하여 모델의 예측가능요소(PCmod)를 관측의 예측가능요소(PCobs)와 비교한 비를 예측가능요소비(Ratio of Predictable Component, RPC)라고 하며, 다음과 같이 정의할 수 있다.

RPC=PCobsPCmod (4) 

RPC는 관측대비 모델에서 노이즈에 대한 시그널의 크기를 가늠하는 지수로써, 앙상블 예측 시그널 크기의 적절성을 평가하는 값이라고 할 수 있겠다.

3.2 예측가능요소비의 계산

예측가능요소비(RPC) 계산을 위해서는 예측가능요소(PC)를 구해야 하고, 이를 위해 먼저 총 분산(VAR)를 다음과 같이 구한다.

변수 x에 대하여 m 번째 멤버의 n 번째 해 값을 xm, n이라고 하면 x-은 모든 개별 멤버들을 전체 평균이며, <x n>은 각 해에 개별 멤버들의 앙상블 평균으로 아래와 같이 정의할 수 있다.

x-=1NMnNmMxm,n(5) 
x  n=1MmMxm,n(6) 

그렇다면 총 분산 VARtotal은 모든 각 개별 멤버들 값에서 전체 평균을 빼서 구한 분산을 의미한다. 시그널의 분산 VARsignal은 앙상블 평균에서 전체 평균을 뺀 분산이며, 노이즈 분산 VARnoise은 각 개별 멤버들에서 앙상블 평균을 뺀 분산이다.

VARtotal =σtot 2=1NMnNmMxm,   n-x-2(7) 

: ensemble members variance about total mean, ‘signal + noise’

VARsignal =σsig 2=1NmmMxn-x-2(8) 

: ensemble mean variance, ‘signal’

VARnoise =σnoi 2=1NMnNmMxm,n-x  n2(9) 

: ensemble members variance about ensemble mean, ‘noise’

그리고 모델의 예측가능요소(PCmod)는 전체 분산 대비 시그널 분산 비의 제곱근으로 다음과 같이 계산한다(Eade et al., 2014).

PCmod =VARsignal /VARtotal =σsig 2/σtot 2=σsig 2/σsig 2/σnoi 2(10) 

: ‘predictable component’

참고로 신호대잡음비(Signal-to-Noise Ratio)는 노이즈 분산에 대한 시그널 분산의 비(S/N = VARsignal/VARnois = σ2sig/σ2noi)로 구하는데, 예측가능요소와 신호대잡음비는 노이즈에 대한 시그널 크기를 가늠하는 같은 개념의 값이라고 할 수 있겠다.

이제 다음으로 RPC 계산을 위해 관측의 예측가능요소(PCobs) 값을 구해야 하는데, 우리는 관측에서 실제로 무엇이 시그널이고 무엇이 노이즈인지 직접적으로 알 수가 없다. 선행 논문들에서는 관측에서 시그널과 노이즈를 뽑아내기 위해 장주기(low frequency) 변동성을 시그널로 보고, 단주기(high frequency) 변동성을 노이즈로 보아 계산하기도 하였다(Boer, 2011). 그러나 반드시 장주기의 변동성이 예측가능한 시그널이고 단주기 변동성이 노이즈라는 관계가 있을 필요가 없을 것이다. 따라서 Eade et al. (2014)은 관측과 모델 예측 간의 상관계수 제곱(r2)이 모델에 의해 설명되는 관측 변동성을 반영한다는 사실을 이용하여 PCobs를 관측과 모델 간 상관, r로 정의하고(Eade et al., 2014), 다음과 같이 RPC를 계산하였다.

RPC=PCobsPCmod rσsig 2/σtot 2(11) 

다만 여기서 PCobsPCmod rσsig 2/σtot 2와 같이 실제 RPC 값인 PCobsPCmod 에 비해 rσsig 2/σtot 2 값이 더 작을 수 있다고 부등 표시한 것은, 상관계수 r 값이 향후 모델의 개선이나 앙상블 수의 증가 등으로 더 좋아질 수 있기 때문에 현재 계산되어 보여주고 있는 RPC 값이 향후에는 더 커질 수 있다는 의미를 내포하고 있다.

3.3 예측가능요소비의 역설적 특징과 해석

RPC에서 분모의 모델 예측가능 시그널이 크다는 뜻은 모델이 관측을 잘 예측하여 분자의 상관계수 값도 커진다는 것을 의미하며, 모델 예측가능 시그널이 작다는 것 그 반대를 의미하므로 이상적인 경우 RPC값은 1이어야 한다고 본다. 하지만 기후예측시스템에서 RPC가 1보다 작은, 모델의 예측가능 시그널이 작은 경우가 발견되는데 그 이유는 앙상블의 수가 너무 적거나, 모델 스프레드가 충분치 않아 모델이 잘못된 과신 예측을 하는 경우 혹은 모델의 구조적인 에러가 존재하여 원격상관을 잘 예측하지 못하거나, 제대로 초기화 되지 못하고 초기 쇼크가 있는 모델 개선이 필요한 원인을 생각할 수 있다(Scaife and Smith, 2018). 이러한 문제는 전산 자원이 점차 확보됨에 따라 더 많은 앙상블 수를 확보하고, 좀 더 정교한 자료동화와 결합 자료동화를 시도함으로써 해결해 나가고자 하고 있다.

반면 RPC가 1보다 큰 경우는 모델의 노이즈가 크고 모델의 예측가능 시그널이 약하여 모델의 잠재적 예측 스킬이 낮음에도 불구하고, 실제 관측을 예측한 스킬은 좋게 나타나는 경우이므로 일반적으로 생각하기 힘든 경우이다. 그런데 Eade et al. (2014), Scaife et al. (2014), Kang and Lee (2017), Scaife and Smith(2018)에서는 특히 북대서양의 NAO 변동성과 연관된 지역의 기압 변수에서 RPC가 1보다 큰 경우가 나타남을 보이고, 이를 역설적이라고 이야기하고 있다. 이러한 현상이 나타나는 이유에 대하여는, 기후변동성에 반응하여 나타나는 상관으로 인하여 분자의 관측과 모델 간 상관계수 값은 크게 나타나지만, 모델 반응의 크기는 매우 약하여 분모가 매우 작게 나타나는 것으로 분석하고 있다.

여기서 예측가능요소, σsig 2/σsig 2/σnoi 2은 노이즈에 대한 시그널의 크기를 가늠하는 잣대로 사용되는 개념이므로 ‘신호대잡음의 역설(Signal-to-Noise Paradox)’로 이름 붙인 것으로 사료된다.

3.4 잠재 예측 스킬(퍼펙트 예측 스킬)

식(11)에서 관측의 예측가능요소를 상관의 개념을 도입하여 정의한 것처럼, 모델의 예측가능요소를 마찬가지로 상관의 개념을 도입하여 다시 쓸 수 있다. 즉, 자기 자신의 개별 앙상블을 관측처럼 취급하여, 앙상블 평균과 각 개별 앙상블들 간의 상관을 구한 평균으로 PCmod를 정의하면, 다음과 같이 RPC를 바꿀 수 있다.

RPC=PCobsPCmod=rmormm(12) 

여기서 rmo은 모델이 관측을 예측한 스킬이며, rmm은 모델이 자기 자신을 예측한 스킬로써 모델이 예측할 수 있는 최대한의 잠재 예측 스킬이라고 보며, 퍼펙트 모델(perfect model)의 스킬이라고도 한다. rmo는 모델의 앙상블 평균과 관측과의 상관계수 값이며, rmm은 모델의 앙상블 평균과 모든 개별 앙상블 멤버 간의 상관계수를 구하여 평균한 값이다.

이 개념을 도입하여 다시 생각해보면 RPC가 1보다 크다는 것은, 모델의 잠재 예측 스킬보다도 실제 관측을 예측했을 때 스킬이 더 좋다는 것을 의미한다. 이는 반대로 모델 예측성의 한계라고 생각하고 있는 잠재 예측 스킬이 과소 추정되고 있다는 것을 지적하고 있기도 하다(Scaife and Smith, 2018).

현재로써는 기후예측시스템에서 이러한 역설적인 특징이 나타나는 지역의 시그널이 매우 작음을 감안하여 예보에 참고하고, 이를 증폭 보정하는 방법을 고려해 볼 수 있을 것이다. 그러나 근본적으로는 왜 시그널이 약하며, 어떻게 하면 이 시그널을 강화시킬 수 있는지를 알 수 있다면 모델 개선에 크게 기여할 수 있을 것이다. 한편으로는 약한 시그널을 최대한 확보하기 위하여 노이즈를 최대한 감소시킴으로써 불확실성을 줄여야 한다고 보고, 예측시스템에서 전산 자원이 가능한 최대한의 앙상블 멤버를 확보해야 함을 이야기하고 있다.

이러한 신호대잡음의 역설은 언급한 바와 같이 주로 북대서양 NAO 지역에 초점을 맞추어 논의되었다. 그러나 동아시아 기후예측에 직접적인 영향을 주는 북태평양 역시 북극진동의 영향을 받는 지역이며, 적도-중위도 SST의 원격상관과 중위도 극제트 진동의 상호작용이 밀접하게 연관되어 있는 지역들이다. 따라서 기상청 기후예측시스템의 앙상블 예측 결과를 활용하여 RPC의 전지구적인 분포 특징을 북태평양과 이외 다른 지역으로 확장하여 보고자 하였다. 여름과 겨울의 각 계절적인 특성을 나누어 살펴보았으며, 앙상블 확대에 따라서도 어떻게 개선되는지 분석하였다.


4. 분석 자료

현업으로 운영되는 기후예측시스템에서는 실시간 예측/과거 기후예측에 대하여, 매일/한 달 4회(1st, 9th, 17th, 25th)의 예측 결과를 생산한다. 그리고 이들을 평균하여 앙상블 계절 예측을 생산할 때에는 3주/가까운 4개(약 한 달)의 시간 지연된 초기장을 사용한다. 그리고 각 예측 초기 날짜당 다시 추계물리 방법에 따라 섭동을 주어 여러 개의 앙상블을 생산하는데, 이 연구에서는 GloSea5의 과거 기후예측장의 추계물리 앙상블 수를 21년 현업 운영 당시 생산하던 3개에서 14개까지 늘려 5월과 11월 과거 20년(1991~2010년)기간에 대해 확대 생산한 결과를 이용하여 하였다.

이처럼 과거 기후예측장은 예측장에서 과거 기후예측장의 평균을 빼서 모델 구조적 오차를 보정하는데 사용되지만, 그 자체로도 기후기간 동안의 평균적인 예측성을 평가하는 자료로 활용되게 된다. 이 논문에서는 계절 예측에 초점을 맞추어, 타겟으로 할 계절(여름과 겨울)의 이전 한 달간 4번의 초기장을 사용한 예측 결과를 사용하였다. 따라서 한 계절 예측에 사용된 앙상블 수는 4회 초기 날짜당 최대 14개의 추계물리 앙상블로 총 56개이다.


5. 결 과

5.1 전지구 RPC 분포

Figure 1은 기후예측시스템 해면기압의 겨울과 여름 계절 예측에서 나타난 RPC의 전지구 분포이다. 먼저 Fig. 1a에서 겨울철 북대서양 북위 60도 이상 지역(NA)을 중심으로 선행 연구들에서 논의된 RPC가 1보다 큰 값이 가장 강하게 나타남을 확인 수 있었다. 반면 Fig. 1b에서 여름에는 위치를 옮겨 북태평양(NP)과 북극지역에서 뚜렷하게 1보다 큰 값이 나타남을 알 수 있으며, 남극 지역 전체적으로도 1보다 큰 값이 나타난다. 계절에 무관하게 시베리아 내륙(SB)은 0에 가까운 매우 작은 값을 보이고 있었으며, 적도 태평양(TR)과 적도 인도양에서는 1값을 유지하고 있었다. 그리고 이외에 다른 지역별로 1보다 크거나 작은 값으로 계절에 따라 변동하고 있다. 한반도는 겨울에는 시베리아 내륙의 영향으로 1보다 작은 값을 반대로 여름에는 북태평양의 영향으로 1보다 큰 값을 가지며 두 지역의 경계에 서 있는 것을 볼 수 있다. 이들 각 지역별의 계절에 따른 특징은 이후 5.3절에서 살펴볼 것이며, 특히 네모로 영역 표시된 지역에 초점을 맞추어 대별되는 특징을 살펴보고자 하였다.

Fig. 1.

Spatial distribution of the Ratio of Predictable Component (RPC) for (a) DJF and (b) JJA.

5.2 기후예측시스템의 예측 스킬 분포

RPC가 이러한 분포를 가지는 원인을 살펴보기 위해 Fig. 23에서는 RPC 계산에 사용된 (a) 시그널(Eq. 8) 분산과 (b) 노이즈에 해당하는 전체 분산(Eq. 7), 그리고 노이즈 대비 시그널의 크기를 가늠하는 (c)모델의 예측가능요소(Eq. 10)와 (d) 관측의 예측가능요소(상관)을 각 여름과 겨울에 대하여 살펴보았다.

Fig. 2.

Spatial distribution of (a) Signal and (b) Total variance, Predictable Component of (c) model and (d) observation (correlation) for DJF.

Fig. 3.

Same as Fig. 2 except for JJA.

Figure 2a에서 겨울 전지구적으로 뚜렷하게 나타나는 시그널은 북태평양 알류샨 저기압이었다. 그러나 이 지역은 노이즈 또한 매우 커서(Fig. 2b) 전체분산대비 시그널의 크기는 적도가 훨씬 강하게 나타난다(Fig. 2c). 시그널은 또한 양 반구의 극지역과 해양성 대륙과 호주 몬순 지역 그리고 남극순환류 지역에서 나타나고 있다. 그러나 전체 분산은 극지역을 중심으로 특히, 특히 북극과 북극 진동의 영향을 받는 알류샨 저기압과 NAO 지역에서 매우 강하여, 시그널이 약한 북반구 고위도와 극지역으로 예측 스킬이 떨어질 수 밖에 없음을 짐작할 수 있었다.

Figure 2c는 모델의 예측가능 요소값이기도 하지만 충분히 많은 앙상블로 계산되었을 경우 3.4절에서 설명하였듯이 모델이 가질 수 있는 최대한의 잠재 예측스킬에 해당하는 값이기도 하다. 따라서 Fig. 2c에서 겨울철 예측시스템에서 기대할 수 있는 잠재적 최대 스킬이다. 현 시스템에서의 예측 스킬은 적도를 중심으로 최대 0.9이상의 값을 보이며, 점차 고위도로 갈수록 감소하고 있다. 그리고 (c)와 (d)를 비교해 보면 잠재 예측 스킬과 실제 예측 스킬의 분포가 어떻게 다른지 알 수 있으며, (d)에서 (c)를 나눈 비 값이 Fig. 1RPC 값이 된다.

겨울 해면기압의 계절예측 결과에서 잠재 예측 스킬과 실제 예측 스킬은 모두 적도 태평양와 인도양에서 최대 0.9 이상의 값을 보이고 있지만, 스킬이 점차 떨어지는 0.5에서 0.7 사이의 지역을 살펴보면, 특히 북대서양의 북극지역으로 NA 지역에서 (c)의 잠재 예측 스킬보다 (d)의 실제 예측 스킬이 높은 것을 알 수 있다. 이러한 지역에서 Fig. 1에서의 RPC가 1보다 크게 나타나고 있음을 알 수 있다. 반면에 SB 지역을 살펴보면 (c) 모델의 잠재적 스킬보다 (d) 실제 스킬이 훨씬 낮아 0.1 이하의 하얀색으로 표시된 지역도 나타난다. 이러한 지역은 일부 아메리카 대륙과 남반구 해양에서도 나타나, Fig. 1에서는 RPC가 1 이하의 파란색으로 나타나는 지역들이다.

Figure 3a3b에서 여름을 보면, 가장 강하게 나타나는 시그널은 남태평양의 남극 아문센 해 저기압에서 나타난다. 아문센 해 저기압은 남극 순환 모드인 SAM의 영향을 받아 SAM이 음(양)일 때 양(음)의 기압 편차를 가지는 특징이 있으며, 남반구 겨울철 엘니뇨와 라니냐에 의해 영향을 받는 것으로도 알려져있다(Turner et al., 2012). 따라서 이 시그널은 북반구 겨울 알류샨 저기압과 대칭적인 계절과 위치에 있는 변동성임을 알 수 있다. 그러나 이 또한 전체 분산이 남극 지역 전체로 매우 강하여 전체 분산 대비 시그널은 겨울과 마찬가지로 적도를 중심으로 더 강하게 나타난다. 북반구 북서태평양 고기압의 시그널도 나타나고 있지만 아문센 해 저기압에 비해서는 매우 약하다.

Figure 3에서 (c)와 (d)를 비교해 여름철에는 NP 지역에서의 (d) 실제 예측 스킬이 (c) 잠재 예측스킬보다 높은 특징이 나타나 있었고, NA 지역은 겨울과는 반대로 (d) 예측 스킬이 (c) 잠재 스킬보다 떨어지는 모습을 보였다.

전반적으로 잠재 예측 스킬이나 실제 예측 스킬 모두 겨울이 여름보다 높은 것을 알 수 있었다. 그리고 SB 지역은 여전히 실제 예측 스킬이 현저히 낮은 모습이 나타났다. 한반도는 겨울과 여름 모두 예측 스킬이 0.5에서 급격히 떨어지는 경계에 딱 위치하고 있다.

전체적으로 적도 SST의 영향이 닿는 중위도의 해양까지는 좋은 예측 스킬을 보이고 있었으나, 이후 급격히 스킬이 감소하여 잠재 예측 스킬 만큼의 성능을 내지 못하고 있다. 북반구에서는 시베리아의 스킬이 특히 매우 낮아서 이 지역 예측이 매우 어려움을 알 수 있다. 그리고 남북극 진동의 영향으로 극지역에서 다시 스킬이 향상되는 경향을 보인다. 겨울 북대서양이나 여름 북태평양의 스킬이 높아지는 지역은 잠재예측 스킬보다도 실제 스킬이 높아 앞서 설명한 역설적인 모습이 나타나는 지역임을 알 수 있다.

또 한가지 주목해 볼 것은 겨울과 여름 모두 웜풀지역과 동태평양에서 잠재 예측 스킬이 0.9 이상의 매우 높은 값을 보이는데, 동태평양에서 실제 예측 스킬을 보면 패턴이 다르다는 것이다. 실제 관측에서는 엘니뇨 변동성이 계절에 따라 변동하면서 중태평양에 중심을 둔 모습도 나타나는 것을 알 수 있다. 그러나 모델에서는 전형적인 동태평양 엘니뇨의 변동성을 강하게 모의하고 있다는 것을 알 수 있었다.

선행연구에서는 주로 겨울철 북대서양을 중심으로 RPC의 특징을 살펴보았으나, 여름철 북태평양 지역에서 나타나는 RPC의 특징과 모든 계절에서 현저히 낮은 스킬을 보이는 시베리아 지역, 그리고 항상 높은 값이 나타나는 적도 지역을 중심으로 하여 지역별 특징을 다음 장에서 살펴보고자 하였다.

5.2 지역별 특징

각 지역별 특징을 좀 더 자세히 알아보기 위하여 RPC가 역설적으로 강하게 나타나는 지역을 선정하여 평균적인 분포를 보고자 하였다. 앞선 그림들에서 네모로 표시된 지역은 여름과 겨울 RPC가 크게 나타난 북대서양(NA)과 북태평양(NP) 지역이다. 그리고 이들 지역과 대비되는 특징을 살펴보기 위하여 전지구(GL)와 RPC가 항상 작은 시베리아 내륙(SB), RPC가 항상 1에 가까운 적도 태평양(TR)을 함께 선정하였다.

Figure 4a에서 기상청 기후예측시스템의 전지구 평균 해면기압 계절예측 스킬은 단일 앙상블 일 때 약 0.4의 값을 가지다가, 앙상블이 12개가 되었을 때 0.5에 이르러서 앙상블이 확대됨에 따라 계속 증가하고 있다(빨간색). 여름보다는 겨울의 스킬이 조금 더 높았다.

Fig. 4.

Global averaged (a) Predictable Component of model (yellow) and observation (red), and their ratio (RPC, blue), and (b) Signal (green), Noise (pink) and Total (violet) variance against ensemble size. Solid lines for JJA, and dashed for DJF.

예측 가능 요소(노란색) 곡선은 점차 하향하여 앙상블이 최대로 커졌을 때 0.5에 가까이 이른다. 이는 시그널의 크기가 감소한다고 해석하기 보다는 충분히 많은 앙상블이 생산되기 전까지는 점차 수렴해간다고 해석하는게 맞다. Figure 4b는 각각의 시그널, 노이즈 그리고 전체 분산을 나타낸 것인데 앙상블 수가 작을 때에는 시그널에서 노이즈가 분리되지 않아 시그널 분산이 크게 계산되고, 모델이 과신 예측을 하고 있다. 이 후 앙상블이 증가하면서 노이즈와 시그널 모두 수렴 값에 이른다. 보라색의 시그널과 노이즈 분산을 합친 전체 분산의 크기는 앙상블이 증가하여도 거의 일정함을 알 수 있다. 그리고 시그널이 수렴에 이른 값은 모델의 잠재 예측 스킬에 해당하므로, 겨울과 여름의 최대로 기대 할 수 있는 예측 스킬이 각각 0.53/0.57임을 알 수 있다. 그리고 앙상블을 56개까지 확대하였을 때 실제 예측 스킬(빨간색)도 이와 같은 수준에 이르고 있어 RPC(파란색)는 1 값에 이른다. 전지구 해면기압의 계절예측 관점에서 보면, 한 초기시간당 3개 추계물리로 생산된 총 12개의 앙상블 수는 아직 부족하며 56개에 이르러서야 RPC 값이 1에 이르는 것을 주목할 수 있다.

Figure 5에서는 이러한 모습을 지역별로 분리하여 살펴보았다. Figure 5a는 북대서양(NA)으로 여름과 겨울 모두 모델의 잠재 예측 스킬은 0.25 밖에 되지 않는다(노란색). 실제 여름 예측 스킬(빨간색 실선)도 0.1로 이 지역 여름 예측의 어려움을 짐작 할 수 있다. 그런데 겨울은 예측 스킬이 4배 이상 증가하여(빨간색 점선) RPC가 2를 넘는 값을 보이고 있다(파란색 점선). 모델 시그널은 여름과 겨울 큰 차이가 없는데, 겨울 예측 스킬이 네 배 차이가 나는 것이다. 이 지역 겨울의 높은 예측 스킬은 겨울철 NAO 변동성과 적도, 성층권으로부터의 원격상관 상호작용으로부터 온 것이라고 판단할 수 있으나, 이것에 반응하는 시그널이 매우 약해 시그널 강도에 반영되지 못하고 있는 것으로 보고 있다.

Fig. 5.

Same as Fig. 4 (a) except for regions of North Atlantic (NA), North Pacific (NP), Siberian continent (SB) and Tropic ocean (TR).

북태평양(NP)의 여름철의 경우도 NA 지역과 마찬가지로 RPC가 2에 가까운 역설적인 값이 나타나고 있었으며, 여름철 약한 0.2의 시그널 강도에 비하여 2배에 가까운 예측 스킬을 보이고 있었다. 이는 여름철 북태평양에서도 이 지역 모델 반응은 매우 약하지만 예측에 실용적인 원격상관의 변동성이 있음을 보여주는 것이다. 다만 NP 지역의 겨울은 여름에 비하여 상대적으로 큰 시그널을 유지하고 있었는데, 이는 Fig. 2a에 보았듯이 단연 적도 ENSO와 연관된 겨울철 알류샨 저기압으로부터 온 것으로, ENSO에 의한 겨울철 북태평양의 변동성은 모델에서 상대적으로 그 시그널이 약화되지 않고 잘 전달되고 있음을 알 수 있다.

남극해 아문센 저기압 지역은 NP와 계절적으로 대칭적인 모습이 나타나는지 살펴 보았으나, 두 계절 모두에서 잠재 예측 스킬도 크고 실제 예측 스킬도 잠재 예측 스킬과 유사하게 나타나 전지구 평균과 유사한 모습을 보였다(그림 생략).

시베리아 지역(SB)은 항상 RPC가 매우 작게 나타나는 지역이었다(Fig. 5c) 이 지역 잠재 예측 스킬은 여름 0.5, 겨울 0.34로 북대서양이나 북태평양에 비해 크게 약하지 않으나 실제 예측 스킬이 0.2를 넘지 못하고 있으며, 앙상블 확대에도 크게 좋아지지 못하고 있다. 그리고 다른 지역들과 다르게 겨울보다 여름 예측 스킬이 더 좋은 것을 알 수 있다(Fig. 5c). SB 지역은 토양수분이나 토양온도 그리고 눈의 지면 과정에 민감한 지역이나 관측이 잘 확보되어 있지 못하고, 제트의 움직임도 활발한 지역으로 지면 과정 등의 초기화나 모델 개선이 더욱 필요한 지역임을 알 수 있겠다. 시그널이 매우 큰 적도의 TR 지역은 단일 앙상블 예측에서 이미 0.8의 예측 스킬을 보이고 있으며 지속적으로 RPC가 1의 값을 유지하고 있다(Fig. 5d). 적도 해양을 기후 예측성의 원천이라고 칭하는 이유를 확인 할 수 있었다.


6. 논 의

이 논문에서는 신호대잡음의 역설에 대한 개념을 자세히 소개하고, 기상청 기후예측시스템의 앙상블 생성 방법을 특히 추계물리 기법에 초점을 맞추어 설명하였다. 그리고 기상청 기후예측시스템을 통해 이러한 신호대잡음의 역설적인 특징의 분포를 살펴보고, 앙상블 확대에 따라 어떻게 개선되는지 계절별, 지역별 특징을 살펴보았다.

예측가능요소비가 1보다 큰 특징은 선행연구들에서와 같이 겨울철 북대서양에서 뚜렷하게 나타났으며, 또한 여름철에는 북태평양 고기압 지역에서도 강하게 나타나고 있었다. 시베리아 내륙은 잠재 예측 스킬도 매우 낮고 시그널도 약하며 노이즈도 매우 큰 지역이었으며 앙상블을 늘려도 예측 스킬 증가에 전혀 효과적이지 못하였다. 이 지역은 계절 예측성 향상을 도모하기 힘든 지역으로 적도와의 원격상관 반응성과는 관련성이 적고 제트에 의한 노이즈가 너무 크며 지면 과정 등 모델 자체의 개선이 더욱 필요한 지역으로 생각되었다. 한반도의 경우 날씨와 기후 예측에 서쪽에서 오는 시스템의 직접적인 영향을 받고 있으나 이 지역 예측성이 낮아 예측이 어려울 수 밖에 없는 한계를 확인할 수 있었다.

신뢰도 있는 기후예측을 위해서는 근본적으로 원격상관의 시그널의 반응을 강화시킬 수 있도록 모델 개선이 이루어져야 할 것이며, 또한 시베리아 대륙의 낮은 예측성 개선을 위해 지면 초기화와 지면 과정 개선 등에 노력을 기울여야 할 것으로 생각된다. 동아시아 지역은 적도뿐만 아니라 북극진동과 관련된 북태평양의 예측 시그널을 최대한 활용할 수 있는 방법을 계속 고려해야 할 것이다. 또한 겨울철에는 북대서양의 시그널이 동아시아에 전파되어 오는 변동성을 예측에 활용하는 것이 효율적일 수 있겠으나 시베리아 지역의 예측성이 매우 낮아 전파 과정에서 이 시그널이 잘못될 수 있는 위험성도 있을 것이다.

Scaife and Smith (2018)는 기후예측시스템에서의 한계 원인과 극복을 위해 다음과 같이 논의하고 있다.

  • 1. 예측 스킬을 계산하는 많은 방법들(평균 제곱근 오차, 제곱 평균 오차, 신뢰도, 브라이어 스킬 스코어 등)이 잠재 예측 스킬에 대한 부정확한 추정치를 제공할 수 있다. 후처리 보정을 통해 시그널을 증폭시킬 수 있을 것이고, 보정 없이 모델 원시자료 그대로 사용하여 예측 스킬을 평가하는 것은 잘못된 이해를 불러 올 수도 있다. 아노말리 보정은 시그널 크기를 보정하는 데에는 효과가 없는 방법이므로, 예측 가능한 시그널을 위해 충분히 많은 앙상블을 사용하여 예측 스킬을 평가할 수 있어야 할 것이다.
  • 2. 일반적으로 예측이 과대 추정이 되고 있는 지역에서는, 추계물리를 통한 통계적인 테크닉으로 앙상블 스프레드를 늘리고 예측을 개선 할 수 있을 것이다. 하지만 신호대잡음이 너무 작고, 예측결과가 과소 추정되는 지역들에서는 이러한 통계적 방법들이 문제를 유발할 수 있는 가능성도 있을 것이다.
  • 3. 개별 앙상블 멤버를 관측처럼 두고 모델 예측 스킬을 측정하는 방법은 특정 모델에서 얻을 수 있는 예측 스킬의 상한으로 간주된다. 왜냐하면 각 개별 멤버가 예측한 결과가 모델이 자기 자신을 예측한 결과에 대한 스킬로써 완벽한 관측으로 초기화 한 상황을 따르고 있는 것으로 생각할 수 있기 때문이다. 그러나 적도와 같이 신호대잡음이 너무 큰 지역에서는, 향후 미래 개선까지 고려한 잠재적 최대 예측성을 표현한다기 보다, 모델 앙상블들에서 추가적으로 예측성이 과대 추정된 것 일 수 있다. 비슷하게, 신호대잡음이 너무 작은 지역에서는 모델이 자기 자신을 예측한 스킬보다 실제 관측을 예측한 스킬이 더 좋다는 이야기가 되고 이러한 방법은 실제보다 잠재 예측성을 과소 추정한 것이 될 것이다.
  • 4. 기후변화 등 현상의 원인규명을 위해 인간 활동으로 인한 현상을 정량화하는 방법 중, 관측 SST를 강제하여 모의한 대규모 앙상블 결과와 인간 활동 시그널을 제거한 SST를 사용한 결과를 비교하는 방법이 있다. 이러한 방법을 쓸 때에는 모델이 SST에 반응하는 진폭을 정확히 모의한다는 것을 전제로 하고 있으나 신호대잡음이 너무 작은 지역에서는 SST에 대한 반응이 잘못 나타날 수도 있다.
  • 5. 향후 수십 년의 지역기후변화를 전망한 대규모 앙상블 결과는 자연의 내부 변동성을 불확실성의 주요 원인으로 지적하고 있다. 이는 모델이 온실가스, 인위적인 에어로졸 및 오존을 포함한 외부 강제력에 올바르게 반응하고 있다는 것을 전제하고 있다. 하지만 신호대잡음의 역설이 이러한 외부 강제력에 대한 반응에도 적용이 된다면, 내부변동성의 역할이 과대 추정된 것일 수 있다.
  • 6. 비록 신호대잡음의 역설이 기후모델이 잠재적으로 가진 심각한 문제를 강조하고 있지만, 한편으로는 이전에는 예측이 불가능하다고 생각했던 매우 어려운 사례들에서 신뢰도 있는 예측이 가능함을 밝히게 해 주었다. 최대한의 예측 가능한 시그널을 추출해 내기 위해서는 대규모의 앙상블 생산이 필요할 것이며, 후처리를 통해 이 시그널의 크기를 확대할 필요가 있음에 주목할 수 있다.
  • 7. 신호대잡음의 역설을 해결하고 기후 모델에서 이를 개선할 수 있다면 전체 다수의 현상에 대한 모델 반응 강도를 높이고, 다양한 원격상관이 실제인지 여부에 대한 오랜 논쟁을 해결할 수 있을 것이다. 또한 탐지, 원인규명, 전망을 위해 사용되고 있는 앙상블의 수를 줄일 수 있을 것이며 기후 예측과 서비스 기술을 향상시킬 수 있을 것이다.

기후예측시스템의 한계와 특성을 알려주는 중요한 개념으로써의 신호대잡음의 역설에 대해 기술하고 그 특징적인 모습을 기상청 기후예측시스템의 앙상블 확대 결과를 통하여 자세히 살펴보았다. 기상청에서는 현업 예측장과 과거 기후예측장 앙상블을 확대 생산하고, 10 km 이하의 고해상도 앙상블 추가 생산을 통해 자세한 에디 등의 모의가 원격상관 시그널 강화와 예측성 개선에 도움이 되는지를 지속적으로 보고자 계획하고 있다. 이를 통해 현 기후예측시스템의 한계를 알고, 이를 극복하기 위한 여러 방면의 노력을 지속하고자 한다.

Acknowledgments

이 연구는 기상청 국립기상과학원 「기후예측 현업 시스템 개발」(KMA2018-00322)의 지원으로 수행되었습니다.

REFERENCES

  • Ahn, J.-B., J. Lee, and S. Jo, 2018: Evaluation of PNU CGCM ensemble forecast system for boreal winter temperature over South Korea. Atmosphere, 28, 509- 520, (in Korean with English abstract). [https://doi.org/10.14191/Atmos.2018.28.4.509]
  • Beare, S., W. Tennant, and C. Sanchez, 2019: Stochastic physics code in the UM. MetOffice Unified Model Doc., 81, 28 pp.
  • Berner, J., G. J. Shutts, M. Leutbecher, and T. N. Palmer, 2009: A spectral stochastic kinetic energey backscatter scheme and its impact on flow-dependent predictability in the ECMWF ensemble prediction system. J. Atmos. Sci., 66, 603-626. [https://doi.org/10.1175/2008JAS2677.1]
  • Boer, G. J., 2011: Decadal potential predictability of twentyfirst century climate. Clim. Dyn., 36, 1119-1133. [https://doi.org/10.1007/s00382-010-0747-9]
  • Bowler, N. E., A. Arribas, S. E. Beare, K. R. Mylne, and G. J. Shutts, 2009: The local ETKF and SKEB: Upgrades to the MOGREPS short-range ensemble prediction system. Quart. J. Roy. Meteor. Soc., 135, 767-776. [https://doi.org/10.1002/qj.394]
  • Buizza, R., M. Milleer, and T. N. Palmer, 1999: Stochastic representation of model uncertainties in the ECMWF ensemble prediction system. Quart. J. Roy. Meteor. Soc., 125, 2887-2908. [https://doi.org/10.1002/qj.49712556006]
  • Charron, M., G. Pellerin, L. Spacek, P. L. Houtekamer, N. Gagnon, H. L. Mitchell, and L. Michelin, 2010: Toward random sampling of model error in the Canadian ensemble prediction system. Mon. Wea. Rev., 138, 1877-1901. [https://doi.org/10.1175/2009MWR3187.1]
  • Eade, R., D. Smith, A. Scaife, E. Wallace, N. Dunstone, L. Hermanson, and N. Robinson, 2014: Do seasonalto- decadal climate predictions underestimate the predictability of the real world? Geophys. Res. Lett., 41, 5620-5628. [https://doi.org/10.1002/2014GL061146]
  • Ham, H., D. Won, and Y.-S. Lee, 2017: Performance assessment of weekly ensemble prediction data at seasonal forecast system with high resolution. Atmosphere, 27, 261-276, (in Korean with English abstract). [https://doi.org/10.14191/Atmos.2017.27.3.216]
  • Ham, H., D. Won, S.-M. Lee, Y.-K. Hyun, and Y. Kim, 2019: Performance assessment of monthly ensemble prediction data based on improvement of climate prediction system at KMA. Atmosphere, 29, 149-164, (in Korean with English abstract). [https://doi.org/ 10.14191/Atmos.2019.29.2.149]
  • Hyun, Y.-K., J. Park, J. Lee, S. Lim, S.-I. Heo, H. Ham, S.-M. Lee, H.-S. Ji, and Y. Kim, 2020: Reliability assessment of temperature and precipitation seasonal probability in current climate prediction systems. Atmosphere, 30, 141-154, (in Korean with English abstract). [https://doi.org/ 10.14191/Atmos.2020.30.2.141]
  • Hyun, Y.-K., and Coauthors, 2022: The KMA Global Seasonal forecasting system (GloSea6) – Part 2: Climatological mean bias characteristics. Atmosphere, 32, 87-101, (in Korean with English abstract). [https://doi.org/10.14191/Atmos.2022.32.2.087]
  • Kang, D., and M. I. Lee, 2017: Increase in the potential predictability of the Arctic Oscillation via intensified teleconnection with ENSO after the mid-1990s. Climate Dynamics, 49, 2147-2160. [https://doi.org/10.1007/s00382-016-3436-5]
  • Kim, S.-W., 2019: Optimal ensemble size for Sub-seasonal to Seasonal (S2S) prediction system. Unpublished master’s thesis, Seoul National University, 46 pp [Available online at https://s-space.snu.ac.kr/handle/10371/161653, ].
  • Kim, H., J. Lee, Y.-K. Hyun, and S.-O. Hwang, 2021a: The KMA Global Seasonal forecasting system (GloSea6) - Part 1: Operational System and Improvements. Atmosphere, 31, 341-359, (in Korean with English abstract). [https://doi.org/10.14191/Atmos.2021.31.3.341]
  • Kim, J.-Y., Y.-K. Hyun, J. Lee, and B.-C. Shin, 2021b: Assessment on East Asian summer monsoon simulation by improved Global Coupled (GC) model. Atmosphere, 31, 563-576, (in Korean with English abstract). [https://doi.org/10.14191/Atmos.2021.31.5.563]
  • Murphy, J. M., 1990: Assessment of the practical utility of extended range ensemble forecasts. Quart. J. Roy. Meteorol. Soc., 116, 89-125. [https://doi.org/10.1002/qj.49711649105]
  • Palmer, T. N. and R. Buizza, F. Doblas-Reyes, T. Jung, M. Leutbecher, G. J. Shutts, M. Steinheimer, A. Weisheimer, 2009: Stochastic Parametrization and Model Uncertainty. ECMWF Tech. Mem., 598, 42 pp.
  • Park, Y.-H., Y.-K. Hyun, S.-I. Heo, and H.-S. Ji, 2021: Assessment of the prediction performance of ensemble size-related in GloSea5 hindcast data. Atmosphere, 31, 511-523, (in Korean with English abstract). [https://doi.org/ 10.14191/Atmos.2021.31.5.511]
  • Raynaud, L., and F. Bouttier, 2017: The impact of horizontal resolution and ensemble size for convective-scale probabilistic forecasts. Quart. J. Roy. Meteor. Soc., 143, 3037-3047. [https://doi.org/10.1002/qj.3159]
  • Sanchez, C., K. D. Williams, and M. Collins, 2016: Improved stochastic physics schemes for global weather and climate models. Quart. J. Roy. Meteor. Soc., 142, 147- 159. [https://doi.org/10.1002/qj.2640]
  • Scaife, A. A., and Coauthors, 2014: Skillful long-range prediction of European and North American winters. Geophys. Res. Lett., 41, 2514-2519. [https://doi.org/10.1002/2014GL059637]
  • Scaife, A. A., and D. Smith, 2018: A signal-to-noise paradox in climate science. npj Climate Atmos. Sci., 1, 28. [https://doi.org/10.1038/s41612-018-0038-4]
  • Shutts, G., 2005: A kinetic energy backscatter algorithm for use in ensemble prediction systems. Quart. J. Roy. Meteor. Soc., 131, 3079-3102. [https://doi.org/10.1256/qj.04.106]
  • Shutts, G. J., and T. N. Palmer, 2007: Convective forcing fluctuations in a cloud-resolving model: Relevance to the stochastic parametrization problem. J. Climate, 20, 187-202. [https://doi.org/10.1175/JCLI3954.1]
  • Talagrand, O., R. Vautard, and B. Strauss, 1997: Evaluation of probabilistic prediction system. In Proc. of Workshop on Predictability, ECMWF, Reading, UK, 1-25.
  • Tennant, W. J., G. J. Shutts, A. Arribas, and S. A. Thompson, 2011: Using a stochastic kinetic energy backscatter scheme to improve MOGREPS probabilistic forecast skill. Mon. Wea. Rev., 139, 1190-1206. [https://doi.org/10.1175/2010MWR3430.1]
  • Turner, J., T. Phillips, J. S. Hosking, G. J. Marshall, and A. Orr, 2012: The amundsen sea low. Int. J. Climatol., 33, 1818-1829. [https://doi.org/10.1002/joc.3558]
  • Weisheimer, A., D. Decremer, D. MacLeod, C. O'Reilly, T. N. Stockdale, S. Johnson, and T. N. Palmer, 2019: How confident are predictability estimates of the winter North Atlantic Oscillation? Quart. J. Roy. Meteor. Soc., 145, 140-159. [https://doi.org/10.1002/qj.3446]
  • Weisheimer, A., 2020: Assessing the skill of long range forecast and the predictability paradox. Virtual training course: Predictability and Ensemble Forecast Systems, ECMWF, Reading, UK, 38 pp.

Fig. 1.

Fig. 1.
Spatial distribution of the Ratio of Predictable Component (RPC) for (a) DJF and (b) JJA.

Fig. 2.

Fig. 2.
Spatial distribution of (a) Signal and (b) Total variance, Predictable Component of (c) model and (d) observation (correlation) for DJF.

Fig. 3.

Fig. 3.
Same as Fig. 2 except for JJA.

Fig. 4.

Fig. 4.
Global averaged (a) Predictable Component of model (yellow) and observation (red), and their ratio (RPC, blue), and (b) Signal (green), Noise (pink) and Total (violet) variance against ensemble size. Solid lines for JJA, and dashed for DJF.

Fig. 5.

Fig. 5.
Same as Fig. 4 (a) except for regions of North Atlantic (NA), North Pacific (NP), Siberian continent (SB) and Tropic ocean (TR).