The Korean Meteorological Society 1

Current Issue

Atmosphere - Vol. 28 , No. 3

[ Article ]
Atmosphere - Vol. 28, No. 3, pp.291-303
ISSN: 1598-3560 (Print) 2288-3266 (Online)
Print publication date 30 Sep 2018
Received 02 Jun 2018 Revised 13 Jul 2018 Accepted 31 Jul 2018
DOI: https://doi.org/10.14191/Atmos.2018.28.3.291

북서태평양 태풍 강도 예측 컨센서스 기법
오유정1) ; 문일주1), * ; 이우정2)
1)제주대학교 태풍연구센터/해양기상학협동과정
2)기상청 국가태풍센터

A Consensus Technique for Tropical Cyclone Intensity Prediction over the Western North Pacific
Youjung Oh1) ; Il-Ju Moon1), * ; Woojeong Lee2)
1)Typhoon Research Center/Graduate School of Interdisciplinary Program in Marine Meteorology, Jeju National University, Jeju, Korea
2)National Typhoon Center, Korea Meteorological Administration, Jeju, Korea
Correspondence to : * Il-Ju Moon, Typhoon Research Center/Graduate School of Interdisciplinary Program in Marine Meteorology, Jeju National University, College of Ocean Science, Ara 1 Dong, Jeju 63243, Korea. Phone: +82-64-754-3412, Fax: +82-64-756-3483 E-mail: ijmoon@jejunu.ac.kr

Funding Information ▼

Abstract

In this study, a new consensus technique for predicting tropical cyclone (TC) intensity in the western North Pacific was developed. The most important feature of the present consensus model is to select and combine the guidance numerical models with the best performance in the previous years based on various evaluation criteria and averaging methods. Specifically, the performance of the guidance models was evaluated using both the mean absolute error and the correlation coefficient for each forecast lead time, and the number of the numerical models used for the consensus model was not fixed. In averaging multiple models, both simple and weighted methods are used. These approaches are important because that the performance of the available guidance models differs according to forecast lead time and is changing every year. In particular, this study develops both a multi-consensus model (M-CON), which constructs the best consensus models with the lowest error for each forecast lead time, and a single best consensus model (S-CON) having the lowest 72-hour cumulative mean error, through on training process. The evaluation results of the selected consensus models for the training and forecast periods reveal that the M-CON and S-CON outperform the individual best-performance guidance models. In particular, the M-CON showed the best overall performance, having advantages in the early stages of prediction. This study finally suggests that forecaster needs to use the latest evaluation results of the guidance models every year rather than rely on the well-known accuracy of models for a long time to reduce prediction error.


Keywords: Tropical cyclone, intensity prediction, consensus, guidance models

1. 서 론

해마다 발생하는 태풍에 의한 피해를 저감하기 위해서는 정확한 태풍 예측이 필수적이다. 최근 인공위성을 포함한 관측기술과 수치모델의 발달로 태풍 진로 및 강도 예측 정확도는 많이 향상되었다(Knaff et al., 2003; DeMaria et al., 2005; Rogers et al., 2006). 특히, 수치모델 기술의 발달에는 여러 수치모델들의 예측결과를 통계적인 방법을 통해 하나의 예측으로 조합하는 컨센서스(Consensus) 기법이 큰 기여를 하였다(Cangialosi and Franklin, 2013). 컨센서스 기법은 개별 수치모델들의 무작위적인 오차들을 상쇄시키는 효과가 있어, 현재 국내 · 외 태풍예보기관에서 태풍 진로예측에 널리 사용되고 있으며 그 효과도 매우 큰 것으로 보고되었다(WMO, 2007; Elsberry, 2014; Jun et al., 2015).

컨센서스 방법은 단순 평균방법과 가중치 평균방법으로 나눌 수 있다. 단순 평균방법은 여러 수치모델들의 예측결과를 같은 가중치로 단순하게 평균하는 방법이다. Goerss (2000)는 1995~1996년에 대서양에서 발생한 태풍과 1997년에 북서태평양에 발생했던 태풍에 대하여 3개의 전구모델 또는 2개의 지역모델 결과를 단순 평균한 결과가 개별 수치모델들 보다 태풍 예측의 정확도를 향상시킬 수 있음을 보였다. 가중치 평균방법은 컨센서스에 구성되어 있는 개별 수치모델들의 과거 예측성능을 고려하여 모델별로 다른 가중치를 주어 평균하는 방법을 말한다. Kumar et al. (2003)는 가중치 평균방법 중에 하나인 슈퍼앙상블 방법을 이용하여 1998~2000년 태평양에서 발생한 태풍의 진로 및 강도 예측에 적용하여 개별 수치모델들 보다 보다 향상된 예측결과를 얻었다. Kotal and Bhowmilk (2011)은 5개의 수치모델에 대해 예측시간별로 다른 가중치를 적용하는 컨센서스 기법을 2008~2009년 북인도양에서 발생한 사이클론의 진로예측에 적용하여 오차를 획기적으로 감소시켰다. Jun et al. (2015)는 2013~2014년 북서태평양에서 발생했던 태풍에 대해 가중치 평균방법을 사용할 경우 단순 평균방법보다 진로예측 오차를 줄일 수 있음을 보고하였다.

국내 · 외 현업 태풍예보 기관에서도 컨센서스 방법을 널리 사용하고 있다. 기상청 국가태풍센터에서는 태풍분석 및 예보시스템(Typhoon Analysis and Prediction System, TAPS)을 통해 선택과 가중기법이 적용된 다중 모델앙상블(Optimal Multi Model Ensemble, OMME)을 수행하고 있다(KMA, 2017). 미국 NHC에서는 다양한 수치모델들을 이용하여 단순 평균방법, 보정하는 방법, 슈퍼앙상블(Florida State University Super Ensemble, FSSE) 방법 등과 같은 다양한 컨센서스 기법을 현업에 활용하고 있다. 동경지역특별기상센터(Regional Specialized Meteorological Centers-Tokyo Typhoon Center, RSMC-Tokyo)에서는 가용 모델 중 모델들을 선택적으로 사용하여 단순 평균하는 컨센서스 방법(Selective consensus)만을 사용하고 있다(Ueno, 2014). 미국합동태풍경보센터(Joint Typhoon Warning Center-Honolulu)에서도 보유하고 있는 수치모델 중 이용 가능한 모델이 2개 이상일 때, 이 수치모델들을 이용하여 단순 평균하는 방법인 CONW (JTWC track consensus)를 현업에 활용하고 있다.

지금까지 컨센서스 방법을 적용한 연구들은 대부분 진로예측에 집중되어 있고 강도예측에 적용된 경우는 드물다. 또한 강도예측에 사용된 경우에도 수치모델의 예측성능을 고려하지 않고 예측시점에서 가용되는 모든 수치모델들을 사용하거나 가중치 평균방법에서 이미 찾은 고정된 수치모델들의 가중치를 매년 보정 없이 계속 사용하고 있다. 그러나 최근 해마다 달라지고 있는 개별 수치모델의 성능 변화를 고려하면 고정된 가중치를 사용하거나 선별 없이 이용 가능한 개별모델을 모두 사용하는 방법은 컨센서스 기법의 성능을 저하시킬 수 있다. 예를 들면, 미국의 전구모델인 NCEP GFS (Global Forecast System)와 NAVGEM (Navy Global Environmental Model)의 경우 48시간 예측성능을 2008년부터 2015년까지 연도별로 비교한 결과(Fig. 1)를 보면, 얼마나 최근 수치모델들이 매년 업그레이드를 통해 예측성능이 달라지고 있는지를 단적으로 보여준다.


Fig. 1. 
Changes in annual-mean errors (MAEs) of GFS and NAVGEM for TC maximum wind speed (MWS) predicted at the lead time of 48 h during 2008~2015.

가중치 평균방법을 사용하는 기존 대부분의 연구에서는 모든 예측시간(Lead time)에 대해 같은 가중치를 사용하고 있다. 그러나 모델 별로 예측시간에 따라 성능차이가 뚜렷한 경우가 많다. 예를 들면, 일본 전지구모델(JGSM, JMA Operational Global Spectral Model)과 미해군 전지구모델 NAVGEM의 경우를 비교해보면(Fig. 2), 예측시간이 길어질수록 두 모델의 예측성능이 반대의 경향을 보인다. 즉, JGSM의 경우 대부분의 수치모델과 유사하게 예측시간이 길어질수록 오차가 커지는 반면, NAVGEM는 예측초반의 오차가 비교적 높았지만 예측시간이 길어질수록 오차가 줄어드는 특징을 보인다. 이러한 결과는 예측시간별 특징을 고려한 컨센서스 모델의 필요성을 시사한다.


Fig. 2. 
Comparison of MAEs between JGSM and NAVGEM, according to the lead time, for TC maximum wind speed (MWS) predicted during 2008~2014.

본 연구에서는 북서태평양의 태풍 강도예측을 위한 다양한 컨센서스 기법을 적용한 최적의 앙상블 예측방법을 개발하는데 목적이 있다. 특히, 본 연구에서는 최근 수치모델들의 성능이 해마다 달라지고 있는 점을 고려하여, 수치모델들의 과거 1년 예측성능 평가를 통해 컨센서스 모델에 사용할 모델들을 선택하고 가중치를 구하여 이듬 해에 강도예측에 사용하는 새로운 방법을 적용하여 그 성능을 조사하고자 한다. 이 방법은 컨센서스 구성에 있어 가용한 수치모델들을 모두 사용하지 않고, 이전 해의 개별 모델 성능을 고려한 모델들의 여러 조합 실험을 통해 컨센서스에 사용될 모델의 최적 개수뿐 아니라 가중치를 해마다 그리고 예측시간별로 달리 사용한다는 점에서 기존 컨센서스 기법과 차별화 된다. 또한 개별 모델의 성능을 평가하는 방법에서도 기존 연구에서는 대부분 절대적인 오차만을 그 기준으로 사용하고 있지만 본 연구에서는 수치모델들 중에 오차가 크지만 태풍강도 변화 경향성을 잘 모의하는 수치모델들을 선택할 수 있도록 상관도(correlation coefficient) 분석결과를 추가적으로 기준에 사용하였다.

제 2장에서는 북서태평양 태풍의 강도 예측을 위해 개발된 컨센서스 모델에 사용된 수치모델과 최적경로 자료를 소개하고, 제 3장에서는 본 연구에서 개발한 태풍 강도 컨센서스 방법에 대해 설명한다. 제 4장에서는 개발된 태풍 강도 컨센서스 방법을 이용하여 태풍 강도 예측 성능을 검증한다. 마지막 제 5장에서는 본 연구의 요약 및 결론을 제시한다.


2. 자 료

현재 기상청 국가태풍센터에서는 태풍 현업예보를 위해 국내 · 외에서 입전되는 다양한 수치모델들을 활용하고 있다. 본 연구에서는 이 중 2008년부터 2015년까지 예보에 활용 가능했던 총 11개의 수치모델들을 분석에 이용하였다. 사용된 수치모델들은 5개의 전구모델, 2개의 앙상블모델, 4개의 지역모델로 구성되어 있다. 각 수치모델들의 설명, 자료기간, 공간해상도, 자료생산주기는 Table 1에 기술되었다. 여기서 한 가지 언급할 사항은 11개의 수치모델들이 연구기간에 모두 사용된 것이 아니다 라는 점이다. 예를 들면, KEPS와 HWRF는 2012~2015년 기간만 그리고 TWRF는 2013~2014년에만 사용되었다. 반면, JGSM, NAVGEM, GFS, 그리고 ECMWF는 2008년부터 2015년까지 전 기간 사용되었다. 이렇게 매년 가용한 수치모델들이 달라지기 때문에 본 연구에서는 매년 가용한 수치모델들을 달리 사용하는 컨센서스 기법을 개발하였다.

Table 1. 
Description and information on guidance numerical models used for present study.
No. Model name Description Data period Spatial
resolution
Forecast
interval
1 GDAPS Global Data Assimilation and Prediction System
(Unified Model)
2010~2015 25 km 6 h
2 RDAPS Regional Data Assimilation and Prediction System
(Unified Model)
2011~2015 12 km 3 h
3 TWRF WRF-based Typhoon Model 2013~2014 15 km 6 h
4 KWRF WRF-based KMA Operational Regional Model 2011~2014 10 km 6 h
5 JGSM JMA Operational Global Spectral Model 2008~2015 20 km 6 h
6 TEPS JMA Operational Typhoon Ensemble Prediction System 2009~2015 60 km 6 h
7 NAVGEM
(NOGAPS)
Navy Global Environmental Model
(Navy Operational Global Prediction System)
2012~2015
(2008~2011)
37 km
(55 km)
6 h
8 GFS NCEP Global Forecast System 2008~2015 1o 6 h
9 ECMWF European Center for Medium-range Weather Forecasting 2008~2015 0.5o 24 h
10 KEPS KMA Ensemble Prediction System (24 members) 2012~2015 40 km 6 h
11 HWRF NCEP EMC WRF-based Regional Model 2012~2015 27/9/3 km 6 h

사용된 모델은 가용 기간뿐 아니라 예측 간격에 있어서도 차이가 있다. 예를 들면, 대부분의 모델은 6시간 간격으로 예측자료를 제공하지만 RDAPS는 3시간 그리고 ECMWF는 24시간 간격으로 자료를 제공한다. 본 연구에서는 이러한 모델별 예측간격 차이를 고려하여, 12시간 후부터 72시간까지 12시간 간격으로 통일된 컨센서스 모델을 개발하였다. 이를 위해 3시간 또는 6시간 간격의 수치모델의 결과들은 12시간 간격의 자료만을 뽑아 사용하였고, ECMWF의 경우에는 24시간 간격의 자료를 12시간으로 내삽하여 사용하였다.

연구에 사용된 11개의 수치모델 및 개발된 컨센서스 모델들의 성능평가를 위한 기준자료는 RSMC-Tokyo에서 제공하는 최적경로 자료를 사용하였다. RSMC-Tokyo 최적경로자료는 6시간 간격의 10분 평균 최대 풍속, 중심기압, 그리고 태풍중심 위치자료를 제공한다.


3. 컨센서스 모델 구성

가중치 평균방법에서는 다중선형 회귀모델을 이용하여 수치모델별 가중치가 계산된다. 다중선형 회귀모델은 독립변수가 2개 이상인 경우에 대해 식 (1)를 이용하여 수치모델의 예측값을 독립변수로 간주하여 최종 예측값(종속변수)을 계산하는 방법이다.

y=a0+i=1naixi(1) 
y=1ni=1nxi(2) 

여기서 y는 예측하고자 하는 값(즉, 태풍 강도), a0는 회귀상수, n은 사용한 수치모델의 수(단, 2 ≤ n), x는 수치모델의 예측값, a는 모델들의 가중치를 의미한다. 단순 평균방법은 식 (2)와 같이 표현되며 가용되는 수치모델들의 예측 값을 같은 가중치를 가지고 단순 평균된다. 이렇게 구성된 컨센서스 모델들은 반복적으로 수행하는 교차타당성 검사를 통해 예측시간별로 따로 검증을 하고 이 중 가장 낮은 오차를 보인 모델이 선정된다. 다중 선형회귀 모델을 구성할 때 본 연구에서는 예측인자들 간의 다중공선성을 피하기 위해 분산팽창계수(Variance Inflation Factor, VIF)를 사용하여 예측인자간 상관도가 높은 수치모델은 제외하고 분석에 사용하였다. VIF는 다중 선형회귀 모델을 이용한 많은 선행연구들에서 다중공선성을 피하기 위한 방법으로 널리 사용되어 왔다(Davis et al., 1986; Villarini et al., 2011; Kim et al., 2012). 여기에서 VIF는 예측인자들 사이의 독립성을 나타내는 지수로 1에 가까울수록 예측인자간의 상관관계가 적다는 것을 나타낸다. 본 연구에서는 VIF 값이 10.5를 넘는 경우 그 수치모델은 선형회귀 모델 구성에서 제외하였다. 컨센서스 모델 구성은 예측시간별로 가장 낮은 오차를 보인 가이던스 모델들을 각각 조합하여 예측시간별 컨센서스 모델을 따로 개발하는 Multi-consensus model(M-CON) 방법과 72시간 누적평균오차가 가장 낮았던 단일 컨센서스 모델을 선정하는 방법인 Single-consensus model (S-CON) 방법을 함께 사용하였다.

컨센서스 모델은 훈련기간(Training period)과 예측기간(Forecasting period)으로 나누어 매해 평가된다(Fig. 3). 즉, 개별 수치모델들의 과거 1년(훈련기간)에 대해 다양한 컨센서스 모델을 구성하고, 이 중에 가장 좋은 성능을 보인 컨센서스 모델을 다음 해(예측기간)에 적용하여 그 성능을 평가하는 방법을 채택한다. 훈련기간의 컨센서스 모델들은 모델개수(2개 이상부터), 평균방법(단순 또는 가중치 방법), 그리고 순위결정방법(절대평균오차 또는 상관도)에 따른 가능한 모든 조합으로부터 구성되고 총 5개의 예측시간(12~72 h, 12-h 간격)에 대해 그 성능이 평가된다.


Fig. 3. 
Flow chart explaining training and forecasting processes for M-CON and S-CON.

Table 2는 2008년에 가용한 수치모델들을 이용하여 다양한 방법으로 구성한 컨센서스 모델의 성능평가결과를 나타낸 것이다. 2008년에는 가용한 수치모델이 4개 밖에 없어 2개부터 4개까지 모델 개수를 변화시키며 성능을 평가하였다. 사용된 모델의 우선 순위는 절대평균오차(Mean Absolute Errors, MAE)와 상관도(Correlations, R)에 따라 각각 평가되었고, 모델의 평균방법도 단순 평균방법(AVE)과 가중치 평균방법(WEI)에 대해 따로 평가되었다. 이러한 방법으로 만들어진 컨센서스 모델은 ‘순위결정방법-앙상블평균방법(사용 수치모델 수)’의 형식으로 표시되었다. 예를 들면, MAE-WEI(3)는 MAE 순위결정방법에 따라 상위 3개의 수치모델을 가중치 평균하여 구성한 컨센서스 모델을 의미한다. Table 2에서 별표와 함께 진하게 표시된 부분은 각 예측시간에서 가장 낮은 오차를 보인 컨센서스 모델을 나타내며 이 모델은 최종적으로 다음 해에 그 예측기간에 해당되는 태풍강도를 예측하는 모델로 사용된다. 2008년의 경우, M-CON은 MAE 기준의 2개 또는 3개 상위 모델을 가중 평균하는 모델들이 많이 선택되었고, S-CON는 MAE 기준 가중치 방법으로 3개의 상위 모델을 사용하는 MAE-WEI(3) 방법이 선택되었다.

Table 2. 
Mean absolute errors (MAE) for TC MWS at lead times of 12 to 72 hours (12-hour interval) obtained from training process in 2008. Bold numbers with asterisk represent the lowest errors (i.e., selected method) for each forecast lead time. Simple average (AVE) and weighted average (WEI) methods are evaluated based on both MAE and correlation coefficient (R) depending the number of models used. The last two rows represent the selected method and number of model used (in bracket) for M-CON and S-CON.
Number
of model
Method M-CON S-CON
12 h 24 h 36 h 48 h 60 h 72 h Total
2 MAE AVE 4.96 6.06 7.21 7.90 8.11 7.47 5.14
WEI 4.22* 5.73* 6.89 7.75 7.88 7.15 4.84
R AVE 4.96 6.06 7.21 7.90 10.76 9.22 5.14
WEI 4.22 5.73 6.89 7.75 7.98 6.72* 4.84
3 MAE AVE 6.80 7.38 8.05 8.05 8.34 7.74 5.66
WEI 4.29 5.75 6.76* 7.56 7.74 6.90 4.60*
R AVE 6.73 7.46 8.13 8.39 8.51 7.74 5.71
WEI 4.33 5.82 6.84 7.56 7.73* 6.90 4.62
4 MAE AVE 7.84 8.58 8.93 8.65 8.83 8.29 6.30
WEI 4.36 5.86 6.84 7.66 7.78 7.07 4.61
R AVE 7.84 8.58 8.93 8.65 8.83 8.29 6.30
WEI 4.36 5.86 6.84 7.66 7.78 7.07 4.61
M-CON MAE-WEI(2) MAE-WEI(2) MAE-WEI(3) MAE-WEI(3) R-WEI(3) R-WEI(2)
S-CON MAE-WEI(3)

같은 방법으로 2008년부터 2014년까지 매년 수치모델들의 훈련기간 예측성능을 바탕으로 선택된 M-CON과 S-CON의 컨센서스 모델들을 분석해 보면(Table 3), 가중치 평균방법(WEI)이 49개 중 39개(약 80%)가 선택되어 컨센서스 기법을 구성할 때 단순 평균하는 방법보다 가중치 평균방법이 더 유용하게 사용 됨을 알 수 있다. 이것은 태풍 진로에 대한 Jun et al. (2015)의 결과와 일치한다. 순위결정 방법에서는 상관도(R)를 기준으로 사용하는 경우(28개, 57%)가 오차(MAE)를 사용하는 경우(19개)보다 더 많았다.

Table 3. 
List of the consensus models (M-CON and S-CON) that constructed from training process of every year for 2008~2014. The numbers in the bracket for lead time and consensus models represent the average of sample numbers at each forecast time and the number of guidance model used, respectively.
Training
period
M-CON S-CON
12 h (97) 24 h (83) 36 h (71) 48 h (62) 60 h (51) 72 h (44) Total (382)
2008 MAE-WEI(2) MAE-WEI(2) MAE-WEI(3) MAE-WEI(3) R-WEI(3) R-WEI(2) MAE-WEI(3)
2009 R-WEI(3) R-WEI(5) R-WEI(5) R-WEI(5) MAE-WEI(5) MAE-WEI(5) MAE-WEI(5)
2010 R-WEI(4) R-WEI(4) R-WEI(3) MAE-WEI(6) R-WEI(2) R-WEI(3) MAE-WEI(5)
2011 MAE-AVE(3) MAE-AVE(4) R-WEI(5) R-WEI(5) MAE-WEI(6) MAE-WEI(6) MAE-WEI(7)
2012 R-WEI(3) R-WEI(7) R-WEI(8) MAE-WEI(7) R-WEI(3) R-WEI(2) R-WEI(9)
2013 MAE-AVE(7) R-AVE(5) R-AVE(6) MAE-AVE(8) R-AVE(5) R-AVE(4) MAE-AVE(8)
2014 R-WEI(4) R-WEI(2) R-WEI(3) R-WEI(2) MAE-WEI(6) MAE-AVE(8) R-WEI(3)

훈련기간에 구성 된 M-CON과 S-CON의 예측성능을 확인하기 위해 매해 가장 낮은 오차를 보인 개별 수치모델(Best model)과 예측결과를 단순 평균한 모델(Simple-avg.)의 오차를 비교하였다(Fig. 4). 그 결과, 모든 연도와 예측시간에서 M-CON과 S-CON이 Best model 보다 더 좋은 예측성능을 보여주었다. 또한 일부 예측시간(2013년 72 h, 2014년 60 h)을 제외한 대부분의 평가에서 M-CON과 S-CON이 단순하게 평균한 모델보다 더 낮은 오차를 보였다. M-CON과 S-CON는 대부분 비슷한 성능을 보였지만 특정 시기(특히, 2011년 72 h, 2013년 72 h, 2014년 12 h, 2011년 모든 시간)에는 M-CON이 S-CON에 비해 좋은 성능을 보였다.


Fig. 4. 
Comparison of MAEs among the best model, simple-average (Simple-avg.), M-CON, and S-COM, according to the lead time, for TC MWS obtained from training process during 2008~2014.


4. 예측성능 검증

제 3장에서 구성된 두 가지 컨센서스 기법(M-CON과 S-CON)을 사용하여 2009~2015년의 훈련기간 동안 매년 다음 해의 강도를 예측하였다. Figure 5는 훈련기간 중 비교적 가이던스 모델이 많아진 최근 4년(2012~2015년)에 대해 개별 수치모델(2015년에 중단된 TWRF와 KWRF를 제외한 9개 모델)과 두 컨센서스 기법의 예측결과를 RSMC-Tokyo의 자료와 비교한 그림이다. 여기에 사용된 자료는 12 h부터 72 h까지 12시간 간격의 모든 예측자료이다. 성능평가는 상관도(R), 절대평균오차(MAE), 그리고 편차(Bias)를 사용하여 이루어졌으며, 이 결과는 그림의 우측 하단에 각 평가항목의 순위(괄호 안의 표시)와 함께 각각 나타내었다.


Fig. 5. 
Scatter plots of MWS between all model predictions and RSMC-Tokyo best track for all lead times up to 72 hours (12-hour interval) during 2012~2015: (a) GDAPS, (b) RDAPS, (c) JGSM, (d) TEPS, (e) NAVGEM, (f) GFS, (g) ECMWF, (h) KEPS, (i) HWRF, (j) M-CON, and (k) S-CON. The correlation coefficients (R), MAE, and bias are denoted with the rank (number in bracket) based on the model performance in terms of R, MAE, and bias, respectively.

4년간의 분석결과에서 세 평가항목에 대해 가장 좋은 예측성능을 보인 것은 M-CON이었다. M-CON은 MAE가 가장 낮았고 상관도와 Bias 평가에서 모두 2위를 차지하였다(Fig. 5). M-CON은 상관도에서 2위였지만 0.86으로 1위인 S-CON과 소수 셋째 자리에서 근소한 차이를 보였다. S-CON 또한 MAE에서 2위를 차지하였지만 M-CON과 큰 차이는 없었다. 개별 수치모델 중에서 HWRF는 상관도, GFS는 MAE 평가에서 컨센서스 모델들 다음으로 좋은 성능을 보였다. TEPS의 경우 Bias 평가에서 −0.16으로 1위를 하였지만 상관도와 절대평균평가에서 3위 이하의 순위를 보였다. Bias는 M-CON (−0.27 m s−1)이 S-CON (−0.42 m s−1)과 유의한 차이를 보이며 TEPS 다음으로 가장 낮은 값을 나타내었다.

총 훈련기간에 대해 예측시간별로 M-CON과 S-CON의 오차를 매해 가장 낮은 오차를 보였던 개별모델(그림에서 Best model로 표시)과 비교한 결과에서도(Fig. 6), 앞서 Fig. 5의 총 누적오차 분석결과와 유사하게 대부분의 경우 개발된 컨센서스 기법들의 예측오차가 Best model보다 낮았다. 특히, 2009년, 2010년, 그리고 2015년 72 h 컨센서스 모델의 예측결과에서 가장 많은 성능 개선이 보였다. M-CON과 S-CON의 오차는 대부분의 연도와 예측시간에서 큰 차이가 없었지만, 최근 3년(2013~2015)의 예측결과(특히, 60 h 이후)에서 M-CON의 오차가 S-CON에 비해 유의하게 낮게 나타났다. 이렇게 일부 시기에 M-CON의 예측 정확도가 S-CON보다 높게 나타난 것은 앞서 언급한 바와 같이 이 시기에 모델별 성능이 예측시간별로 달라졌을 가능성을 암시한다. Figure 6hTable 4는 예측시간별로 M-CON과 S-CON의 총 4년(2009~2015년)의 평균오차를 동 기간 예측을 수행한 수치모델 중 평균적으로 가장 예측성능이 좋았던 GFS와 비교한 것이다. 이 기간에 대해 개발된 두 컨센서스 기법의 예측오차는 Best model인 GFS보다 평균적으로 낮았다. 예측시간별로 보면, M-CON은 예측초반에 좋은 성능을 보였고, S-CON은 예측시간이 길어질수록 더 좋은 성능을 보였다. 총 누적평가(Total)에서는 S-CON이 가장 낮은 오차를 보였다.


Fig. 6. 
Same as in Fig. 4, but for forecast results during 2009~2015.

Table 4. 
Comparisons of MAE between the consensus models (M-CON, S-CON) and GFS, according to the forecast lead time, for TC MWS predicted from 2009 to 2015.
Lead time M-CON S-CON GFS
12 4.37 4.78 6.64
24 4.70 5.03 7.02
36 5.68 5.14 7.25
48 5.69 5.64 7.46
60 7.05 5.85 7.78
72 6.86 6.44 8.06
Total 5.45 5.35 7.26

각 예측시간 별로 어떠한 개별모델이 선택되었는지 그리고 어떠한 컨센서스 기법이 가장 좋은 성능을 보였는지를 확인하기 연구기간 중 가장 최근(2015년)의 강도예측에 사용된 수치모델의 목록 및 컨센서스 기법을 조사하였다(Table 5). 여기서 컨센서스 모델에 사용된 개별모델의 회귀상수는 괄호 안에 표시되었다. 예를 들면, 12 h 예측모델에서는 TEPS, JGSM, GFS, NAVGEM가 상관도 기준에 의해 선택되었고, 이 모델 중에 NAVGEM (0.40)가 가장 큰 회귀상수(즉 높은 가중치)를 가진 것을 알 수 있다. 72 h의 경우는 8개 모델이 MAE 기준으로 선택되어 같은 가중치를 가지고 단순 평균하는 방법이 채택되었다. S-CON의 경우는 전 예측시간에 대해 GFS, NAVGEM, TEPS를 가중치 평균하는 방법이 선택되었다. 선택된 개별모델을 분석해보면, GFS와 NAVGEM가 36 h 예측시간을 제외한 전 예측시간에 모두 선택되었고, TEPS가 그 다음으로 많이(S-CON 포함 총 4번) 선택된 것을 알 수 있다. JGSM은 초기값의 정확도가 높아 12 h 예측에 선택되었다.

Table 5. 
List of the consensus models (M-CON and S-CON) that constructed from training process for 2014 and their guidance models selected for each lead time. Numbers in the bracket for guidance models and consensus models represent the regression coefficients and the number of guidance model used, respectively.
M-CON S-CON
12 h 24 h 36 h 48 h 60 h 72 h Total
Selected model R-WEI(4) R-WEI(2) R-WEI(3) R-WEI(2) MAE-WEI(6) MAE-AVE(8) R-WEI(3)
1 TEPS
(0.24)
NAVGEM
(0.36)
NAVGEM
(1.38)
NAVGEM
(0.58)
NAVGEM
(0.78)
GFS
-
GFS
(0.35)
2 JGSM
(0.38)
GFS
(0.51)
RDAPS
(−0.31)
GFS
(0.33)
GFS
(0.21)
NAVGEM
-
NAVGEM
(0.33)
3 GFS
(0.05)
- ECMWF
(−0.18)
- RDAPS
(−0.64)
RDAPS
-
TEPS
(0.23)
4 NAVGEM
(0.40)
- - TEPS
(−0.00)
TEPS
-
5 - - - HWRF
(0.29)
HWRF
-
6 - - - JGSM
(0.01)
JGSM
-
7 - - - - - GDAPS
-
8 - - - - - KEPS
-

개발된 두 컨센서스 모델(M-CON과 S-CON)과 Best model의 성능은 실제 태풍에 대한 예측사례를 통해 잘 비교할 수 있다. Figure 7은 Best model이 태풍 강도를 과대 또는 과소 모의한 세 태풍, Mirinae (0921), Nida (0922), Roke (1115)에 대해 연속적인 72시간 강도 예측결과를 관측값(검정) 및 M-CON(빨강)과 S-CON(파랑)의 결과와 비교하고 있다. 여기서 Mirinae (0921)와 Nida (0922)는 태풍이 발생한 후 약 2일 이내에 급속하게 생애 최대강도에 도달한 사례로 대부분의 개별 수치모델들이 이러한 급 발달을 예측하지 못하였다. 가이던스 모델 중에 그래도 이 두 사례를 가장 잘 예측한 Best model은 JGSM이었다. 그러나 JGSM은 태풍이 최대강도에 도달하기 전에는 실제 강도보다 약하게 예측하였고 최대강도에 도달한 후에는 실제보다 더 강하게 모의하는 특징을 보였다. 태풍 Mirinae는 외해 저위도(위도 14.9oN, 경도 143.7oE)에서 발생한 후 필리핀을 통과하며 소멸할 때까지 계속 서진한 사례이다. JGSM의 예측결과를 보면, 태풍 Mirinae가 필리핀 육지지역을 통과한 10월 30~31일 기간에 JGSM은 실제 강도 보다 2배 넘게 강도를 과대 예측한 것을 알 수 있다. 이렇게 JGSM이 필리핀을 지나면서도 태풍이 계속 강화될 것으로 예측한 주 원인은 JGSM이 태풍 진로를 잘못된 예측 결과로 분석된다(본 연구에서는 제시하지 않음). 두 컨센서스 모델들은 JGSM과는 달리 실제 태풍이 약화되는 경향을 어느 정도 잘 재현하였다. 태풍 Nida 사례 또한 Mirinae와 유사하게 Best model이 태풍의 생애 최대강도 도달 전에는 과소 그리고 후에는 과대 모의하는 경향을 보였고 이와 달리 컨센서스 모델들은 특히 태풍의 약화 경향을 잘 모의하였다. 태풍 Roke은 앞선 사례들에 비해 비교적 높은 위도에서 발생하였으며 일본을 관통하였다. 태풍 Roke은 2일 안에 급격하게 강도가 증가한 태풍 Mirinae와 Nida와는 달리 약 7일에 걸쳐 서서히 강도가 증가하였다. Best model의 결과에서도 이런 태풍의 강도 변화 경향은 어느 정도 잘 모의 되었지만 전체적으로 실제 강도보다 약하게 모의하였다. 컨센서스 모델들은 태풍 강도 변화 경향뿐 아니라 과소모의 경향을 보정하여 보다 개선된 예측결과를 보였다.


Fig. 7. 
Comparisons of individual intensity (MWS) predictions from M-CON, S-CON, and best guidance model with RSMC-Tokyo best track for Typhoon (a) Mirinae (0921), (b) Nida (0922), and (c) Roke (1115) along their tracks (d).


5. 토 의

본 연구에서는 최근 거의 매년 업그레이드되는 가이던스 수치모델들에 특성을 고려하여 매년 수립된 컨센서스 모델을 그 다음 해에 적용하는 기법을 사용하였다. 이렇게 그 전 해에 가장 좋은 성능을 보인 가이던스 모델을 사용하는 것이 가장 좋은 방법인가를 검증하기 위해 2008년부터 2013년까지 매년 구성된 M-CON과 S-CON을 이용하여 2014년에 대한 예측 실험을 수행하였다(Fig. 8). 그 결과, 전반적으로 M-CON과 S-CON 모두 2014년에 더 가까운 해를 훈련기간으로 사용했을 때(그림에서 색이 진해질수록) 2014년에 대한 예측성능이 더 좋아진 것을 확인할 수 있었다. 즉, 2014년 예측을 위해서는 2013년에 훈련된 컨센서스 모델을 사용할 경우 오차가 가장 낮았고, 그 다음으로 2012, 2011, 2010, 2009, 2008년 순으로 오차가 커졌다. 이것은 컨센서스 모델의 구성 시에 가능하면 수치모델들의 최근 경향을 반영할 수 있도록 이전 해의 결과를 사용하는 것이 예측 오차를 줄일 수 있음을 의미한다.


Fig. 8. 
Comparisons of MAEs for TC MWS predicted from consensus models (a, M-CON; b, S-CON) trained using data of 2008, 2009, 2010, 2011, 2012, and 2013.

그렇다면 최근 1년의 결과를 기준으로 컨센서스 모델을 구성하는 것이 가장 좋은 방법일까? 1년을 사용하면 훈련기간이 너무 짧은 것은 아닌가? 이러한 의문에 답하기 위하여 전반적인 예측성능평가에서 가장 낮은 오차를 보인 M-CON에 대해 훈련기간을 1년을 사용한 것과 더 긴 2년의 기간을 사용한 경우에 대해 2010년부터 2015년까지 예측성능을 비교하였다(Fig. 9). 그 결과, MAE 비교에서 36 h 예측시간을 제외한 모든 예측시간에서 훈련기간을 1년으로 했을 때 오차가 더 낮게 나타났다. 상관도 비교에서도 대부분의 시간에서 훈련기간을 1년으로 한 경우 더 높은 상관성을 보였다. 특히, 예측시간이 길어질수록 그 차이는 커지는 경향이 보였다. 이 결과는 훈련기간을 2년으로 사용 할 경우 분석할 수 있는 샘플 수가 많아지지만 모델의 최근 성능변화를 고려하는 효과가 감소되어 결과적으로 훈련기간을 1년으로 했을 때보다 컨센서스 모델의 예측성능이 더 떨어지는 것으로 분석된다. 그러나, 이러한 결과는 앞으로 매년 모델의 업그레이드가 이루어질 때에 유효한 결과임을 고려하여야 한다. 즉, 앞으로 만약 모델이 매년 성능변화가 이루어지지 않는다면 더 많은 과거 예측결과를 활용하여 컨센서스 모델을 구성하는 것이 더 바람직할 수도 있다.


Fig. 9. 
Comparisons of (a) MAE and (b) correlation coefficient for TC MWS predicted from M-CON models trained using data of previous 1 year and 2 years, respectively.


6. 요약 및 결론

본 연구에서는 북서태평양에서 발생한 태풍에 대하여 최적의 태풍강도 예측을 위해 예측시간별로 사용한 수치모델, 컨센서스 방법, 순위결정방법이 다른 컨센서스 모델을 개발하였다. 또한 매년 가용할 수 있는 수치모델들이 달라지고 그 성능도 변화하기 때문에 매년 새롭게 구성할 수 있는 컨센서스 방법론을 제시하였다. 이에 따라 두 가지 기법인 Multi-consensus model (M-CON)과 Single-consensus model (S-CON) 방법이 제시되었다. M-CON은 예측시간별로 가장 낮은 오차를 보인 가이던스 모델들을 각각 조합하여 예측시간별로 컨센서스 모델을 따로 개발하는 방법이고, S-CON는 72 h까지 누적 오차가 가장 낮은 하나의 컨센서스 모델을 개발하는 방법이다.

컨센서스 기법을 구성할 때 대부분 가중치 평균방법이 단순 평균방법보다 많이 선택되었고, 순위결정 방법에서는 절대평균오차를 사용한 경우보다 상관도를 고려한 경우가 많았다. 총 7년(2009~2015)에 대하여 두 방법을 적용한 결과, M-CON과 S-CON은 모두 개별 모델들 보다 낮은 오차를 보였다. 특히 M-CON은 모든 평가에서 1, 2위를 하며 가장 좋은 예측성능을 보여주었다. S-CON도 M-CON과 유사한 좋은 성능을 보였지만 예측 초반에 비교적 큰 오차를 보였다. 개별적인 사례분석 결과에서도 M-CON과 S-CON이 모두 과대 또는 과소 모의하는 수치모델들의 경향을 완화시키는 모습을 확인할 수 있었다. 특히 태풍의 강도가 약화되는 구간을 잘 모의하는 특징을 보이며 개별 모델들의 태풍 강도 과소모의 경향을 개선하였다. 훈련기간에 대한 민감도 실험에서 컨센서스 모델의 성능은 최근 자료를 사용할 때 더 좋았고, 훈련기간을 최근 2년을 사용한 것보다 1년을 사용한 것이 더 효과적이었다. 이는 최근 1년의 결과만을 사용하는 것이 빠르게 변화하는 모델들의 최신 업그레이드 정보가 잘 반영되기 때문인 것으로 사료된다.

본 연구에서는 수치모델이 예측성능이 최근 빠른 속도로 업그레이드되기 때문에 매해 수치모델을 평가한 결과를 이용하여 새롭게 구성하는 컨센서스 방법론을 제시하였다. 또한 예측시간별로 수치모델들의 성능이 다른 점을 고려하여 예측시간별로 다른 앙상블 모델을 구성하였다. 그러나 본 연구에서는 훈련기간을 과거 1년으로 사용하였기 때문에 그 해에 업그레이드된 정보가 포함되지 못하는 단점이 있다. 이러한 문제점을 보완하는 방법으로 향후에는 현재 예측하고자 하는 태풍 바로 전 태풍의 사례까지도 훈련기간에 포함하여 모델들의 최근 예측성능을 최대한 반영한 모델을 구성하여 그 효과를 조사해 보고자 한다.


Acknowledgments

이 논문은 해양수산부의 재원으로 한국해양과학기술진흥원의 지원을 받아 수행된 연구입니다(종합해양과학기지 구축 및 활용연구). 또한 이 논문은 제주대학교 발전기금의 지원을 받았습니다.


References
1. Cangialosi, J. P., and J. L. Franklin, (2013), 2012 National hurricane center forecast verification report, National Hurricane Center (NHC), p79, [Available online at http://www.nhc.noaa.gov/verification/pdfs/Verification_2012.pdf].
2. Davis, C. E., J. E. Hyde, S. I. Bangdiwala, and J. J. Nelson, (1986), An example of dependencies among variables in a conditional logistic regression, in Modern Statistical Methods in Chronic Disease Epidemiology, edited by S. H. Moolgavkar, and R. L. Prentice, p140-147, Wiley, New York.
3. DeMaria, M., M. Mainelli, L. K. Shay, J. A. Knaff, and J. Kaplan, (2005), Further improvements to the statistical hurricane intensity prediction scheme (SHIPS), Wea. Forecasting, 20, p531-543.
4. Goerss, J. S., (2000), Tropical cyclone track forecast using an ensemble of dynamical models, Mon. Wea. Rev, 128, p1187-1193.
5. Elsberry, R. L., (2014), Advances in research and forecasting of tropical cyclones from 1963~2013, Asia-Pacific J. Atmos. Sci, 50, p3-16.
6. Jun, S. H., W. J. Lee, K. R. Kang, K. Y. Byun, J. Y. Kim, and W. T. Yun, (2015), Applicability of the superensemble to the tropical cyclone track forecast in the western north pacific, Asia-Pacific J. Atmos. Sci, 51, p39-48.
7. Korea Meteorological Administration (KMA), (2017), 2016 Yearbook, KMA, p342-343.
8. Knaff, J. A., M. DeMaria, C. R. Sampson, and J. M. Gross, (2003), Statistical, 5-day tropical cyclone intensity forecasts derived from climatology and persistence, Wea. Forecasting, 18, p80-92.
9. Kotal, S. D., and S. K. R. Bhowmilk, (2011), A multimodel ensemble (MME) technique for cyclone track prediction over the North Indian Sea, GEOFIZIKA, 28, p275-291.
10. Kumar, T. S. V. V., T. N. Krishnamurti, M. Fiorino, and M. Nagata, (2003), Multimodel superensemble forecasting of tropical cyclone in the pacific, Mon. Wea. Rev, 131, p574-583.
11. Kim, H. S., C. H. Ho, J. H. Kim, and P. S. Chu, (2012), Track-pattern-based model for seasonal prediction of tropical cyclone activity in the western North Pacific, J. Climate, 25, p4660-4678.
12. Rogers, R., and Coauthors, (2006), The intensity forecasting experiment: A NOAA multiyear field program for improving tropical cyclone intensity forecasts, Bull. Amer. Meteor. Soc, 87, p1523-1537.
13. Ueno, M., (2014), Tropical Cyclogenesis Monitoring at RSMC Tokyo, JMA/WMO Workshop on Effective Tropical Cyclone Warning in Southeast Asia 11-14 March, 2014 [Available online at http://severe.worldweather.wmo.int/TCFW/JMAworkshop/3-1-1.TCyclogenesis_Monitoring_at_RSMC_Tokyo_MUeno.pdf].
14. Villarini, G., G. A. Vecchi, T. R. Knutson, and J. A. Smith, (2011), Is the recorded increase in short-duration North Atlantic tropical storms spurious?, J. Geophys. Res, 116, D10114.
15. WMO (World Meteorological Organization), (2007), Sixth WMO International Workshop on Tropical Cyclone (IWTC-VI), WMO, p92, [Available online at http://www.aoml.noaa.gov/hrd/Landsea/WWRP2007_1_IWTC_VI.pdf].