DAILY PAPER REVIEW

0112_Determination of optimal parameters in regression models for the prediction of chlorophyll...

 

 

1. Title & Journal

- Determination of optimal parameters in regression models for the prediction of chlorophyll-a: A case study of the Yeongsan Reservoir, Korea.

Journal of Science of the Total Environment. 407 (2009) 2536-2545.

 

2. Author's Background

- Kyung hwa Choa, Joo-hyon Kanga, Seo jin Kia, Yongeun Parka, Sungmin Chaa, Joonha Kima,b,*

a Department of Environmental Science and Engineering, Gwangju Institute of Science and Technology(GIST), 261 Chemdan-gwagiro, Buk-gu, Gwangju 500-712, South Korea.

b Sustainable Water Resource Technology Center, Gwangju Institute of Science and Technology(GIST), 261 Chemdan-gwagiro, Buk-gu, Gwangju 500-712, South Korea.

 

3. Summary.

- 이 논문은 우리나라 영산강에서 적용한 Case Study로서, chl-a 농도를 예측하기 위한 회귀모델에서의 최적의 매개변수를 결정하는 방법에 대한 연구이다. 기존의 선형방정식을 포함한 통계적 회귀모델들에서 발생하는 예측 오류의 문제점을 지적하고 그 원인인 불안한 통계적 안정성과 정확성 그리고 더 나아가 다중공선성의 지속에서 그 원인을 찾고 있다.

이 논문은 이러한 원인을 토대로, 연구지역인 영산강에서 얻어낸 filed data를 이용하여 chl-a를 예측함에 있어서 회귀모델들의 통계적 안정성과 정확성을 개선할 수 있는 새로운 연구방법론을 제안하고, 나아가 어떻게 통계적 모델의 함정에서 벗어나 예측 가능한 변수들의 수를 줄임과 동시에 최적화된 매개변수를 결정할 수 있는지 그 방법에 대해서 이야기 하고 있다.

연구방법은 다음 그림과 같이 5개의 단계로 나누어 진행하였으며, 각각의 단계는 다음과 같이 요약할 수 있다.

part 1 : MLR(Multiple Linear Regression)모델의 일반화 과정과 VIF(Variance Inflation Factor)의 계산.

part 2 : Backward Stepwise Method (모든 수질에 대한 설명변수에 대한 F-부분 값을 추정하여)(F-전체 값과 R2의 계산)을 통해서 최적의 회귀모델을 위한 두 가지의 후보를 결정하는 과정. ( MLR-r MLR-F ; MLR-r(with maximum R2), MLR-F(with maximum F-overall).

part 3 : part1과 마찬가지로 PCR방법에 적용, PCR(Principal Component Regression)모델의 일반화 과정과 PCR의 분석(PCA), PC's score의 일반화 과정.

part 4 : part2과 마찬가지로 PCR방법에 적용, (F-전체 값과 R2의 계산) 최적의 회귀모델을 결정하기 위한 두 개의 후보들의 결정과정.

part 5 : 불확실성 분석과 최적의 회귀모델 선정과정.

 

 

4. Result

3년 동안의 수질 모니터링 기간을 토대로, 결과는 PCR 방법은 모델의 정확도를 향상시킬 수 있는 콤팩트한 솔루션이 될 수 있음을 확인할 수 있었고, MLR방법은 공선성의 지속 때문에 신뢰성있는 정확성을 얻기 힘든 것으로 판단하였다. 게다가 R2 값의 적합도, F-overall number (회귀의 신뢰도) 그리고 설명변수커브의 수에 기초하면 PCR(7)이 가장 네 가지 타입의 회귀 모델중에서 클로로필-a를 예측하기 가장 적합하며 설명변수(7)와 가장 낮은 불확실성을 가진 것으로 나타났다. 7가지의 주성분들은 중요한 변수들로 설정하였고, 이들은 8가지 수질 매개변수들과 연관되어 있다. 8개의 수질 연관 지표는 pH, BOD5, TC, FIB, COD, NH4+-N , TN, DO이다. 이러한 결과들은 모델이 클로로필-a에 대한 예측을 테스트와 검정기간동안에 성공적으로 시뮬레이션 한 것 뿐만 아니라, 최적의 파라미터들이 회귀모델에서는 신중하게 고려되어 결정되어져야 한다는 것을 의미하는 것이라고 할 수 있다.

 

5. Originality and Creativity

이 논문의 연구결과는 부영양화의 단계를 결정하고 비교하는데 사용되는 회귀모델에 있어서 기존의 방법보다 성공적인 개선을 제공해 줄 수 있는 방법론을 제시한다는 데 있어서 의미가 있다. 또한 이러한 회귀모델들은 잠재적으로 환경모델링과 다른 학문의 분야에도 적용시킬 수 있는 것이 큰 장점이라고 할 수 있다.

Reviewer : 박지환 (jhjeeh@gist.ac.kr)

Author's E-mail : Joonha Kim(joonkim@gist.ac.kr)

 

 

첨부 (1)
01_12 daily review - Jihwan Park.pdf
374.6KB / Download 0