DAILY PAPER REVIEW

0701_Prediction of Arsenic in Bedrock Derived Stream Sediments at a Gold Mine Site Under...

 

 

<그림은 pdf 참고해주세요>

1. Title & Journal

- Prediction of Arsenic in Bedrock Derived Stream Sediments at a Gold Mine Site Under Conditions of Sparse Data / Natural Resources Research, Vol.15, No.1, March 2006, DOI : 10.1007/s11053-006-9013-6

 

2. Author's Background

- Navin K. C. Twarakavi a,*, Debasmita Misra ab, Sukumar Bandopadhyay a

a) Department of Mining and Geological Engineering, College of Engineering and Mines, University of Alaska Fairbanks, P.O. Box 755800, Fairbanks, AK 99775, USA.

b) To whom correspondence should be addressed; e-mail : ffdm1@uaf.edu.

 

3. Summary.

- 본 논문은 SVM robust LS-SVM 을 이용하여 알래스카 지역 Circle City 의 광산에서 Arsenic농도를 추정해보는 논문이다. 논문의 주요 목적은 비소농도 추정에 있으며, 이를 이해하고 더 나아가 연구 지역 광산에서 금의 농도와 비소의 농도의 상관관계를 얻어내어 금의 양까지고 산정할 수 있을지에 대한 연구 논문이다. 논문을 선택한 계기는 중금속에 대한 SVM 통계모델을 적용하는 CASE STUDY를 하고 싶어서 선택하게 되었다.

본 논문에서는 SVM 모델에서 Least squares 버전인 LS-SVM은 감독학습방법(supervised learning methods)을 사용하였으며, 이는 데이터를 분류하고 회귀분석을 위한 데이터 분석과 패턴을 인식하는 모델이다. LS-SVM 모델 역시 kernel-based learning methods를 이용한다.

 

4. method

- 본 논문의 연구지역은 다음과 같다.

그림 1 알라스카 지역에 위치한 본 논문의 연구 대상 지역이다. 그림에서 볼 수 있는 빨간색으로 되어 있는 지점이 샘플링 지점이다.

 

 

- 본 논문의 전체적인 연구 진행단계는 다음과 같다.

1 STEP : 첫 번째 단계로는 트레이닝과 테스팅을 하기 위한 데이터의 수집에 있다. 본 논문에서는 1980년 초기 금과 비소, 그리고 기타 중금속의 농도분석을 위해 모아둔 자료들을 input data로 활용하였다. 1088개가 넘는 샘플들을 모았었고 이에 대한 데이터가 보존되어있다.

2 STEP : 두 번째 단계는 트레이닝 단계이다. SVM LS-SVM을 이용하여 각각 트레이닝을 실시하였다.

3 STEP : 세 번째 단계는 보정 단계로서 트레이닝 데이터의 서브 데이터들을 가지고 교차 보정을 실시한다(Cross-validate).

4 STEP : 네 번째 단계는 테스트 단계이다.

 

5. Result

(1)

(1) 그래프는 비소 농도의 예측값과 관측값을 SVM 모델을 통해서 트레이닝(A) 시킨 결과와 테스팅(B) 한 결과이다. 트레이닝 시킨 결과에서는 R2값이 0.99 를 나타냈으며, 테스팅 결과에서는 R2값이 0.50을 보였다.

 

(2)

(2) 그래프는 (1)과 동일하게 비소 농도의 예측값과 관측값을 SVM 모델을 통해서 트레이닝(A) 시킨 결과와 테스팅(B) 한 결과이다. 다만, (2)그래프에서는 (1)에서와 다르게 이상치로 판단되는 데이터들을 제외하고 트레이닝과 테스팅 한 결과이다. 트레이닝 결과에서는 R2값이 0.95로 다소 낮아졌지만, 테스팅 결과는 0.50에서 0.65로 향상되었다.

 

(3)

(3)그래프 역시 비소 농도의 예측값과 관측값을 SVM 모델을 통해서 트레이닝(A) 시킨 결과와 테스팅(B) 한 결과이다. 여기서 이상치를 제외한 (2)의 그래프 데이터들을 토대로하여, LS-SVM으로 트레이닝과 테스팅 시킨 결과이다. R2값이 트레이닝의 경우에는 0.95로 변동이 없지만, 테스팅 결과에서는 0.65에서 0.70으로 소폭 향상되었다.

또 다른 그래프로 SVM LS-SVM의 차이를 확인 할 수 있다.

그림 2 SVM 적용 테스팅 데이터를 이용한 statistics error

 

그림 3 LS-SVM 적용 테스팅 데이터를 이용한 statistics error

 

위의 통계 처리 데이터들을 확인 해 볼때 SVM보다 LS-SVM이 좀 더 좋은 성능을 보였음을 본

 

논문에서 확인할 수 있었다.

 

6. Creativity

- 인체에 유독한 arsenic 농도의 예측에 관한 논문을 찾던 중 유사한 논문으로 이 논문을 보게 되었다. 수질이 아닌 sediment mine 부분에 있는 것으로 보아 수질내 arsenic 분석에도 유용하게 접근할 수 있을 것으로 생각된다.

 

Reviewer : 박지환 (jhjeeh@gist.ac.kr)

첨부 (1)
0701_ daily review - Jihwan Pak.pdf
525.5KB / Download 76