Estimation of Daily Dissolved Oxygen Concentration using Multivariate Adaptive Regression Splines Methods


NACAR S., METE B., BAYRAM A.

Uludağ Üniversitesi Mühendislik Fakültesi Dergisi, vol.25, no.3, pp.1479-1498, 2020 (Peer-Reviewed Journal) identifier

Abstract

In this study, it is aimed to estimate DO concentration using the river water temperature (WT), electrical conductivity (EC) computed from specific conductance (SC), pH, and discharge (Q) data by employing multivariate adaptive regression splines (MARS) and regression analysis (RA) methods. For this purpose, the basic functions and equations, which yielded the best estimation values in the MARS method, were determined. The RA method was applied to four different functions, namely linear, power, exponential, and quadratic, and the coefficients for these functions were computed. Daily mean data for a period from September 2016 to August 2017 were used in DO modeling studies for the Clackamas River having a basin area of approximately 2435 km2 , which is one of the tributaries of the Willamette River located in the northwestern state of Oregon, USA. Eight different models were generated to determine the effect of each water-quality parameter on the estimation performance of the river DO concentration. In order to evaluate the performances of the methods and the models used in estimating the river DO concentration, various statistics, e.g. the root mean square error, mean absolute error, scatter index, and Nash Sutcliffe coefficient of efficiency, were used. When the results from the modeling efforts were evaluated, it was seen that the MARS method provided better results than RA method. It was also seen that the most successful estimation results were provided by quadratic function among the regression functions and were also quite close to estimation results provided by the MARS method. It was revealed WT and Q parameters were highly effective, that is to say, EC and pH parameters were highly ineffective in estimating the river DO concentration. The estimation results obtained from Model 3, Model 5, Model7, and Model 8 were very close to each other. It was concluded that Model 3 with less parameters would be more advantageous to use in the estimation of the river DO concentration owing to being a simpler model but making strong estimations.
Bu çalışmada su sıcaklığı (T), özgül iletkenlik (Öİ) verilerinden hesaplanmış elektriksel iletkenlik (Eİ),pH ve debi (Q) verileri kullanılarak çok değişkenli uyarlanabilir regresyon eğrileri (MARS) ve regresyonanalizi (RA) yöntemleri ile ÇO konsnatrasyonunun tahmin edilmesi amaçlanmıştır. MARS yönteminde eniyi tahmin değerlerini üreten temel fonksiyonlar ve denklemler belirlenmiş, RA yöntemi doğrusal, üs, üstelve kuadratik olmak üzere dört farklı fonksiyona uygulanmış ve bu fonksiyonlara ait katsayılarhesaplanmıştır. Modelleme çalışmalarında Amerika Birleşik Devletleri’nin Oregon eyaletinin kuzeybatısında yer alan Willamette Nehri’nin yan kollarından biri olan ve yaklaşık 2435 km2’lik bir havza alanınasahip Clackamas Nehri’ne ait Eylül 2016 − Ağustos 2017 dönemi günlük ortalama verileri kullanılmıştır.Her bir su kalitesi değişkeninin ÇO konsantrasyonu tahmin performansına etkisini belirlemek amacıylasekiz farklı model oluşturulmuştur. ÇO konsantrasyonu tahmininde kurulan modellerin ve kullanılanyöntemlerin performanslarının değerlendirilebilmesi için çeşitli istatistikler (ortalama karesel hatanınkarekökü, ortalama mutlak hata, saçılım indeksi ve Nash Sutcliffe verimlilik katsayısı) kullanılmıştır.Modelleme çalışmalarından elde edilen sonuçlar irdelendiğinde, MARS yönteminin RA yönteminden dahaiyi sonuçlar verdiği anlaşılmıştır. Regresyon fonksiyonları içerisinden ise en başarılı tahmin sonuçlarınınkuadratik fonksiyondan elde edildikleri ve MARS yöntemi ile elde edilen değerlere de oldukça yakınoldukları görülmüştür. ÇO konsantrasyonu tahmininde en etkili değişkenlerin T ve Q oldukları dolayısıylaen etkisiz değişkenlerin ise Eİ ve pH oldukları anlaşılmıştır. Model 3, Model 5, Model 7 ve Model 8’denelde edilen sonuçların birbirine çok yakın olması sebebiyle daha az değişken ile güçlü tahminler yapmasıve daha sade bir model olması bakımından ÇO tahmininde Model 3’ün kullanılmasının daha avantajlıolacağı sonucuna varılmıştır.