بررسی عملکرد روش ترکیبی دگینگ با الگوریتم پایه درخت هوفدینگ در طبقه‌‎بندی کیفی آب شرب

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشیار گروه علوم و مهندسی آب، دانشکده کشاورزی، دانشگاه تبریز، تبریز، ایران.

2 دانشجوی کارشناسی ارشد، گروه علوم و مهندسی آب، دانشکده کشاورزی، دانشگاه تبریز، تبریز، ایران.

چکیده

برای مدیریت مؤثر کیفی آب شرب، برآورد سطح آلودگی آب‎های سطحی ضروری است. در پژوهش حاضر، برای محاسبه شاخص کیفی آب شرب از پارامترهای شیمیایی سختی کل، قلیائیت، هدایت الکتریکی، کل مواد جامد محلول، کلسیم، سدیم، منیزیم، پتاسیم، کلر، کربنات، بی‎کربنات و سولفات ایستگاه هیدرومتری باغ کلایه استان قزوین، در دوره آماری 23 ساله (1998-2020) استفاده شد. با توجه به مقادیر عددی محاسبه شده و استانداردهای موجود، کیفیت آب در دو کلاس خوب و عالی طبقه‎ بندی شد. برای طبقه‌بندی کلاس کیفی آب شرب براساس پارامترهای شیمیایی، ترکیب‎های مختلفی از پارامترها در قالب چندین سناریو درنظر گرفته شد. در این راستا، برای انتخاب سناریوهای مختلف، از دو روش همبستگی و الگوریتم رلیف استفاده شد. درخت هوفدینگ به‎عنوان مدل پایه برای طبقه‎ بندی کلاس کیفی آب براساس ترکیب‎های مختلفی از پارامترهای شیمیایی به‌کار برده شد. هم‌چنین عملکرد روش ترکیبی Dagging در بهبود نتایج، مورد ارزیابی قرارگرفت. نتایج نشان داد که روش ترکیبی Dagging باعث بهبود نتایج طبقه‎بندی کلاس کیفی آب می‎شود. سناریوی 6 روش Dagging با الگوریتم پایه درخت هوفدینگ، شامل پارامترهای HCO3، Ca، SO3، TDS، EC و TH، با Kappa = 1، به‎عنوان بهترین روش معرفی شد. این روش توانست تمام نمونه‎های آزمایشی را به‌صورت صحیح، طبقه‎‌بندی کند.

کلیدواژه‌ها


 
جاویدان، س.، ستاری، م. ت.، کریم‌زاده، پ.، و مهرابی، ا.، (1401)، "تحلیل عملکرد روش‌های هیدرولوژیکی و داده-مبنا در برآورد میزان رسوب معلق"، مجله محیط‌زیست و مهندسی آب، 8(2)، 468-480، https://doi.org/10.22034/jewe.2021.305599.1632.
دزفولی، د.، موغاری، م.ح.، ابراهیمی، ک.، و عراقی‎نژاد، ش.، (1396)، "تعیین طبقه‎بندی کیفی آب بر اساس حداقل پارامترهای کیفی (مطالعه موردی: رودخانه کارون)"، محیط‌زیست طبیعی، مجله منابع طبیعی ایران، 70(3)، 595-583، https://doi.org/10.22059/jne.2017.213338.1224.
ستاری، م. ت.، میرعباسی، ر.، و عباسقلی نایب‎زاد، م.، (1396)، "استفاده از داده‌کاوی در پیش‌بینی کیفیت آب‌های سطحی (مطالعۀ موردی: رودخانه‌های دامنۀ شمالی سهند)"، اکوهیدرولوژی، 4(2)، 419-407، https://doi.org/10.22059/ije.2017.61477.
Babar, R., and Babar, S., (2017), “Predicting river water quality index using data mining techniques”, Environmental Earth Sciences, 76(504), 1-15, https://doi.org/10.1007/s12665-017-6845-9.
Domingos, P., and Hulten, G., (2003), “A general framework for mining massive data streams”, Journal of Computational and Graphical Statistics, 12(4), 945-949, https://doi.org/10.1198/1061860032544.
Elish, M., and Elish, K., (2021), “An empirical comparison of resampling ensemble methods of deep learning Neural Networks for cross-project software defect prediction”, International Journal of Intelligent Engineering and Systems, 14(3), 201-209, https://doi.org/10.22266/ijies2021.0630.18.
Gakii, C., and Jepkoech, J., (2019), “A classification model for water quality analysis using desision tree”, European Journal of Computer Science and Information Technology, 7(3), 1-8.
Hall, M.A., (1999), “Correlation-based feature selection for machine learning”, Ph.D. Thesis, University of Waikato.
Khan, M.S.I., Islam, N., Uddin, J., Islam, S., and Nasir, M.K. (2022). Water quality prediction and classification based on principal component regression and gradient boosting classifier approach. Journal of King Saud University-Computer and Information Sciences, 34(8), 4773-4781, https://doi.org/10.1016/j.jksuci.2021.06.003
Kavita, D., and Jagdish, S., (2012), “Water resources management and water quality, case of Bhopal”, International Conference on Chemical, Ecology and Environmental Sciences, Bangkok.
Khalil, B., Ouarda, T., and St-Hilaire, A., (2011), “Estimation of water quality characteristics at ungauged sites using artificial neural networks and canonical correlation analysis”, Journal of Hydrology, 405, 277-287, https://doi.org/10.1016/j.jhydrol.2011.05.024.
Kira, K., and Rendell, L. A., (1992), “The Feature Selection Problem: Traditional methods and a new algorithm”, Proceedings of the 10th National Conference on Artificial intelligence, 129-134.
Kotsianti, S.B., and Kanellopoulos, D., (2007), "Combining bagging, boosting and dagging for classification problems", In: Apolloni, B., Howlett, R.J., Jain, L. (eds.), Knowledge-Based Intelligent Information and Engineering Systems, KES 2007, Lecture Notes in Computer Science, Vol. 4693, Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-540-74827-4_62.
Kotti, M.E., Vlessidis, A.G., Thanasoulias, N.C., and Evmiridis, N.P., (2005), “Assessment of river water quality in Northwestern Greece”, Water Resources Management, 19, 77-94, https://doi.org/10.1007/s11269-005-0294-z.
Meddouri, N., Khoufi, H., and Maddouri, M., (2021), "A performant dagging approach of classification based on formal concept", International Journal of Artificial Intelligence and Machine Learning (IJAIML), 11(2), 38-62, http://doi.org/10.4018/IJAIML.20210701.oa3.
Mehta, V., and Sanghavi, V., (2019), “Comparative study of various decision tree methods for data stream mining”, In: 3rd International Conference on Information and Communication Technology (ICICT), Springer International Publishing, pp. 371-379, https://doi.org/10.1007/978-981-13-1165-9_34.
Sattari, M.T., Feizi, H., Colak, M., Ozturk, A., Ozturk, F., and Apaydin, H., (2021), “Surface water quality classification using data mining approaches: Irrigation along the Aladag River”, Irrigation and Drainage, 70(5), 1227-1246, https://doi.org/10.1002/ird.2594.
Singh, D.F, (1992), “Studies on the water quality index of some major rivers of Pune, Maharashtra”, Proceedings of the Academy of Environmental Biology 1, 61-66.
Ting, K.M., and Witten, I.H., (1997), “Stacking bagged and dagged models”, In: Fourteenth International Conference on Machine Learning, San Francisco, CA, pp. 367-375.
Yusri, H., Ab Rahim, A., Hassan, S., Halim, I., and Abdullah, N., (2022), “Water quality classification using SVM and XGBoost method”, IEEE 13th Control and System Graduate Research Colloquium (ICSGRC), pp. 231-236, https://doi.org/10.1109/ICSGRC55096.2022.9845143.