Makine Öğrenme Metotları Kullanılarak Fonların Fiyat Tahmini İçin Model Geliştirilmesi
Citation
ÇALIŞKAN, Sedrettin, Makine Öğrenme Metotları Kullanılarak Fonların Fiyat Tahmini İçin Model Geliştirilmesi, Fatih Sultan Mehmet Vakıf Üniversitesi Lisansüstü Eğitim Enstitüsü Bilgisayar Mühendisliği Anabilim Dalı, Yayımlanmamış Yüksek Lisans Tezi, İstanbul 2020.Abstract
Bu tez çalışmasında, makine öğrenme algoritmaları kullanılarak fonlann fiyat tahmini için model geliştirilmesi yapılmıştır. Fon fiyat tahmin sistemi amacıyla geliştirilmesi yapılan model çalışmasında kullanılan veri setinin gerçek veri değerlerinden alınması, yapılan modelin tahmin başarısında reel piyasadaki fon bilgilerine yakın değerler olmasını, model tutarlığını ve güvenirhliğini sağlamıştır. Veri seti. Takas îstanbul(Îstanbul Takas ve Saklama Bankası A.Ş.-Takasbank)’un platform ve veri kaynağı sağlayıcılığı yaptığı Türkiye Elektronik Fon Dağıtım Platformu (TEFAS) web sitesi üzerinden, 02.01.2019 - 31.12.2019 tarihleri arasında ki erişime açık olan fon bilgilerinde elde edilmiştir. Bu veri seti araştırmayı da özgün bir kategoriye yerleştirmiştir.
Model çalışması için kullanılan makine öğrenme teknikleri Kısmi En Küçük Kareler Regresyonu (PLSR), Ridge Regresyonu(RR), Destek Vektör Regresyonu (SVR) ve Yapay Sinir Ağları(YSA) algoritmalarıyla yapılmıştır. Geliştirilen model başarı değerlendirmeleri ise; Hata Karelerinin Ortalaması(MSE), Hata Kare Ortalamasının Karekökü(RMSE), Ortalama Mutlak Hata(MAE) ve R Kare Oranı(R2) ölçüm metriklerine göre yapılmıştır. Bu ölçüm metriklerine göre PLSR, RR ve SVR algoritmalarında elde edilen sonuçlann kabul edilebilirlik oranlarınınçok düşük olduğu tespit edilmiştir. YSA ile elde edilen tahmin değerlerinin başan oranmm ise, model önerisi için kabul edilebilir ölçekte olduğu gözlemlenmiştir. Bu değerlendirmelerden hareketle, fonlarm fiyat tahmini çalışmasmda YSA ile geliştirilen model tercih edilmiştir. Sonuç olarak, fonlann fiyat tahmin için geliştirilen model çahşmasmda, YSA modeli tahmin edilen fon fiyat değerinin birim pay başma düşen hata oranı, RMSE değerine göre (+/-) 6.2 olarak bulunmuştur. Model başan yüzdesi ise, R2 ölçüm metrik sonucuna bakılarak %90 üzerinde bir tahmin başarısı olarak elde edilmiştir. Ayrıca, ölçüm metrik sonuçları da göz önüne alındığında regresyon problemleri için PLSR, RR ve SVR modellerinin de kullanılabilirliklerini yitirmedikleri de değerlendirilmiştir. In this thesis, a model is developed for the price estimation of fimds by using machine learning algorithms. The data set used in the study model developed for the purpose of the fiond price estimation system from the real data values ensured that the model was close to the real market ftind information, model consistency, and reliability. Data set used for the model is accessed between 02.01.2019 - 31.12.2019 from Takas Istanbul's (Istanbul Settlement and Custody Bank Inc.-Takasbank) platform Turkey Electronic Fund Trading Platform (TEFAS), which provides ftind data sources. This dataset has also placed the research in a unique category.
Machine learning techniques used for the model study were performed using Partial Least Squares Regression (PLSR), Ridge Regression (RR), Support Vector Regression (SVR), and Artificial Neural Networks (ANN) algorithms. The developed model success evaluations are; Average of Error Squares (MSE), Square Root of Error Square Mean (RMSE), Average Absolute Error (MAE), and R Squared (R2) were made according to measurement metrics. According to these measurement metrics, the acceptability rates of the results obtained in PLSR, RR, and SVR algorithms were found to be very low. It is observed that the success rate of the predicted values obtained with ANN was at an acceptable scale for the model proposal. Based on these evaluations, the model developed with ANN was preferred in the price estimation study of the fimds. As a result, the model study developed for the price estimation of the ftinds, according to the RMSE value, the error rate per unit share of the estimated fiond price value of the ANN model was found as (+/-) 6.2. The model success percentage is obtained as a prediction success over 90% by looking at the R2 measurement metric result. Also, considering the measurement metric results, it is evaluated that PLSR, RR, and SVR models did not lose their usability for regression problems.