Kullanıcı ve Öge Temelli Yöntemlerin Birlikte Kullanıldığı İşbirlikçi Filtreleme Tekniği Geliştirilmesi
Citation
ÖZDEMİR, Yusuf, Kullanıcı ve Öge Temelli Yöntemlerin Birlikte Kullanıldığı İşbirlikçi Filtreleme Tekniği Geliştirilmesi, Fatih Sultan Mehmet Vakıf Üniversitesi Lisansüstü Eğitim Enstitüsü Bilgisayar Mühendisliği Anabilim Dalı Bilgisayar Mühendisliği Programı, Yayımlanmamış Yüksek Lisans Tezi, İstanbul 2021.Abstract
Bu çalışmada öneri sistemlerinde işbirlikçi filtreleme tekniklerinden “kullanıcı temelli işbirlikçi filtreleme” ve “öge temelli işbirlikçi filtreleme” birlikte kullanılıp, bunlara ek olarak kullanıcı özelliklerinden de faydalanan daha önce çalışılmamış hibrit bir öneri sistemi modellenip uygulama haline getirilmiştir. Ayrıyeten önerilen çözüm öneri sistemlerindeki soğuk başlangıç problemine yönelik kullanılabilir. Yeni bir üye geldiğinde geçmişi olmadığı için bu kişiye ne önereceğini sistem tam olarak bilemez. Bu probleme soğuk başlangıç problemi denir.
Öneri sistemlerinde eldeki verilere bakılıp benzerlik kurularak tavsiyeler oluşturulur. Klasik öneri sistemlerinde öncelikle pearson korelasyonu ile kullanıcı kullanıcı benzerliği veya öge öge benzerliği hesaplanır. Çalışılan modelde pearson ile kullanıcıların ögelere verdikleri oylar üzerinde benzerlik katsayıları çıkarıldı. Tahmin mekanizmalarıyla birlikte yaygın olarak kullanımı bilinen sınıflandırma algoritmalarından K ortalama kümeleme algoritmasının yanı sıra bu alanda önerilen yönteme benzer kullanımı olmayan karınca kolonisi optimizasyon algoritması (ACO), genetik algoritma ve yapay arı kolonisi algoritması gibi farklı algoritmalar araştırılmış ve ACO’ya dayalı kümeleme yapılmıştır. Bu kümelerdeki kullanıcıların birbirine benzediğini kabul edilip bunlar üzerinden tahminler yapılmaktadır. Önerilen modelde film önerisinde bulunmak için temel olarak 3 farklı türde tahmin yapılmaktadır. Bunlar klasik tahmin hesabı (Pearson, Öklid vb.), kullanıcı özelliklerini işin içine sokarak yapılan tahmin (yaş, cinsiyet vb.) ve kümeleme algoritmaları ile tahmin (karınca kolonisi algoritması, K ortalama kümeleme vb.). Çıkan bu sonuçların tümü için doğruluk hesaplaması yapılarak modelin işlevselliği test edilmiştir. Sonuçlar önerilen yeni hibrit sistemin klasik yöntemden daha iyi sonuçlar verdiğini göstermiştir. In this study, by using collaborative filtering techniques "user-based collaborative filtering" and "item-based collaborative filtering" in recommendation systems, a hybrid recommendation system that has not been studied before has been modeled and made into an application, which also benefits from user features. Also, the proposed solution can be used to solve cold start problem. When a new member arrives, the system does not know exactly what to recommend to this person, as he has no history. This problem is called the cold start problem.
Recommendations are created by looking at the available data and establishing a similarity in the recommendation systems. In classical recommendation systems, pearson correlation and user-user similarity or item-item similarity are calculated first. In the model studied, similarity coefficients on the rates given by the users to the items with pearson were calculated. In addition to the K average clustering algorithm, which is one of the widely used classification algorithms with prediction mechanisms, different algorithms such as the ant colony optimization algorithm, genetic algorithm and artificial bee colony algorithm, which there is no similar usage with recommended system in this field, were researched and ACO was preferred to cluster data. It is accepted that the users in these clusters are alike and estimates are made on them. Basically, 3 different types of predictions are made to recommend a movie in the proposed model. These are classical prediction calculations (Pearson, Euclid etc.), prediction made by involving user characteristics (age, gender, etc.), and prediction with clustering algorithms (ant colony algorithm, K mean clustering, etc.). The functionality of the model was tested by calculating the accuracy for all of these results. The results showed that the proposed new hybrid system gives better results than the conventional method.