Bilgisayar Ağlarında Veri Trafik Akışının Analizi
Citation
YALÇIN, Erdal Can, Bilgisayar Ağlarında Veri Trafik Akışının Analizi, Fatih Sultan Mehmet Vakıf Üniversitesi Lisansüstü Eğitim Enstitüsü Bilgisayar Mühendisliği Anabilim Dalı, Yayımlanmamış Yüksek Lisans Tezi, 2019.Abstract
Büyük kurumsal firmalar gelişimlerini teknolojiye bağlı kalmalarıyla açıklamaktadırlar. Her
dönemde bir önceki dönemin teknolojisi kullanılıp bir sonraki dönemde yeni atılımlar içinde
olmaları, firmaların büyümelerinin önünü açmaktadır. Şuan dünyanın en büyük
firmaları/yapıları, büyümelerinin sebebini insanların kullandıkları bilgileri öğrenmeleri ile
açıklamaktadırlar. Bunun en iyi örneği her bireyin bilgisayarındaki tarayıcılardaki arama
motorlarıdır. Bu tarayıcılarda insanların ilgi,istek,tutumlarının ve düşüncelerinin neler olduğu
tespit edilerek,sürekli bu veriler saklanmaktadır. Bu verilerle elde edilen bilginin önemi ve
özellikle ileride bu bilgilerin hangi yapılara dönüşeceği önceden bilinmesi, teknolojiyi kullanan
firmaların/yapıların önem verdiği alanlardandır. Burada bilginin ileride neye
dönüşeceğini,insanlar arasındaki ağın ne şekilde olduğunu ve zamanla ihtiyaçların belirlenmesi
için verilerin arasındaki ilişkinin tespiti daha da önem kazanacaktır. Tespit edilen verilerle
insanlar teknolojiyi tahmin edip gerekli durumlarda önlemler alabilecek ve kendilerini ileride
ki değişime göre güncelleme fırsatı bulacaklardır.
Yapılan tezde İstanbul Ayvansaray Üniversitesi, İnternet ve Ağ Teknolojileri 01.03.2018 ile
10.05.2018 tarihleri arasında (9 hafta) öğrencinin kullandığı laboratuvarda ders içeriğinde
kullanılan verilerin akışı kontrol edilmiştir. Öğrencilerin kullandıkları bilgisayarların bir dönem
boyunca haftanın aynı gününde ve aynı saatinde kullanımlarının analizi yapılmıştır. Yapılan
analiz sonucunda öğrencilerin gittikleri web siteleri ayıklanıp belli sonuçlara ulaşılmıştır.
Ağ üzerinden geçen data trafiği izlenmiş ve öğrenci bazlı gidilen websitelerinin hangi oranda
gittiklerini birliktelik kurallarını kullanarak tespit edilmiştir. Kullanılan birliktelik kurallarına
en uygun veri olması sebebiyle Apriori algoritması ile incelenmiştir. Eclat algoritmasıyla
karşılaştırılmış ve Anaconda derleyicisiyle analizi yapılmıştır. R studio ile görselleştirilmiştir.
Öğrencilerin yaş, not, cinsiyet gibi değişkenlerinin de analize dahil edilerek sonuçlara etkisi
gözlenmiştir. Bu veri kümesiyle gidilen websitelerin birbiriyle ilişkileri ele alınmış ve izlenen
ağın analizi yapılarak, kullanılan yöntemin sonuçları belirtilmiştir. Large companies explain their development with technology. The use of the technology of the
previous period in each period and the new breakthroughs for the next period pave the way for
companies to grow. The biggest companies / structures of the world are explaining the reason
of their growth by learning the information that people use. The best example of this is the
search engines in browsers on each individual's computer. In these scanners, it is determined
that people's interests, wishes, attitudes and thoughts are determined and these data are kept
constantly. The importance of the information obtained with these data and the fact that it is
known in advance that this information will be transformed into the structures, is one of the top
where the companies / structures using technology are important. Here, it will become even
more important to determine what the information will turn into in the future, how the network
is between people and the relationship between the data to determine the needs over time. With
the data identified, people will be able to estimate technology and take measures where
necessary, and they will have the opportunity to update themselves according to future changes.
In the thesis, the flow of data used in the course content was checked in the laboratory used by
the student between the dates of 01.03.2018 and 10.05.2018 (9 weeks). The computers used by
the students were analyzed during the same day of the week and at the same time. As a result
of the analysis, the websites that students went to were detected and certain results were
reached.
The data traffic over the network was monitored and the frequency at which web sites were
visited was determined by using the association rules. Because it is the most suitable data for
the association rules, it has been examined with Apriori algorithm, compared with Eclat
algorithm and analyzed with Anaconda compiler and visualized with R studio. The effect of
variables such as age, grade and gender on the results were also included in the analysis. The
relationships of the websites visited with this data set were discussed and the monitored network
was analyzed and the results of the method used were specified.