ÇATAK Ferhat Özgür
Danışman : Prof. Dr. M. Erdal BALABAN
Anabilim Dalı : Enformatik
Programı : -
Mezuniyet Yılı : 2014
Tez Savunma Jürisi : Prof. Dr. M. Erdal BALABAN
Prof. Dr. Sevinç GÜLSEÇEN
Doç. Dr. Vedat COŞKUN
Prof. Dr. Rauf N. NİŞEL
Prof. Dr. Mehpare TİMOR
Bulut Bilişim Sistemlerinde Eşle/İndirge Yöntemi Uygulanarak Veri Madenciliği Yazılım Çatısının Geliştirilmesi
Makine öğrenmesi, özellikle sınıflandırma ve regresyon problemlerinin çözümüne olanak sağlamaktadır. Makine öğrenmesi yöntemleri arasında destek vektör makinesi (DVM) algoritması yüksek genelleme özelliğinden dolayı en çok kullanılan sınıflandırma yöntemidir. Bununla beraber, DVM sınıflandırma algoritması yüksek boyutlu veri setleri için ihtiyaç duyduğu hesaplama gereksinimleri oldukça yüksektir.
Bu çalışmada, çok sınıflı destek vektör makinesi algoritmasının bulut bilişim sistemleri üzerinde Eşle/İndirge tekniği ile eğitilmesi incelenmiştir. Bu çalışmayı dört bölüme ayırmak mümkündür.
Birinci bölümde bulut bilişim sistemleri ile ilgili bilgi verilmektedir. Bulut sistemlerde yer alan servis modelleri, dağıtım modelleri, bilimsel araştırmalar için bulut bilişim sistemleri, fonksiyonel programlama ve Eşle/İndirge konuları incelenmiştir.
İkinci bölümde, DVM algoritması incelenmektedir. DVM algoritmasının sınıflandırma ve regresyon problemlerinde kullanımı araştırılmıştır.
Üçüncü bölümde DVM sınıflandırma algoritmasının Eşleİndirge (MapReduce) tekniği ile dağıtık mimari bulut bilişim sunucuları üzerinde yüksek boyutlu veri setlerinin eğitilmesi anlatılmaktadır. Bulut bilişim sistemlerinde oldukça sık kullanılan Eşleİndirge tekniğinin ve fonksiyonel programlamanın tarihsel gelişimi anlatılmaktadır.
Dördüncü bölüm tezin uygulama kısmını oluşturmaktadır. İki kısımdan oluşmaktadır. Birinci kısımda California Irvine Üniversitesi (UCI) tarafından makine öğrenmesi için yayınlanan veri setlerinden yazı ve rakam tanımaya yönelik veri setleri kullanılarak, sadece ikili sınıflandırmaya izin veren DVM sınıflandırma algoritmasının, çok sınıflı sınıflandırma teknikleri ile uygulaması gösterilmektedir. İkinci aşamada Türkiye’de bulunan vakıf ve devlet üniversitelerinin sosyal medya mesaj veri seti ile sınıflandırılması yapılmıştır. Eşleİndirge tekniği ile ortaya çıkan modellerin testi için 10 parçalı çapraz doğrulama yöntemi uygulanarak, her yinelemedeki model iyileşmesi grafiklerle gösterilmiştir.
Dostları ilə paylaş: |