XIX. Türkiye'de İnternet Konferansi

BaşlıkMakine Öğrenmesi ile Duygu Analizinde Veri Seti Performansı
Öğrenci
Yazar(lar) Yazar 1
Name: Hatice Nizam
Org: İstanbul Üniversitesi Bilgisayar Mühendisliği Bölümü
Country: TR
E-mail: haticenizam_AT_outlook.com

Yazar 2
Name: Saliha Sıla Akın
Org: ERS Turizm Yazılım Şirketi
Country: TR
E-mail: sila.akin_AT_hoteladvisor.net
Diğer Yazar(lar)hatice_nizam_AT_hotmail.com
Anahtar KelimelerDuygu Analizi, Metin Sınıflandırma, Makine Öğrenmesi, Denetimli Öğrenme Yaklaşımı, Veri Seti Seçimi
ÖzetSosyal Medyada Makine Öğrenmesi ile Duygu Analizinde Dengeli ve Dengesiz Veri Setlerinin Performanslarının Karşılaştırılması Bu çalışmada, makine öğrenmesi yöntemlerinden denetimli öğrenme yaklaşımı kullanılarak sosyal medyada sentiment analizi çalışması yapılmıştır. Denetimli öğrenme yaklaşımında özellik olarak tweetlerdeki tüm kelimelerin seçildiği eğiticisiz yöntem kullanılmıştır. Tweetler makine öğrenmesi yöntemlerinden unigram özelliğine göre analiz edilmiştir. Bazı gıda firmalarının çeşitli ürünlerine ait yapılan yorumlardan oluşturulan veri seti Twitter üzerinden manuel elde edilmiştir. Tweetler pozitif, negatif ve nötr olarak işaretlenerek 3 sınıfta toplanmıştır. Çalışmada pozitif, negatif ve nötr sınıftaki veri dağılımının Weka kütüphanesinde yer alan Naive Bayes (NB), Random Forest (RF), Sequential Minimal Optimization (SMO), Decision Tree (J48) ve 1-Nearest Neighbors (IB1) sınıflandırma algoritmalarının gösterdikleri başarım sonuçlarına etkisi incelenmiştir. Elde edilen deneysel sonuçlarda sınıflar arası uygun dağılım gösteren dengeli veri setinin (B veri seti) dengesiz veri setine (A veri seti) göre daha iyi performans sonuçlarının alındığı gözlemlenmiştir. En iyi performans gösteren sınıflandırma algoritması %72.33 ortalama doğruluk başarı oranıyla SMO olmuştur.
Başlıklar Inet-Bildiri
Sosyal Ağlar: Analiz ve toplumsal etkileri
Dosya  48.43 KB
 

 

Powered by OpenConf®
Copyright ©2002-2014 Zakon Group LLC