Başlık | Makine Öğrenmesi ile Duygu Analizinde Veri Seti Performansı |
Öğrenci | if ($sonuc[2] == 'T') { print "Evet"; } else { print "Hayır"; } ?> |
Yazar(lar) |
Yazar 1 Name: Hatice Nizam Org: İstanbul Üniversitesi Bilgisayar Mühendisliği Bölümü Country: TR E-mail: haticenizam_AT_outlook.com Yazar 2 Name: Saliha Sıla Akın Org: ERS Turizm Yazılım Şirketi Country: TR E-mail: sila.akin_AT_hoteladvisor.net |
Diğer Yazar(lar) | hatice_nizam_AT_hotmail.com |
Anahtar Kelimeler | Duygu Analizi, Metin Sınıflandırma, Makine Öğrenmesi, Denetimli Öğrenme Yaklaşımı, Veri Seti Seçimi |
Özet | Sosyal Medyada Makine Öğrenmesi ile Duygu Analizinde Dengeli ve Dengesiz Veri Setlerinin Performanslarının Karşılaştırılması Bu çalışmada, makine öğrenmesi yöntemlerinden denetimli öğrenme yaklaşımı kullanılarak sosyal medyada sentiment analizi çalışması yapılmıştır. Denetimli öğrenme yaklaşımında özellik olarak tweetlerdeki tüm kelimelerin seçildiği eğiticisiz yöntem kullanılmıştır. Tweetler makine öğrenmesi yöntemlerinden unigram özelliğine göre analiz edilmiştir. Bazı gıda firmalarının çeşitli ürünlerine ait yapılan yorumlardan oluşturulan veri seti Twitter üzerinden manuel elde edilmiştir. Tweetler pozitif, negatif ve nötr olarak işaretlenerek 3 sınıfta toplanmıştır. Çalışmada pozitif, negatif ve nötr sınıftaki veri dağılımının Weka kütüphanesinde yer alan Naive Bayes (NB), Random Forest (RF), Sequential Minimal Optimization (SMO), Decision Tree (J48) ve 1-Nearest Neighbors (IB1) sınıflandırma algoritmalarının gösterdikleri başarım sonuçlarına etkisi incelenmiştir. Elde edilen deneysel sonuçlarda sınıflar arası uygun dağılım gösteren dengeli veri setinin (B veri seti) dengesiz veri setine (A veri seti) göre daha iyi performans sonuçlarının alındığı gözlemlenmiştir. En iyi performans gösteren sınıflandırma algoritması %72.33 ortalama doğruluk başarı oranıyla SMO olmuştur. |
Başlıklar |
Inet-Bildiri Sosyal Ağlar: Analiz ve toplumsal etkileri |
Dosya | 48.43 KB |