Son zamanlarda internet üzerinde üretilen veriler her geçen gün artmaktadır. Bu verilerin önemli bir çoğunluğunu da metinler oluşturmaktadır. Metinlerin çoğunlukta olması, bilim insanlarını bu alanda daha fazla çalışma yapmaya yönlendirmiştir. Metinler üzerinde yapılan çalışmaların en popüler olanı Konu Modelleme (KM) yöntemleridir. Konu modelleme yöntemleri metinlerin içerisinde gizli veya açık geçen konuları tespit etmektir. Bu çalışma kapsamında elde edilen metin veri kümeleri üzerinde Gizli Dirichlet Ayrımı (GDA), ilişkisel konu modeli (İKM) ve yapısal konu modeli (YKM) yöntemleri uygulanmıştır. Ayrıca çalışma da konu modelleme yöntemlerinin sonuçlarını karşılaştırabilmek için konu tutarlılığı ve şaşkınlık değerleri kullanılmıştır. Çalışma da kaynak olarak kullanılan yayında uygulanan yöntemlerin sonuçları ile kendi çalışmamızda benzer sonuçlar elde edilmiştir. Şaşkınlık değerine ek olarak kullandığımız tutarlılık değeri de aynı şekilde YKM yönteminde daha başarılı sonuçlar elde edildiği gösterilmiştir. Tutarlılık değeri 0.509 olarak YKM tip 3 yöntemi en iyi sonucu vermiştir. Ayrıca bundan sonra yapılacak çalışmalar içinde karşılaştırma yöntemi gösterilmiştir.
Recently, the data produced on the internet is increasing day by day. A significant majority of this data consists of texts. The fact that the texts are in the majority has led scientists to do more studies in this field. The most popular of the studies on texts is Topic Modeling (KM) methods. Topic modeling methods are to identify hidden or open topics in texts. Hidden dirichlet separation (GDA), relational subject model (HRM) and structural subject model (YKM) methods were applied on the text datasets obtained within the scope of this study. In addition, subject consistency and astonishment values were used in the study to compare the results of subject modeling methods. Similar results were obtained in our study with the results of the methods applied in the publication used as a source in the study. In addition to the surprise value, the consistency value we used has also shown that more successful results are obtained in the YKM method. With a consistency value of 0.509, YKM type 3 method gave the best results. In addition, the method of comparison is shown in future studies.
Primary Language | Turkish |
---|---|
Subjects | Computer Software |
Journal Section | Research Articles |
Authors | |
Publication Date | May 31, 2022 |
Submission Date | April 3, 2022 |
Acceptance Date | April 21, 2022 |
Published in Issue | Year 2022 Volume: 3 Issue: 2 |
Journal of ESTUDAM Information is indexed by Index Copernicus, Google Scholar, ASOS Index and ROAD index.