Метод побудови і використання семантичних моделей для моніторингу суспільної думки
DOI:
https://doi.org/10.35681/1560-9189.2018.20.4.178928Ключові слова:
модель предметної області, семантична модель, кластерний аналіз, аналіз тональності, контент-моніторинг, моніторинг суспільної думкиАнотація
Запропоновано метод побудови та використання семантичних моделей (СМ) з метою безперервного в часі моніторингу громадської думки (МГД). Під семантичною моделлю в рамках даної роботи розуміється модель предметної області, що має вигляд орієнтованого графа, вершини якого відповідають концептам предметної області, а дуги задають відносини між ними. Семантичні моделі дозволяють використовувати при моніторингу громадської думки результати лінгвостатистичного аналізу текстів (Text Mining), застосування методів екстрагування інформації (Information Extraction), що містяться в текстах з мережі Інтернет. У той час, як існуючі проекти аналізу громадської думки більше орієнтовані на разові (статичні) дослідження громадської думки щодо об’єктів і явищ, запропоновано метод автоматизованої побудови та використання СМ на основі безперервного в часі моніторингу громадської думки в мережі Інтернет. Процедура МГД включає три етапи: побудову та кластеризацію СМ; відбір документів і визначення тональності тематик; візуалізацію результатів. Показано побудову СМ за допомогою алгоритму компактифікованого графа горизонтальній видимості, застосування методів кластерного аналізу для визначення актуальних тематик, оцінювання частки та тональності окремих підтем у складі загального тематичного потоку інформації. Як приклади розглянуто моделі предметних областей, що відповідають темам: «One Belt, One Road», «Nord Stream», «Генетично модифіковані організми». Отримані результати підтверджують можливість використання запропонованого методу моніторингу громадської думки у різних предметних областях.Табл.: 3. Іл.: 5. Бібліогр.: 12 найм.Посилання
Schouten K., Frasincar F. Survey on aspect-level sentiment analysis. IEEE Transactions on Knowledge and Data Engineering. 2016. Issue 28(3). P. 813–830.
Medhat W., Hassan A., Korashy H. Sentiment analysis algorithms and applications: A survey // Ain Shams Engineering Journal. 2014. Issue 5(4). Р. 1093–1113.
Jiang K., Anderton B., Ronald, P., Barnett G. Semantic Network Analysis Reveals Opposing Online Representations of the Search Term «GMO». Global Challenges. 2018. Issue 2(1). Р. 1700082. DOI: https://doi.org/10.1002/gch2.201700082.
Judina D.I., Dudina V.I. Semanticheskaja set' na bigrammah kak metod validizacii re-zul'tatov tematicheskogo modelirovanija v sociologicheskom issledovanii. Zhurnal sociologii i social'noj antropologii. 2016. Vyp. 19(4). C. 71–83.
Sudhahar S., Veltri G., Cristianini N. Automated analysis of the US presidential elections using Big Data and network analysis. Big Data & Society. 2015. Issue 2(1). P. 21–49.
Dodonov A.G., Landje D.V., Berezin B.A. Postroenie i ispol'zovanie semanticheskih mo-delej dlja monitoringa obshhestvennogo mnenija. Mizhnarodna naukovo-praktychna konferentsiya «Intelektual'ni tekhnolohiyi linhvistychnoho analizu»: tezy dopovidey. Kyyiv: NAU, 2018. S. 6.
Lande D.V., Snarskii A.A., Yagunova E.V., Pronoza E.V. The use of horizontal visibility graphs to identify the words that define the informational structure of a text. 12th Mexican International Conference on Artificial Intelligence (MICAI), 2013. P. 209–215. DOI: 10.1109/MICAI.2013.33
Lande D.V. Pidkhody do avtomatychnoho vyznachennya terminolohichnykh osnov ontolohiy. Tezy dopovidey. Mizhnarodnoyi naukovo-tekhnichnoyi konferentsiyi «Intelektual'ni tekhnolohiyi linhvistychnoho analizu». Kyyiv: NAU, 2014. S. 7–9.
Harenberg S., Bello G., Gjeltema L., Ranshous S., Harlalka J., Seay R., Samatova N. Community detection in large-scale networks: a survey and empirical evaluation. Wiley Interdisciplinary Reviews: Computational Statistics, 2014. Issue 6(6). Р. 426–439.
Blondel V.D., Guillaume J.L., Lambiotte R., Lefebvre E. Fast unfolding of communities in large networks. Journal of Statistical Mechanics: Theory and Experiment. 2008. Issue 10. Р. P10008
Newman M.E. Finding community structure in networks using the eigenvectors of matrices. Physical review E. 2006. Iss. 74(3). Р. 036104.
Lande D.V. Identification of information tonality based on Bayesian approach and neural networks. E-preprint arXiv: 0806.2738 (2008).