Метод формування та кластеризації кореляційних мереж понять

Автор(и)

  • Д. В. Ланде Інститут проблем реєстрації інформації НАН України, Україна
  • Л. Страшной Каліфорнійський університет в Лос-Анджелесі, США
  • І. В. Балагура Інститут проблем реєстрації інформації НАН України, Україна

DOI:

https://doi.org/10.35681/1560-9189.2021.23.2.239209

Ключові слова:

кореляційна мережа, динаміка публікацій, GoogleBooksNgramViewer, візуалізація мережевих структур, кластерний аналіз

Анотація

Для вирішення задачі формування та кластеризації понять запропоновано методику формування, кластеризації, ранжирування та подальшої візуалізації спрямованих кореляційних мереж, зв’язки яких визначаються на основі рядів динаміки, що відповідають цим поняттям. Як приклади розглянуто часові ряди динаміки вживання термінів, що формуються сервісом Google Books Ngram Viewer для формування кореляційної мережі наукових понять, і часові ряди динаміки захворюваності на коронавірус у різних країнах для формування та кластерізації мережі країн за ознакою подібності відповідних статистичних рядів. Наведена методика може застосовуватися з метою узагальнення множини сутностей без явно виражених зв’язків між ними на основі даних, отриманих в аналітичних системах різного призначення

Посилання

Ping Luo, Kai Shu, Junjie Wu, Li Wan, and Yong Tan. Exploring Correlation Network for Cheating Detection. ACM Transactions on Intelligent Systems and Technology. Vol. 11, Issue 1. February 2020. Article No. 12. Р. 1–23. https://doi.org/10.1145/3364221

Saxena A., Prasad M., Gupta A., Bharill N., Patel O.P., Tiwari A., Lin C.-T. (2017). A review of clustering techniques and developments. Neurocomputing, 267, 664–681. doi:10.1016/j.neucom. 2017.06.053

Foreman J. W. Using Data Science to Transform Information into Insight Data Smart. Wiley, 2013.

Lande D.V., Snarskii A.O. Networks determined by the dynamics of thematic information streams. Data Recording, Storage & Processing. 2020. Vol. 22, No. 1. P. 56–61. DOI: 10.35681/1560-9189.2020.1.1.207784.

Lande D., Strashnoy L. Cross-Correlation of Publications Dynamics and Pandemic Statistics. Available at SSRN: https://ssrn.com/abstract=3625725 or DOI: https://dx.doi.org/10.2139/ssrn.3625725 (June 12, 2020). 9 p.

Cherven K. Mastering Gephi Network Visualization. Packt Publishing, 2015.

Lande D., Strashnoy L. Directed Correlation Networks, Determined by the Dynamics of COVID-19 Distribution in Various Countries. Available at SSRN: http://ssrn.com/abstract=3674041; DOI: https://dx.doi.org/10.2139/ssrn.3674041 (Posted: 28 Aug 2020). 7 p.

Coronavirus Source Data. URL: https://ourworldindata.org/coronavirus-source-data

Coronavirus disease (COVID-19) Weekly Epidemiological Update and Weekly Operational Update. URL: https://www.who.int/emergencies/diseases/novel-coronavirus-2019/situation-reports/

##submission.downloads##

Опубліковано

2021-06-29

Номер

Розділ

Математичні методи обробки даних