Визначення вагових значень зв’язків у мережі термінів

Автор(и)

  • D. V. Lande Інститут проблем реєстрації інформації НАН України, Ukraine
  • O. O. Dmytrenko Інститут проблем реєстрації інформації НАН України, Ukraine

DOI:

https://doi.org/10.35681/1560-9189.2019.21.4.199357

Ключові слова:

інформаційний простір, глибинний аналіз тексту, мережева модель, предметна область, мережа термінів, граф горизонтальної видимості, ненаправлена мережа термінів, направлена зважена мережа термінів

Анотація

Розглянуто одну із найбільш актуальних проблем комп’ютерного аналізу природної мови — формалізацію та побудову онтологічних моделей предметних областей на основі текстових корпусів заданої тематики. Завдяки глибинному аналізу текстів та обробці природної мови, вико-ристовуючи лінгвостатистичні методи та методики обчислювальної лінгвістики, побудовано мережеві моделі предметних областей, для забезпечення кращої взаємодії комунікативних актів, поданих у знаково-словесній формі, та комп’ютерних систем. Зокрема, застосовуючи новий підхід до визначення вагових значень зв’язків у мережі понять, як апробацію було побудовано онтологічну модель для предметної області, що пов’язана з кліматичною надзвичайною ситуацією. Подальший аналіз побудованої моделі дав змогу визначити найбільш впливові та значущі зв’язки між відповідними вузлами у мережі термінів, які відповідають певним поняттям розглянутої предметної області.

Посилання

Snarskij A.A., Lande D.V. Modelirovanie slozhnyh setej: ucheb. posob. — Kyiv: OOO «Inzhiniring», 2015. 212 s. ISBN 978-966-2344-44-8

Dodonov A.G., Lande D.V., Putjatin V.G. Kompjuternye seti i analiticheskie issledovanija. Kyiv: IPRI NAN Ukrainy, 2014. 486 s. ISBN 978-966-02-7422-8.

Lande D.V., Subach I.Yu., Boyarinova Yu.Ye. Osnovy teoriyi i praktyky intelektualnoho analizu danykh u sferi kiberbezpeky: navch. posib. — Kyiv: ISZZI «KPI im. Ihorya Sikorskoho», 2018. 297 c.

Frakes W.B., Baeza-Yates R. Information retrieval data structures and algorithms. Prentice Hall, Englewood Cliffs, New Jersey, 1992. 512 р.

Manning C.D., Raghavan P., & Schutze H. An Introduction to Information Retrieval. Camb-ridge University Press, 2009. Р. 22–36.

Lovins J.B. Development of a stemming algorithm. Mech. Translat. & Comp. Linguistics. 1968. 11(1–2). Р. 22–31.

Jongejan B., & Dalianis H. Automatic training of lemmatization rules that handle morphological changes in pre-, in-and suffixes alike. In Proceedings of the Joint Conference of the 47th Annual Meeting of the ACL and the 4th International Joint Conference on Natural Language Processing of the Asian Federation of Natural Language Processing, Р. 145–153. Association for Computational Linguistics, Singapore (2009).

Porter M.F. An algorithm for suffix stripping. Program. 1980. 14(3). Р. 130–137. doi: 10.1108/eb046814

Willett P. The Porter stemming algorithm: then and now. Program. 2006. 40(3). Р. 219–223. doi: 10.1108/00330330610681295.

Salton G., & Buckley C. Term-weighting approaches in automatic text retrieval. Information processing & management. 1988. 24(5). Р. 513–523. doi:10.1016/0306-4573(88)90021-0.

Rajaraman A., & Ullman J.D. Mining of massive datasets. Cambridge University Press, 2011.

Lande D.V., Dmytrenko O.O., Snarskii A.A. Transformation texts into complex network with applying visability graphs algorithms. In: CEUR Workshop Proceedings (ceur-ws.org). Vol-2318 urn:nbn:de:0074- 2318-4. Selected Papers of the XVIІШ International Scientific and Practical Conference on Information Technologies and Security (ITS 2018). 2018. Vol. 2318. Р. 95–106.

Lande D.V., Dmytrenko O.O., Radziyevska O.H. Vyznachennya napryamkiv zvyazkiv u merezhi terminiv. Informatsiyni tekhnolohiyi ta bezpeka. Materialy XIX Mizhnarodnoyi naukovo-praktychnoyi konferentsiyi «ITB-2019». Kyiv: OOO «Ynzhynyrynh», 2019. C. 103–112.

Luque B., Lacasa L., Ballesteros F., Luque J. Horizontal visibility graphs: Exact results for random time series. Physical Review E. 2009. 80(4). doi: 10.1103/PhysRevE.80.046103.

Gutin G., Mansour T., & Severini S. A characterization of horizontal visibility graphs and combinatorics on words. Physica A: Statistical Mechanics and its Applications. 2011. 390(12). Р. 2421–2428. doi:10.1016/j.physa.2011.02.031.

Bezsudnov I.V., Snarskii A.A. From the time series to the complex networks: The parametric natural visibility graph. Physica A: Statistical Mechanics and its Applications. 2014. 414. Р. 53–60. doi: 10.1016/j.physa.2014.07.002.

Lacasa L., Luque B., Ballesteros F., Luque J., Nuno J.C. From time series to complex networks: The visibility graph. Proceedings of the National Academy of Sciences. 2008. 105(13). Р. 4972–4975. doi: 10.1073/pnas.0709247105

Lande D.V., Snarskii A.A., Yagunova E.V., Pronoza E.V. The use of horizontal visibility graphs to identify the words that define the informational structure of a text. In: 2013 12th Mexican International Conference on Artificial Intelligence. 2013. Р. 209–215.

##submission.downloads##

Опубліковано

2019-12-24

Номер

Розділ

Інформаційно-аналітичні системи обробки даних