Технологія екстрагування нових подій за визначеною тематикою із соціальної мережі Twitter
DOI:
https://doi.org/10.35681/1560-9189.2017.19.3.126542Ключові слова:
екстрагування подій, метод екстрагування подій, блок-схема екстрагування нових подійАнотація
Розглянуто проблеми і актуальність екстрагування подій. Проаналізовано основні підходи до екстрагування подій з інформаційних потоків. Сформовано свої методи та підходи до виявлення подій і визначення їхньої новизни (дублювання подій). На основі проведеного досліду запропоновано використовувати технологію екстрагування подій на основі спеціальних словників з тригерами подійності, класифікацією «подія/не подія» за методом класифікації наївного Байеса та екстрагування понять та аналізу на дублювання понять з минулими подіями з бази даних подій. Представлено підходи та алгоритм роботи технології на базі цих методів.Посилання
Netcraft — Internet Security and Data Mining. URL: https://news.netcraft.com/archives/ 2017/04/21/april-2017-web-server-survey.html (Last accessed: 30.03.2017). April 2017 Web Server Survey.
Nate Chambers and Dan Jurafsky. Unsupervised Learning of Narrative Schemas and their Participants. Proc. of ACL. 2009.
Dodonov O.H., Lande D.V., Putyatin V.H. Informatsiyni potoky v hlobalnykh kompyuternykh merezhakh. Kyyiv: Nauk.dumka, 2009. 295 s.
Kleinberg J. Authoritative sources in a hyperlinked environment. In Proc. of ACM-SIAM Symposium on Discrete Algorithms. 1998. 46(5). P. 604–632.
Lande D.V., Snarskij A.A. Podhod k sozdaniju terminologicheskih ontologіj. Ontologija proektirovanija. 2014. # 2(12). S. 83–91.
Josu Goikoetxea, Eneko Agirre, and Aitor Soroa. Single or Multiple? Combining Word Representations Independently Learned from Text and WordNet. 2016.
Heng Ji. Relation extraction event extraction. 2014. URL: http://nlp.cs.rpi.edu/course/spring14/lecture9.pdf