DOI: https://doi.org/10.35681/1560-9189.2017.19.3.126542

Технологія екстрагування нових подій за визначеною тематикою із соціальної мережі Twitter

S. V. Pryshchepa

Анотація


Розглянуто проблеми і актуальність екстрагування подій. Проаналі­зовано основні підходи до екстрагування подій з інформаційних пото­ків. Сформовано свої методи та підходи до виявлення подій і визна­чення їхньої новизни (дублювання подій). На основі проведеного досліду запропоновано використовувати технологію екстрагування подій на основі спеціальних словників з тригерами подійності, класифікацією «подія/не подія» за методом класифікації наївного Байеса та екстра­гування понять та аналізу на дублювання понять з минулими подіями з бази даних подій. Представлено підходи та алгоритм роботи технології на базі цих методів.

Ключові слова


екстрагування подій; метод екстрагування подій; блок-схема екстрагування нових подій

Повний текст:

PDF

Посилання


Netcraft — Internet Security and Data Mining. URL: https://news.netcraft.com/archives/ 2017/04/21/april-2017-web-server-survey.html (Last accessed: 30.03.2017). April 2017 Web Server Survey.

Nate Chambers and Dan Jurafsky. Unsupervised Learning of Narrative Schemas and their Participants. Proc. of ACL. 2009.

Dodonov O.H., Lande D.V., Putyatin V.H. Informatsiyni potoky v hlobalnykh kompyuternykh merezhakh. Kyyiv: Nauk.dumka, 2009. 295 s.

Kleinberg J. Authoritative sources in a hyperlinked environment. In Proc. of ACM-SIAM Symposium on Discrete Algorithms. 1998. 46(5). P. 604–632.

Lande D.V., Snarskij A.A. Podhod k sozdaniju terminologicheskih ontologіj. Ontologija proektirovanija. 2014. # 2(12). S. 83–91.

Josu Goikoetxea, Eneko Agirre, and Aitor Soroa. Single or Multiple? Combining Word Representations Independently Learned from Text and WordNet. 2016.

Heng Ji. Relation extraction event extraction. 2014. URL: http://nlp.cs.rpi.edu/course/spring14/lecture9.pdf