Побудова направлених зважених мереж термінів із застосуванням Part-of-speech tagging


  • О. О. Дмитренко Інститут проблем реєстрації інформації НАН України, Україна



Ключові слова:

текстовий корпус, обробка природньої мови, Part-ofspeech (PoS) tagging, термінологічна онтологія, мережа термінів


Розглянуто новий метод побудови термінологічних онтологій у вигляді мереж із ключових термінів (ключових слів і словосполучень) текстів, що змістовно пов’язані з певною предметною галуззю. Виокремлення ключових слів і словосполучень з тематичних текстових потоків і подальша побудова направленої зваженої мережі термінів здійснюються на основі застосування більш широкої обробки природної мови, що базується на розбитті на частини мови (Part-of-speech tagging). Комп’ютерну обробку текстових корпусів і побудову направлених зважених мереж термінів представлено у вигляді цілісної методики. У статті показано апробацію запропонованої методики на прикладі відомої народної європейської казки «Little Red Cap» і побудовано направ-лену зважену мережу зі слів і словосполучень, які відповідають окремим ключовим поняттям у досліджуваному творі.


Інформаційно-аналітичні системи обробки даних