DOI: https://doi.org/10.35681/1560-9189.2020.22.3.219002

Метод частиномовної розмітки на основі квазіфлексій

M. Y. Dubok, V. V. Tsyganok

Анотація


Якість рекомендацій, що надаються як результат застосування систем підтримки прийняття рішень, значною мірою залежить від якос-ті та достовірності знань, наданих експертами. Вирішення задачі автоматичного визначення неоднозначності у текстових формулюваннях експертів є беззаперечним кроком до підвищення достовірності знань і адекватності моделей, на основі яких здійснюється під-тримка прийняття рішень. Більшість підходів до автоматичного визначення неоднозначності спираються на використання частиномовної розмітки, як першого етапу аналізу при визначенні неоднозначності. Запропоновано метод автоматичної частиномовної розмітки на основі квазіфлексій (змінюваних складових слова), точність якого є співмірною із наявними реалізаціями підходу на основі правил. До переваг підходу на основі правил відносяться: значне зменшення необхідного обсягу інформації, нескладне впровадження вдосконалень аналізатора та висока ступінь портативності компонентів (правил, лексики, квазіфлексій, винятків).


Ключові слова


підтримка прийняття рішень; частиномовна розмітка; квазіфлексія; неоднозначність

Повний текст:

PDF

Посилання


Tsyganok V.V., Andriichuk O.V. Eksperymentalne doslidzhennya metodu vyznachennya zmistovoyi podibnosti ob"yektiv baz znan system pidtrymky pryynyattya rishen. Reyestratsiya, zberihannya i obrob. danykh. 2014. T. 16. No. 4. S. 64–75.

Tocenko V.G. Metody i sistemy podderzhki prinjatija reshenij. Algoritmicheskij aspekt. IPRI NANU. Kiev: Nauk. dumka, 2002. 382 s.

Alomari R. and Elazhary H. Implementation of a Formal Software Requirements Ambiguity Prevention Tool. 2018.

Winkler S. Ambiguity: Language and Communication. 2015.

Tsyganok V.V. Kontseptsiya stvorennya system pidtrymky pryynyattya rishen, shcho adaptyvni do rivnya kompetentnosti ekspertiv. Reyestratsiya, zberihannya i obrob. danykh. 2011. T. 13. 2. S. 106–114.

Svidotstvo pro derzhavnu reyestratsiyu avtorskoho prava na tvir # 8669. Ministerstvo osvity i nauky Ukrayiny derzhavnyy departament intelektualnoyi vlasnosti. Komp"yuterna prohrama «Systema pidtrymky pryynyattya rishen SOLON-3» (SPPR SOLON-3) / Totsenko V.H., Kachanov P.T., Tsyganok V.V. zareyestrovano 31.10.2003.

Svidotstvo pro reyestratsiyu avtorskoho prava na tvir # 75023. Komp"yuterna prohrama «Systema rozpodilenoho zboru ta obrobky ekspertnoyi informatsiyi dlya system pidtrymky pryynyattya rishen – «Konsensus-2» / Tsyganok V.V., Royik P.D., Andriychuk O.V., Kadenko S.V. Vid 27/11/2017.

Gleich B., Creighton O. and Kof L. Ambiguity Detection: Towards a Tool Explaining Ambiguity Sources. 2010.

Pisceldo F., Adriani M., and Manurung R. Probabilistic Part Of Speech Tagging for Bahasa Indonesia. 2009.

Chanod J., and Tapanainen P. Tagging French — Comparing a Statistical and a Constraint-based Method. 1995.

Roche E. and Schabes Y. Deterministic Part-of-Speech Tagging with Finite-State Transducers. 1995.

Altunyurt L., Orhan Z., and Gungor T. Towards Combining Rule-Based and Statistical Part of Speech Tagging in Agglutinative Languages. 2007.

Altunyurt L., Orhan Z., and Gungor T. A Composite Approach for Part of Speech Tagging in Turkish. 2006.

Sajjad H. Statistical Part of Speech Tagger for Urdu. 2007.

Chew P.A., Bader B.W., and Rozovskaya A. Using DEDICOM for Completely Unsupervised Part-of-speech Tagging. 2009.

Karlsson F., Voutilainen A., Heikkila J., Anttilla A. Constraint Grammar: a Language Independent System for Parsing Unrestricted Text. 1995.

Brill E. A Simple Rule-based Part of Speech Tagger. Proceedings of 3rd Conference on ANLP. 1992. Р. 152–155. Trento.

Brill E., Transformation-based Error-driven Learning and Natural Language Processing: a Case Study in Part-of-speech Tagging. Computational Linguistics. 1995. 21(4). Р. 543–565.

Schutze H., Distributional Part-of-Speech Tagging. In Proceedings of the 7th Conference of the European Chapter of the Association for Computational Linguistics. 1995. Р. 141–148.

Weischedel R., Meteer M., Schwartz R., Ramshaw L. and Palmuzzi J. Coping with Ambiguity and Unknown Words through Probabilistic Models. Computational Linguistics. 1993. 19(2). Р. 359–382.

Tapanainen P., and Voutilainen A. Tagging Accurately — don’t Guess if you Know. In: Proceedings of the Fourth Conference on Applied Natural Language Processing. Stuttgart. 1994.

Hardie A. The Computational Analysis of Morphosyntactic Categories in Urdu. PhD thesis, Lancaster University, 2003.

Voutilainen A. Morphological Disambiguation. In: Karlsson et all. 1995.

Lande D.V., Darmohval A.T., Zhigalo V.V. Matrichnye kriterii kachestva vyjavlenija podobnyh dokumentov v informacionnyh potokah: zb. nauk. prats Instytutu problem modelyuvannya v enerhetytsi im. H.Ye. Pukhova NAN Ukrayiny. Kyyiv: IPME im. H.Ye. Pukhova NAN Ukrayiny, 2009. Vyp. 53. Bibliohr.: 13 nazv. — ros.

Lande D.V. Elementy komp"yuternoyi linhvistyky v pravoviy informatytsi. Kyyiv: NDIIP NAPrN Ukrayiny, 2014. 168 s. ISBN 978-966-2344-33-2.