Оцінка когерентності тексту на основі графа узгодженості словосполучень для виявлення симптомів шизофренії
DOI:
https://doi.org/10.35681/1560-9189.2020.1.1.207786Ключові слова:
обробка природної мови, оцінка когерентності тексту, граф узгодженості словосполучень, виявлення симптомів шизофренії, екстракція словосполученьАнотація
Процес виявлення симптомів ментальної хвороби та розрізнення її підтипу є складним процесом, що потребує відповідної кваліфікації фахівця. Аналіз мовлення пацієнтів є складовою процесу діагностування симптомів шизофренії: бідність мовлення, відсутність постійного фокусу на темі мовлення, постійне застосування метафор тощо. Таким чином, застосування методів обробки природної мови дозволяє створювати допоміжні інструменти діагностики ментальних захворювань. Одним із зазначених симптомів є некогерентне мовлення пацієнта — відсутність тематичного зв’язку між елементами тексту. У зв’язку з відсутністю достатньої кількості даних пацієнтів (зазвичай, до 100 зразків), застосування методів машинного навчання для виявлення некогерентного мовлення та інших симптомів ментального захворювання на основі аналізу транскрипції діалогів пацієнтів є неефективним. У роботі здійснено порівняльний аналіз сучасних методів виявлення симптомів шизофренії і біполярного розладу на основі оцінки когерентності тексту. Також розглянуто інші лінгвістичні характеристики тексту, що можуть свідчити про симптоми ментального захворювання. Враховуючи переваги та недоліки розглянутих методів, запропоновано метод оцінки когерентності тексту на основі графа узгодженості словосполучень. Пропонований метод здійснює оцінку когерентності тексту як семантичної цілісності; крім того, додатково розраховує-ться зв’язність тексту на основі аналізу спільних термінів і наявності кореферентного зв’язку. За допомогою використання автономного веб-серверу Stanford CoreNLP виконано попередню обробку англомовних текстів: токенізацію, екстракцію словосполучень, пошук кореферентних об’єктів. Після формування векторів ознак виконано навчання моделі-класифікатора з метою подальшого аналізу впливу кожної характеристики тексту на класифікацію вхідних даних. Отримані результати можуть свідчити про доцільність застосування графа узгодженості словосполучень: значимості семантичної когерентності та когезії тексту є вищими порівняно з іншими метриками. Іл.: 2. Бібліогр.: 14 найм.
Посилання
Altamura A. C., Goikolea J. M. Differential diagnoses and management strategies in patients with schizophrenia and bipolar disorder. Neuropsychiatric Disease and Treatment. 2008. Vol. 4, No. 1. P. 311–317.
Elvevåg B., Foltz P.W., Weinberger D.R., Goldberg T.E. Quantifying incoherence in speech: An automated methodology and novel application to schizophrenia. Schizophrenia Research. 2007. Vol. 93. No. 1–3. P. 304–316.
Automated analysis of free speech predicts psychosis onset in high-risk youths / Bedi G., et al. npj Schizophrenia. 2015. Vol. 1. P. 1–20.
Iter D., Yoon J., Jurafsky D. Automatic Detection of Incoherent Speech for Diagnosing Schizophrenia. Proceedings of the Fifth Workshop on Computational Linguistics and Clinical Psychology: From Keyboard to Clinic. 2018. P. 136–146.
Coherence models in schizophrenia / Just S., et al. Proceedings of the Sixth Workshop on Computational Linguistics and Clinical Psychology. 2019. P. 126–136.
Panicheva P., Litvinova T. Semantic Coherence in Schizophrenia in Russian Written Texts. 2019 25th Conference of Open Innovations Association (FRUCT). 2019. P. 241–249.
Objective Assessment of Social Skills Using Automated Language Analysis for Identification of Schizophrenia and Bipolar Disorder / Voleti R. et al. Interspeech 2019. 2019. P. 1433–1437.
Gutierrez E., Cecchi G., Corcoran C., Corlett P. Using Automated Metaphor Identification to Aid in Detection and Prediction of First-Episode Schizophrenia. Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing. 2017. P. 2923–2930.
Angeli G., Premkumar M. J., Manning C. Leveraging Linguistic Structure For Open Domain Information Extraction. Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Vol. 1: Long Papers). 2015. P. 344–354.
Pogorilyy S., Kramov A. Coreference Resolution Method Using a Convolutional Neural Network. Proceedings of 2019 IEEE International Conference on Advanced Trends in Information Theory. 2019. P. 397–401.
Pohorilyy S.D., Kramov A.A. Metod rozrakhunku koherentnosti ukrayins'koho tekstu. Reyestratsiya, zberihannya i obrob. danykh. 2018. T. 20, No.4. S. 64–75. DOI: 10.35681/1560-9189.2018. 20.4.178945
Andreasen N.C. Scale for the assessment of thought, language, and communication (TLC). Schizophrenia bulletin. 1986. Vol. 12. No. 3. P. 473-482.
Seeman M.V., Cole H.J. The effect of increasing personal contact in schizophrenia. Comprehensive psychiatry. 1977. Vol. 18. No. 3. P. 283-293.
English Speeches with English Subtitles — English Speeches. URL: https://www.englishspeecheschannel.com/english-speeches/ (Last accesses: 12.04.2020).