Автоматическое реферирование китайской правовой информации

Dmitry Lande, Yang Zijiang, Zhu Shiwei, Guo Jianping, Wei Moji

Анотація


Работа посвящена методу автоматического реферирования правовой информации, представленной на китайском языке. Рассмотрена модель реферата и процедура его формирования. Предложено два подхода, а именно: для определения уровня важности предложений - перейти к определению весовых значений отдельных иероглифов, а не слов в тексте документов и рефератов. Также предложено рассмотрение модели документов как сети предложений для выявления наиболее важных предложений по параметрам этой сети. Реализованы и испытаны различные методы автоматического реферирования. Показано применение двух оценок качества реферата без участия экспертов - косинусной меры и дивергениции Дженсена-Шеннона (Jensen-Shannon). Реферирование на основе предложенной сетевой модели документа оказалось лучшим по критериям косинусной меры и расстояния Дженсена-Шеннона для рефератов, объем которых превышает 2 предложения. Предложенный подход с учетом небольших изменений может использоваться для текстов произвольной тематики, в частности, научно-технической и новостной информации.

Ключові слова


автоматическое реферирование; правовая информация; китайский язык; косинусная мера; мера Дженсена-Шеннона

Повний текст:

PDF (Русский)