Застосування семантико-синтаксичної тензорної моделі природної мови для аналізу кореферентних зв’язків у текстах

Дата
2016
Автори
Вознюк Тарас Григорович
Назва журналу
ISSN журналу
Назва тому
Видавець
Анотація
Основним результатом дисертаційної роботи є розробка та математичне обґрунтування нових алгоритмів ідентифікації та аналізу кореферентних зв’язків у природномовних текстах, що має істотне значення для розв’язання фундаментальної задачі комп’ютерної лінгвістики - семантичного аналізу текстів. Для цього було застосовано тензорну модель природної мови, керуючі простори синтаксичних структур речень та методи машинного навчання. В дисертаційній роботі розроблено новий алгоритм побудови керуючих просторів синтаксичних структур речень, який дозволив отримати зручне та стисле представлення моделі, зменшити розмірність тензора, отримати більш надійний та стійкий опис семантико-синтаксичних зв’язків між словами. В результаті інтеграції розроблених алгоритмів в одну з найкращих систем визначення кореферентних зв’язків Stanford Deterministic Coreference Resolution вдалось покращити за запропонованою на конференції MUC-6 мірою точність визначення на тестовій вибірці конференції CoNLL-2011 з 61.03% до 64.45%. Ключові слова : кореферентні зв’язки, кореферентність, анафора, тензорні моделі мови, керуючі простори синтаксичних структур, машинне навчання, метод опорних векторів.
Бібліографічний опис
Галузь знань та спеціальність
12 Інформаційні технології , 122 Комп’ютерні науки
Бібліографічний опис
Вознюк Т.Г. Застосування семантико-синтаксичної тензорної моделі природної мови для аналізу кореферентних зв’язків у текстах : автореф. дис. ... канд. фіз.-мат. наук : 01.05.01 теоретичні основи інформатики та кібернетики / Вознюк Тарас Григорович. - Київ, 2016. - 24 с.
Зібрання