Застосування семантико-синтаксичної тензорної моделі природної мови для аналізу кореферентних зв’язків у текстах

Дата
2015
Автори
Вознюк Тарас Григорович
Назва журналу
ISSN журналу
Назва тому
Видавець
Анотація
Основним результатом дисертації є розробка та математичне обґрунтування нових алгоритмів ідентифікації та аналізу кореферентних зв’язків у природномовних текстах, що має істотне значення для розв’язання фундаментальної задачі комп’ютерної лінгвістики - семантичного аналізу текстів. Для цього було застосовано тензорну модель природної мови, керуючі простори синтаксичних структур речень та методи машинного навчання. Для підвищення точності класифікації було розроблено розширений простір ознак із додаванням семантико-синтаксичних властивостей. Для обчислення параметрів кореферентних пар в розширеному просторі ознак було вперше побудовано алгоритми оцінки синтаксичного та семантичного паралелізму на основі тензорної моделі. Для тензорної моделі мови розроблено алгоритм побудови багатовимірного масиву опису структур речень та потокову архітектуру системи обробки великих текстів. Розроблено новий алгоритм побудови керуючих просторів синтаксичних структур речень, який дозволив отримати зручне та стисле представлення моделі, зменшити розмірність тензора, отримати більш надійний та стійкий опис семантико-синтаксичних зв’язків між словами. Доведено коректність та обчислено складність алгоритму в термінах швидкодії та пам’яті.
Бібліографічний опис
Галузь знань та спеціальність
12 Інформаційні технології , 122 Комп’ютерні науки
Бібліографічний опис
Вознюк Т.Г. Застосування семантико-синтаксичної тензорної моделі природної мови для аналізу кореферентних зв’язків у текстах : дис. ... канд. фіз.-мат. наук : 01.05.01 теоретичні основи інформатики та кібернетики / Вознюк Тарас Григорович. - Київ, 2016. - 151 с
Зібрання