Параметри
Застосування семантико-синтаксичної тензорної моделі природної мови для аналізу кореферентних зв’язків у текстах
Дата випуску :
2016
Автор(и) :
Вознюк Тарас Григорович
Анотація :
Основним результатом дисертаційної роботи є розробка та математичне обґрунтування нових алгоритмів ідентифікації та аналізу кореферентних зв’язків у природномовних текстах, що має істотне значення для розв’язання фундаментальної задачі комп’ютерної лінгвістики - семантичного аналізу текстів. Для цього було застосовано тензорну модель природної мови, керуючі простори синтаксичних структур речень та методи машинного навчання.
В дисертаційній роботі розроблено новий алгоритм побудови керуючих просторів синтаксичних структур речень, який дозволив отримати зручне та стисле представлення моделі, зменшити розмірність тензора, отримати більш надійний та стійкий опис семантико-синтаксичних зв’язків між словами.
В результаті інтеграції розроблених алгоритмів в одну з найкращих систем визначення кореферентних зв’язків Stanford Deterministic Coreference Resolution вдалось покращити за запропонованою на конференції MUC-6 мірою точність визначення на тестовій вибірці конференції CoNLL-2011 з 61.03% до 64.45%.
Ключові слова : кореферентні зв’язки, кореферентність, анафора, тензорні моделі мови, керуючі простори синтаксичних структур, машинне навчання, метод опорних векторів.
В дисертаційній роботі розроблено новий алгоритм побудови керуючих просторів синтаксичних структур речень, який дозволив отримати зручне та стисле представлення моделі, зменшити розмірність тензора, отримати більш надійний та стійкий опис семантико-синтаксичних зв’язків між словами.
В результаті інтеграції розроблених алгоритмів в одну з найкращих систем визначення кореферентних зв’язків Stanford Deterministic Coreference Resolution вдалось покращити за запропонованою на конференції MUC-6 мірою точність визначення на тестовій вибірці конференції CoNLL-2011 з 61.03% до 64.45%.
Ключові слова : кореферентні зв’язки, кореферентність, анафора, тензорні моделі мови, керуючі простори синтаксичних структур, машинне навчання, метод опорних векторів.
Бібліографічний опис :
Вознюк Т.Г. Застосування семантико-синтаксичної тензорної моделі природної мови для аналізу кореферентних зв’язків у текстах : автореф. дис. ... канд. фіз.-мат. наук : 01.05.01 теоретичні основи інформатики та кібернетики / Вознюк Тарас Григорович. - Київ, 2016. - 24 с.
Файл(и) :
Вантажиться...
Формат
Adobe PDF
Розмір :
579.19 KB
Контрольна сума:
(MD5):de7ed6201ac84f5f983eb31714958ed3
Ця робота розповсюджується на умовах ліцензії Creative Commons CC BY-NC-ND