Параметри
Автоматична діаризація мовців на матеріалах аудіозаписів-перехоплень російських загарбників
Дата випуску :
2023
Автор(и) :
Шемчук Валерія
Анотація :
Мета роботи – розробити програмне забезпечення для діаризації звукових записів, які були перехоплені в ході російського повномасштабного вторгнення в Україну (з лютого 2022 року), щоб співвіднести певні висловлення в розмовах із конкретними мовцями.
Об’єктом дослідження є аудіозаписи із розмовами військовослужбовців країни-агресора, перехоплені в ході російського повномасштабного вторгнення в Україну (починаючи з лютого 2022 року).
Предметом дослідження є процес діаризації мовців.
У ході роботи зроблено огляд наукових праць та описано системи розпізнавання мовців і їх різновиди;
Зроблено огляд історії розвитку технології розпізнавання мовців; проаналізовано та описано сучасні системи розпізнавання мовців, їх структуру та основні компоненти;
Описано корпус усного мовлення для подальшого його використання у створенні програмного забезпечення для діаризації; підготовлено дані для діаризації.
Створено парсер-конвертатор анотаційних файлів TextGrid у файли RTTM;
Проведено діаризацію звукових записів: використано моделі розпізнавання мовлення NeMo;
Протестовано та оцінено різні параметри моделі NeMo, визначено найкращі параметри.
Об’єктом дослідження є аудіозаписи із розмовами військовослужбовців країни-агресора, перехоплені в ході російського повномасштабного вторгнення в Україну (починаючи з лютого 2022 року).
Предметом дослідження є процес діаризації мовців.
У ході роботи зроблено огляд наукових праць та описано системи розпізнавання мовців і їх різновиди;
Зроблено огляд історії розвитку технології розпізнавання мовців; проаналізовано та описано сучасні системи розпізнавання мовців, їх структуру та основні компоненти;
Описано корпус усного мовлення для подальшого його використання у створенні програмного забезпечення для діаризації; підготовлено дані для діаризації.
Створено парсер-конвертатор анотаційних файлів TextGrid у файли RTTM;
Проведено діаризацію звукових записів: використано моделі розпізнавання мовлення NeMo;
Протестовано та оцінено різні параметри моделі NeMo, визначено найкращі параметри.
Бібліографічний опис :
Шемчук В. Автоматична діаризація мовців на матеріалах аудіозаписів-перехоплень російських загарбників : кваліфікаційна робота … магістра : 035 Філологія / Шемчук Валерія. – Київ, 2023. – 80 с.
Файл(и) :
Вантажиться...
Формат
Adobe PDF
Розмір :
5.64 MB
Контрольна сума:
(MD5):b4879b484788d2a8a2e5142cbe154acb
Ця робота розповсюджується на умовах ліцензії Creative Commons CC BY-NC