Параметри
Аналіз структури зображень документів засобами глибоких нейронних мереж
Дата випуску :
2021
Автор(и) :
Захарчук Дмитро Юрійович
Анотація :
У ході виконання роботи проаналізовано архітектури моделей глибоких нейронних мереж для візуального розпізнавання об’єктів – однофазні та двофазні детектори об’єктів. Здійснено навчання моделей даних типів детекторів на частині набору даних PubLayNet – датасету, присвяченому семантичній сегментації структурних елементів документів на зображеннях. В умовах проведених експериментів, результати засвідчили, що найкращу коректність розпізнавання має модель мережі YOLOv5. До структури шарів даної мережі були внесені певні модифікації з метою покращення якості розпізнавання.
Незважаючи на незначне погіршення усередненого значення за класами (0.911 - для оптимізованого підходу проти 0.914 для оригінального підходу), все ж таки вдалося досягти кращої якості у виявленні об’єктів класу «Текст». (0.840 – для оригінального підходу; 0.853 – оптимізований підхід, SGD; 0.855 – оптимізований підхід, Adam).
Незважаючи на незначне погіршення усередненого значення за класами (0.911 - для оптимізованого підходу проти 0.914 для оригінального підходу), все ж таки вдалося досягти кращої якості у виявленні об’єктів класу «Текст». (0.840 – для оригінального підходу; 0.853 – оптимізований підхід, SGD; 0.855 – оптимізований підхід, Adam).
Бібліографічний опис :
Захарчук Д. Ю. Аналіз структури зображень документів засобами глибоких нейронних мереж : дипломна робота ... магістра : 122 Комп’ютерні науки / Захарчук Дмитро Юрійович. - Київ, 2021. - 76 с.
Файл(и) :
Вантажиться...
Формат
Adobe PDF
Розмір :
3.89 MB
Контрольна сума:
(MD5):fa17c7171941e4b0ed2be659deb090bc
Ця робота розповсюджується на умовах ліцензії Creative Commons CC BY-NC