Класифікація текстів натуральною мовою
Дата
2021
Автори
Єрковіч Марко Драганович
Назва журналу
ISSN журналу
Назва тому
Видавець
Анотація
У роботі описана формалізація наївного генеративного баєсівського методу класифікації текстів, методу логістичної регресії(як біномінального та і мультиномінального) і методи вимірювання якості класифікаторів. Розроблено текстові класифікатори на мові Java, на основі наївного баєсівського метода та методу логістичної регресії машинного навчання для класифікації текстів натуральною мовою. Порівняно генеративний(наївний баєс) і дискримінантний(логістична регресія) класифікатори при біномінальній(два класи) і мультиномінальній(більше двох класів) випадках. Класифікатори випробуваний на двох класичних завданнях класифікації текстів і показав хороший результат на малих кількостях документів у вибірці. Класифікатори може бути використаним як частина високорівневих програм.
Бібліографічний опис
Галузь знань та спеціальність
12 Інформаційні технології , 122 Комп’ютерні науки
Бібліографічний опис
Єрковіч М. Д. Класифікація текстів натуральною мовою : кваліфікаційна робота … бакалавра : 122 Комп’ютерні науки / Єрковіч Марко Драганович. - Київ, 2021. – 42 с.