Параметри
Непараметричнi методи атрибуцiї авторства в англiйськiй лiтературi
Тип публікації :
Стаття
Дата випуску :
2 липня 2020 р.
Мова основного тексту :
Ukrainian
eKNUTSHIR URL :
Випуск :
1
ISSN :
2706-9699
Початкова сторінка :
50
Кінцева сторінка :
58
Цитування :
Клюшин, Д. A., & Михайлюк, В. Ю. (2020). Непараметричнi методи атрибуцiї авторства в англiйськiй лiтературi. Журнал обчислювальної та прикладної математики, (1), 50–58. https://doi.org/10.17721/2706-9699.2020.1.04
У статтi описанi результати порiвняння двох непараметричних методiв iдентифiкацiї невiдомого автора на прикладах англiйської лiтератури. У нiй описано реалiзацiю методу кластеризацiї та застосування методiв тестування з кластеризацiєю та без неї. Запропоновано метод вибору n-грам, якi є кращими маркерами для iдентифiкацiї автора. Для тестування було використано понад 800 текстiв 16 авторiв. В результатi було встановлено, що метод, який використовує щiльнiсть розподiлу, придатний для iдентифiкацiї авторiв як великих текстiв (50000+ символiв), так i малих (10000+ символiв). Метод, який використовує p-статистику, придатний тiльки для великих текстiв. За допомогою кластеризацiї текстiв на тестовiй вибiрцi для обох методiв була досягнута значно кращi результати. Робота продовжує дослiдження ефективностi методiв iдентифiкацiї авторства, виконану ранiше на прикладi творiв класичної росiйської лiтератури. Результати пiдтверджують, що ефективнiсть методiв не залежить вiд вибраної мови твору.
Галузі знань та спеціальності :
11 Математика та статистика
Галузі науки і техніки (FOS) :
Математика
Тип зібрання :
Publication
Файл(и) :
Вантажиться...
Формат
Adobe PDF
Розмір :
1.51 MB
Контрольна сума:
(MD5):d63f5d4a338f4b4c492f56c25d072eee
Ця робота розповсюджується на умовах ліцензії Creative Commons CC BY
10.17721/2706-9699.2020.1.04