Репозитарій КНУ
  • Yкраї́нська
  • English
  • Увійти
    Новий користувач? Зареєструйтесь.Забули пароль?
Репозитарій КНУ
  • Фонди & Зібрання
  • Статистика
  • Yкраї́нська
  • English
  • Увійти
    Новий користувач? Зареєструйтесь.Забули пароль?
  1. Головна
  2. Наукова періодика | Scientific periodicals
  3. Журнал обчислювальної та прикладної математики | Journal of Numerical and Applied Mathematics
  4. 2020
  5. Журнал обчислювальної та прикладної математики. № 1(133)
  6. Непараметричнi методи атрибуцiї авторства в англiйськiй лiтературi
 
  • Деталі
Параметри

Непараметричнi методи атрибуцiї авторства в англiйськiй лiтературi

Тип публікації :
Стаття
Дата випуску :
2 липня 2020 р.
Автор(и) :
Клюшин, Дмитро Анатолійович 
Кафедра обчислювальної математики 
Михайлюк, В. Ю.
Київський національний університет імені Тараса Шевченка 
Мова основного тексту :
Ukrainian
eKNUTSHIR URL :
https://ir.library.knu.ua/handle/15071834/14840
DOI :
10.17721/2706-9699.2020.1.04
Журнал :
Журнал обчислювальної та прикладної математики 
Випуск :
1
ISSN :
2706-9699
Початкова сторінка :
50
Кінцева сторінка :
58
Цитування :
Клюшин, Д. A., & Михайлюк, В. Ю. (2020). Непараметричнi методи атрибуцiї авторства в англiйськiй лiтературi. Журнал обчислювальної та прикладної математики, (1), 50–58. https://doi.org/10.17721/2706-9699.2020.1.04
У статтi описанi результати порiвняння двох непараметричних методiв iдентифiкацiї невiдомого автора на прикладах англiйської лiтератури. У нiй описано реалiзацiю методу кластеризацiї та застосування методiв тестування з кластеризацiєю та без неї. Запропоновано метод вибору n-грам, якi є кращими маркерами для iдентифiкацiї автора. Для тестування було використано понад 800 текстiв 16 авторiв. В результатi було встановлено, що метод, який використовує щiльнiсть розподiлу, придатний для iдентифiкацiї авторiв як великих текстiв (50000+ символiв), так i малих (10000+ символiв). Метод, який використовує p-статистику, придатний тiльки для великих текстiв. За допомогою кластеризацiї текстiв на тестовiй вибiрцi для обох методiв була досягнута значно кращi результати. Робота продовжує дослiдження ефективностi методiв iдентифiкацiї авторства, виконану ранiше на прикладi творiв класичної росiйської лiтератури. Результати пiдтверджують, що ефективнiсть методiв не залежить вiд вибраної мови твору.
Ключові слова :

Text Attribution

Authorship Identifica...

Petunin Statistics

Clustering

Nonparametric Test

атрибуцiя тексту

iдентифiкацiя авторст...

непараметричнi методи...

статистика Петунiна

кластеризацiя

атрибуция текста

идентификация авторст...

непараметрические мет...

статистика Петунина

кластеризация

Галузі знань та спеціальності :
11 Математика та статистика
Галузі науки і техніки (FOS) :
Математика
Тип зібрання :
Publication
Файл(и) :
Вантажиться...
Ескіз
Формат

Adobe PDF

Розмір :

1.51 MB

Контрольна сума:

(MD5):d63f5d4a338f4b4c492f56c25d072eee

Ця робота розповсюджується на умовах ліцензії Creative Commons CC BY

Налаштування куків Політика приватності Угода користувача Надіслати відгук

Побудовано за допомогою Програмне забезпечення DSpace-CRIS - Розширення підтримується та оптимізується 4Наука

м. Київ, вул. Володимирська, 58, к. 42

(044) 239-33-30

ir.library@knu.ua