Параметри
Аналiз характеристик мультимодальних керованих моделей для стиснення вiдео
Дата випуску :
2023
Автор(и) :
Чомко Василь Дмитрович
Анотація :
Мета роботи полягає в визначеннi оптимальної комбiнацiї вiзуальних та аудiо характеристик для процесу стиснення вiдео, що базується на обробцi мультимодальних ознак. Дослiдження фокусується на вiдео матерiалах знятих на екшн-камери в польових умовах без професiйного обладнання або подальшої постобробки. В порiвняннi з унiмодальним пiдсумовуванням вiдео (unimodal video summarization), дана сфера є недостатньо дослiдженою.
В роботi, використовуючи двi моделi машинного навчання, Balanced Random Decision Forest та метод k-найближчих сусiдiв (k-nearest neighbor method, KNN), намагалися визначити список найбiльших важливих об’єднаних характеристик, що дозволить зменшити кiлькiсть даних, необхiдних для обробки та дозволить зберегти рiвень точностi розглянутих моделей. Опираючись на результати, отриманi в дослiдженнi, було дано вiдповiдь на ключове питання: "Чому саме цi ознаки є важливими для стиснення вiдео?"
Ключовi слова: важливiсть ознак, аналiз вiзуальних ознак, аналiз аудiо ознак, вiдео стиснення, мультимодальний аналiз, машинне навчання, збалансований лiс випадкових рiшень, k-найближчi сусiди
В роботi, використовуючи двi моделi машинного навчання, Balanced Random Decision Forest та метод k-найближчих сусiдiв (k-nearest neighbor method, KNN), намагалися визначити список найбiльших важливих об’єднаних характеристик, що дозволить зменшити кiлькiсть даних, необхiдних для обробки та дозволить зберегти рiвень точностi розглянутих моделей. Опираючись на результати, отриманi в дослiдженнi, було дано вiдповiдь на ключове питання: "Чому саме цi ознаки є важливими для стиснення вiдео?"
Ключовi слова: важливiсть ознак, аналiз вiзуальних ознак, аналiз аудiо ознак, вiдео стиснення, мультимодальний аналiз, машинне навчання, збалансований лiс випадкових рiшень, k-найближчi сусiди
The aim of this study is to identify the optimal combination of visual and audio features for a video summarization process based on multimodal feature processing. The study focuses on video materials captured by an action camera
in an open environment without professional equipment or post-processing. The field of multimodal video summarization is relatively underexplored compared to unimodal video summarization, presenting challenges such as processing a
large number of different features. In our research, we employ two machine learning models, Balanced Random Decision Forest and the k-nearest neighbour method (KNN), to identify the most significant combined features.
This approach aims to decrease the volume of data needed for processing while preserving the accuracy of the models in question.
The findings of this study seek to address the query: "What features are important for video summarization process?".
Key words: feature importance, visual feature analysis, audio feature analysis, video compression, multimodal analysis, machine learning, balanced random decision forest, k-nearest neighbors.
in an open environment without professional equipment or post-processing. The field of multimodal video summarization is relatively underexplored compared to unimodal video summarization, presenting challenges such as processing a
large number of different features. In our research, we employ two machine learning models, Balanced Random Decision Forest and the k-nearest neighbour method (KNN), to identify the most significant combined features.
This approach aims to decrease the volume of data needed for processing while preserving the accuracy of the models in question.
The findings of this study seek to address the query: "What features are important for video summarization process?".
Key words: feature importance, visual feature analysis, audio feature analysis, video compression, multimodal analysis, machine learning, balanced random decision forest, k-nearest neighbors.
Бібліографічний опис :
Чомко В. Д. Аналiз характеристик мультимодальних керованих моделей для стиснення вiдео : випускна кваліфікаційна робота бакалавра : 113 Прикладна математика / Чомко Василь Дмитрович. – Київ, 2023. – 125с.
Файл(и) :
Вантажиться...
Формат
Adobe PDF
Розмір :
11.71 MB
Контрольна сума:
(MD5):b6e9307e4b4b38471871556d31dab965
Ця робота розповсюджується на умовах ліцензії Creative Commons CC BY-NC