Параметри
Розробка інтелектуального додатку для розпізнавання зображень
Дата випуску :
2023
Автор(и) :
Циганов Аркадій
Анотація :
Мета роботи: ознайомлення зі сферою розробки систем класифікації зображень за допомогою використання вектору ембеддингів, розробка прототипу системи класифікації зображень їжі на тацях.
Об'єкт дослідження: дослідження розробки системи класифікації зображень їжі на тацях за допомогою використання представлення зображення у вигляді ембеддингів і пошуку найближчого сусіда, для розрахунку швидкої ціни їжі на таці.
Методи та інструменти розробки: мова програмування Python, бібліотека PyTorch для реалізації моделі класифікації зображень, бібліотека OpenCV для обробки та аналізу зображень, використання техніки triplet loss для навчання моделі на векторах ембеддингів, середовище розробки Microsoft Visual Studio.
У ході дослідження був проведений аналіз сучасних методів класифікації зображень та технологій для розробки систем класифікації. На основі цього аналізу була розроблена система класифікації зображень їжі на тацях за допомогою представлення зображення у вигляді вектору ембеддингів і пошуку найближчого сусіда. Також було реалізовано функціонал для швидкого розрахунку ціни їжі на таці.
Ключові слова : image classification, transfer learning, nearest neighbor algorithm, image retrieval techniques, image representations, triplet loss, pytorch, open cv, shool lunch dataset, вектор ембеддингів.
Об'єкт дослідження: дослідження розробки системи класифікації зображень їжі на тацях за допомогою використання представлення зображення у вигляді ембеддингів і пошуку найближчого сусіда, для розрахунку швидкої ціни їжі на таці.
Методи та інструменти розробки: мова програмування Python, бібліотека PyTorch для реалізації моделі класифікації зображень, бібліотека OpenCV для обробки та аналізу зображень, використання техніки triplet loss для навчання моделі на векторах ембеддингів, середовище розробки Microsoft Visual Studio.
У ході дослідження був проведений аналіз сучасних методів класифікації зображень та технологій для розробки систем класифікації. На основі цього аналізу була розроблена система класифікації зображень їжі на тацях за допомогою представлення зображення у вигляді вектору ембеддингів і пошуку найближчого сусіда. Також було реалізовано функціонал для швидкого розрахунку ціни їжі на таці.
Ключові слова : image classification, transfer learning, nearest neighbor algorithm, image retrieval techniques, image representations, triplet loss, pytorch, open cv, shool lunch dataset, вектор ембеддингів.
Бібліографічний опис :
Циганов А. Розробка інтелектуального додатку для розпізнавання зображень : кваліфікаційна робота … бакалавра : 121 Інженерія програмного забезпечення / Циганов Аркадій. – Київ, 2023. – 43 с.
Файл(и) :
Вантажиться...
Формат
Adobe PDF
Розмір :
3.5 MB
Контрольна сума:
(MD5):81bb3ba54d265ab38cbd6dbc467fe22c
Ця робота розповсюджується на умовах ліцензії Creative Commons CC BY-NC