УДОСКОНАЛЕННЯ АРХІТЕКТУРИ АЛГОРИТМУ FASTER R-CNN ДЛЯ ПІДВИЩЕННЯ ШВИДКОДІЇ І ТОЧНОСТІ РОЗПІЗНАВАННЯ ОБ’ЄКТІВ
DOI:
https://doi.org/10.31649/2307-5376-2024-3-8-16Ключові слова:
розпізнавання об'єктів, нейронні мережі, оптимізація алгоритму, Faster R-CNN, EfficientNet, CenterNet, втрата GIoUАнотація
У статті наведено дослідження, спрямоване на удосконалення алгоритму розпізнавання
Faster R-CNN з метою підвищення його точності та надійності в задачах розпізнавання об'єктів. У дослідженні розглядаються три ключові структурні покращення, які були впроваджені в алгоритм. Перше покращення передбачає інтеграцію EfficientNet як основної мережі, що значно підвищує якість видобутку ознак, завдяки збалансованому підходу до масштабу глибини мережі, її ширини та роздільної здатності. Це дозволяє досягти більш високої точності при зменшенні кількості параметрів та обчислювальних витрат, що є важливим для практичних застосувань, особливо в умовах обмежених ресурсів. Друге покращення стосується застосування без’якірного підходу CenterNet для мережі пропозицій регіонів (RPN), який спрощує процес локалізації об'єктів, безпосередньо передбачаючи їх центри та розміри. Це усуває необхідність використання попередньо визначених якорів і суттєво підвищує точність локалізації, що особливо важливо для розпізнавання об'єктів різних розмірів і форм, які часто зустрічаються в реальних умовах. Третє покращення полягає в оптимізації функції втрат за допомогою генералізованої інтерсекції над об'єднанням (GIoU), яка забезпечує більш стабільну і точну регресію обмежувальних рамок, що веде до кращої точності локалізації, особливо в складних умовах, таких як перекриття об'єктів або розташування на краях зображення. Проведені структурні зміни в алгоритмі сприяють значному підвищенню його точності та надійності. Експериментальне дослідження на стандартних тестових наборах даних, таких як COCO та PASCAL VOC, показало суттєве зростання середньої точності (mAP) і зниження часу обробки. Отримані результати підкреслюють переваги запропонованих змін у алгоритмі Faster R-CNN, що робить його більш придатним для застосувань в реальних умовах.
##submission.downloads##
-
PDF
Завантажень: 43