АНАЛІЗ МЕТОДІВ СТИСНЕННЯ ЗГОРТКОВИХ НЕЙРОННИХ МЕРЕЖ ДЛЯ ЕФЕКТИВНОГО РОЗГОРТАННЯ У СЕРЕДОВИЩІ EDGE AI

Дмитро МАРЧУК

doi:10.32689/maup.it.2025.4.17

Автор(и)

Дмитро МАРЧУК Державний університет «Житомирська політехніка» https://orcid.org/0000-0001-8675-8047

DOI:

https://doi.org/10.32689/maup.it.2025.4.17

Ключові слова:

Edge AI, Edge Devices, згорткова нейронна мережа, Model Compression, квантування, прунінг, стиснення моделі

Анотація

Стаття присвячена дослідженню та емпіричній оцінці методів стиснення згорткових нейронних мереж для їх ефективного розгортання в середовищі Edge AI. Незважаючи на високу точність, традиційні CNN-архітектури, такі як ResNet-18, є надто ресурсомісткими для периферійних пристроїв з обмеженою обчислювальною потужністю, оперативною пам'яттю та енергоспоживанням. Основна увага зосереджена на пошуку оптимального балансу між зменшенням ресурсоспоживання та збереженням високої точності класифікації. Мета роботи полягає у дослідженні та демонстрації ефективності спеціальних технік стиснення моделі, зокрема квантування, прунінгу та дистиляції знань, для успішного перенесення потужних можливостей CNN на Edge Devices. Наукова новизна полягає у комплексному, кількісному порівнянні впливу трьох основних технік оптимізації на ключові показники продуктивності моделі. Демонстрація того, що повне цілочисельне квантування (PTQ Int8) забезпечує коефіцієнт стиснення 11.06x при мінімальній втраті точності (0.0030), підтверджуючи його як оптимальний первинний крок. Порівняльний аналіз, який доводить, що неструктуроване стиснення (50% ваг ResNet-18) повністю відновлює та перевершує еталонну точність після fine-tuning, тоді як структуроване стиснення призводить до незворотної втрати точності (до 45.70%) в умовах обмеженого донавчання, вимагаючи більш виваженого підходу. Підтвердження того, що дистиляція знань дозволяє моделі MobileNetV2 перевершити свою традиційно навчену версію (91.8% проти 89.5%), максимізуючи точність за умови жорстких архітектурних обмежень. Висновки. Стиснення моделі є інженерним компромісом та необхідною умовою для створення високоефективних, низькозатримкових та енергоощадних рішень глибокого навчання, що можуть бути успішно розгорнуті в середовищі периферійних обчислень. Застосування квантування дозволяє перетворити енергоємні моделі в практичні Edge AI рішення.

Посилання

Марчук Д. К. Аналіз сучасних алгоритмів виявлення і розпізнавання об’єктів з відеопотоку для систем управління паркуванням в реальному часі. Вісник Хмельницького національного університету. Серія: Технічні науки. 2023. № 3 (321). С. 17–23. https://www.doi.org/10.31891/2307-5732-2023-321-3-17-23

Коломоєць С. Застосування штучного інтелекту в розпізнаванні медичних зображень. Інформаційні технології та суспільство. 2024. вип. 3 (14). С. 23–28. https://doi.org/10.32689/maup.it.2024.3.3

Advanced Quantization and Pruning Methods for Optimizing Deep Learning Models on Edge Devices. 2025. URL: https://www.researchgate.net/publication/397380491_Advanced_Quantization_and_Pruning_Methods_for_Optimizing_Deep_Learning_Models_on_Edge_Devices

Balderas L, Lastra M, Benitez JM. Optimizing Convolutional Neural Network Architectures. Mathematics. 2024. Vol. 12, No. 19. P. 3032. https://doi.org/10.3390/math12193032

Careem R., Johar G., Khatibi A. Deep neural networks optimization for resource-constrained environments: techniques and models. Indonesian Journal of Electrical Engineering and Computer Science. 2024. Vol. 33, № 3. P. 1843–1854. DOI: http://doi.org/10.11591/ijeecs.v33.i3.pp1843-1854

Godase, Vaibhav Vilas, Edge AI for Smart Surveillance: Real-time Human Activity Recognition on Low-power Devices. International Journal of AI and Machine Learning Innovations in Electronics and Communication Technology. Vol. 1, Issue 1 (January – June) 2025. Р. 29–46, URL: https://ssrn.com/abstract=5383804 or http://dx.doi.org/10.2139/ssrn.5383804

Husom E. J., Goknil A., Astekin M., Shar L. K., Kåsen A., Sen S., Soylu A. Sustainable llm inference for edge ai: Evaluating quantized llms for energy efficiency, output accuracy, and inference latency. ACM Transactions on Internet of Things. Apr 4 2025. https://doi.org/10.48550/arXiv.2504.03360

Pareek S., Al-Samalek A. S., Alkhayyat A., Singh S., Singh A., Dasi S. Efficient Vision Transformers for Edge Devices: Pruning and Quantization Approaches. 4th International Conference on Technological Advancements in Computational Sciences (ICTACS). Tashkent, Uzbekistan, 2024. P. 1465–1471. https://doi.org/10.1109/ICTACS62700.2024.10840584

Wang, X., Jia, W. Optimizing edge AI: a comprehensive survey on data, model, and system strategies. arXiv preprint arXiv:2501.03265. 2025. URL: https://arxiv.org/abs/2501.03265

АНАЛІЗ МЕТОДІВ СТИСНЕННЯ ЗГОРТКОВИХ НЕЙРОННИХ МЕРЕЖ ДЛЯ ЕФЕКТИВНОГО РОЗГОРТАННЯ У СЕРЕДОВИЩІ EDGE AI

Автор(и)

DOI:

Ключові слова:

Анотація

Посилання

##submission.downloads##

Опубліковано

Як цитувати

Номер

Розділ

Ліцензія

Статті цього автора (авторів), які найбільше читають

Мова