ПРОЦЕДУРА ЗАСТОСУВАННЯ НЕЙРОННИХ МЕРЕЖ ДЛЯ СЕГМЕНТАЦІЇ РАСТРОВИХ ЗОБРАЖЕНЬ
DOI:
https://doi.org/10.28925/2663-4023.2022.18.2438Ключові слова:
нейромережева модель, згорткова нейронна мережа; семантична сегментація; растрове зображення; розпізнавання зображеньАнотація
В даний час засоби семантичної сегментації зображень, що базуються на використанні нейронних мереж, знаходять все ширше застосування в комп'ютерних системах різного призначення. Незважаючи на значні успіхи в даній галузі, однією з найважливіших невирішених задач є завдання визначення типу та параметрів згорткових нейронних мереж, що лежать в основі кодера та декодера. В результаті проведених досліджень розроблено відповідну процедуру, що дозволяє адаптувати нейромережевий кодер і декодер до таких умов задачі сегментації: розмір зображення, кількість кольорових каналів, допустима мінімальна точність сегментації, допустима максимальна обчислювальна складність сегментації, необхідність маркування сегментів, необхідність виділення кількох сегментів, необхідність виділення деформованих, зміщених та повернутих об'єктів, допустима максимальна обчислювальна складність навчання нейромережевої моделі; допустимий термін навчання нейромережевої моделі. Виконання процедури застосування нейронних мереж для сегментації зображень полягає у формуванні базисного математичного забезпечення, побудові основних блоків та загальної схеми процедури. Розроблена процедура верифікована експериментально на прикладах семантичної сегментації зображень, що містять об'єкти типу автомобіль. Отримані експериментальні результати свідчать, що застосування запропонованої процедури дозволяє уникнувши складних довготривалих експериментів, побудувати нейромережеву модель, яка при достатньо короткому терміні навчання забезпечує досягнення точності сегментації зображень близько 0,8, що відповідає найкращим системам аналогічного призначення. Показано, що шляхи подальших досліджень у напрямку вдосконалення методологічного забезпечення нейромережевої сегментації растрових зображень доцільно співвіднести з обґрунтованим використанням у кодері та декодері сучасних модулів та механізмів, адаптованих до значимих умов поставленої задачі. Наприклад, використання модулю ResNet дозволяє за рахунок нівелювання ефекту падіння градієнта збільшити глибину нейронної мережі, а модуля Inception забезпечує зменшення кількості вагових коефіцієнтів та обробку об'єктів різного розміру.
Завантаження
Посилання
Abraham, J., Paul, V. (2019). An imperceptible spatial domain color image watermarking scheme. Journal of King Saud University - Computer and Information Sciences, 31(1), 125–133. https://doi.org/10.1016/j.jksuci.2016.12.004.
Adithya, U., Nagaraju, C. (2021). Object Motion Direction Detection and Tracking for Automatic Video Surveillance. International Journal of Education and Management Engineering (IJEME), 11(2), 32-39. https://doi.org/10.5815/ijeme.2021.02.04.
Badrinarayanan, V., Kendall, A., Cipolla, R. (2017). SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation. http://arxiv.org/abs/1511.0051.
Dmitry, A. (2018). Segmentation Object Strategy on Digital Image. Journal of Siberian Federal University. Engineering & Technologies, 11(2), 213-220.
Cherrat, E. M., Alaoui, R., Bouzahir, H. (2020). Score fusion of finger vein and face for human recognition based on convolutional neural network model. International Journal of Computing, 11–19. https://doi.org/10.47839/ijc.19.1.1688.
Hu, Z., Tereykovskiy, I., Zorin, Y., Tereykovska, L., Zhibek, A. (2019). Optimization of convolutional neural network structure for biometric authentication by face geometry. Advances in Intelligent Systems and Computing, 754, 567-577.
Shen, J. (2014). Motion detection in color image sequence and shadow elimination. Visual Communications and Image Processing, 5308, 731-740.
Kong, T., et al. (2020). FoveaBox: Beyound Anchor-Based Object Detection. IEEE Trans. Image Process, 29, 7389–7398.
Liu, X.-P., Li, G., Liu, L., Wang, Z. (2019). Improved YOLOV3 target recognition algorithm based on adaptive eged optimization. Microelectron. Comput, 36, 59–64.
Prilianti, K. R et al. (2021). Non-destructive Photosynthetic Pigments Prediction using Multispectral Imagery and 2D-ЗНМ. International Journal of Computing, 20(3), 391-399.
Reja, S. A., Rahman, M. M. (2021). Sports Recognition using Convolutional Neural Network with Optimization Techniques from Images and Live Streams. International Journal of Computing, 20(2), 276-285.
Ronneberger, O., Fischer, P., Brox, T. (2015). U-Net: Convolutional Networks for Biomedical Image Segmentation. Medical Image Computing and Computer-Assisted Intervention (MICCAI), 9351, 234-241.
Senocak, A., Oh, T.-H., Kim, J., Kweon, I. S. (2018). Part-Based Player Identification Using Deep Convolutional Representation and Multi-scale Pooling. У 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW). IEEE. https://doi.org/10.1109/cvprw.2018.00225.
Shkurat, O. et al. (2020). Image Segmentation Method Based on Statistical Parameters of Homogeneous Data Set. Advances in Intelligent Systems and Computing, 902, 271–281.
Simonyan, K., Zisserman, A. (2019). Very deep convolutional networks for large-scale image recognition. ArXiv1409.1556 Cs. http://arxiv.org/abs/1409.1556.
Tereikovskyi, O. (2022). The method of neural network selection of objects on raster images: master's thesis.: 123 Computer Engineering. Kyiv, 104 p.
Zhang, S. et al. (2018). Single-Shot Refinement Neural Network for Object Detection. ArXiv 1711.06897 Cs. http://arxiv.org/abs/ 1711.06897
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2022 Ihor Tereikovskyi, Denys Chernyshev, Oleksandr Korchenko, Liudmyla Tereikovska, Oleh Tereikovskyi
Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.