АНАЛІЗ МЕТОДІВ І АЛГОРИТМІВ РОЗПІЗНАВАННЯ ТА ІДЕНТИФІКАЦІЇ ЗОБРАЖЕНЬ ЗА ЇХ ОКРЕМИМИ ФРАГМЕНТАМИ
DOI:
https://doi.org/10.28925/2663-4023.2024.24.363375Ключові слова:
розпізнавання зображень; методи обробки зображень; алгоритми обробки зображень; методи ідентифікації; програмне забезпечення.Анотація
Розглянуто теоретичні основи побудови систем прийняття рішень на базі результатів розпізнавання зображень, що супроводжуються текстами. Наведено орієнтовну структуру системи розпізнавання зображень. В основу систем розпізнавання зображень покладено виокремлення текстових надписів на наявних фотографіях, їх попередня обробка, виокремлення ізольованих ділянок на зображенні, виконання математичних операцій над окремими групами пікселів для приведення їх до відомих форм і порівняння з ними. Виконано опис різних методів попередньої обробки зображень. Проведено аналіз доцільності застосування таких методів бінаризації зображень як адаптивна бінаризація Бредлі-Рота, медіанна фільтрація, фільтрація Гауса, методи збалансованих гістограм і дисперсій класу, дискримінантний аналіз, логістична, пробіт регресія тощо. Розглянуто різні алгоритми розбиття зображення на окремі ділянки з метою їх подальшого розпізнавання. серед них алгоритм ковзаю чого середнього, алгоритм оцінки ймовірності знаходження об’єкту у виокремленій ділянці, що базується на аналізі меж, Category-independent object proposals, Constrained Parametric Min-Cuts, Multiscale combinatorical grouping, Selective Search тощо. Виконано порівняння різних реалізацій алгоритмів обробки зображень для забезпечення ефективного розпізнавання, класифікації та ідентифікації зображень. Удосконалення окремих реалізацій алгоритмів обробки зображень дозволяє скоротити час їх обробки, що важливо для роботи з великими масивами даних. Основна увага в дослідженні зосереджена на виборі найбільш ефективних методів для розпізнавання надписів на зображеннях, удосконаленні алгоритмів, що їх реалізують, з метою побудови систем розпізнавання, спрямованих на обробку великих масивів даних.
Завантаження
Посилання
Ivanytska, A., Zubyk, L., Gololobov, D., Isaienkov, Y., Grynkevych, G., & Bychkov, O. (2023). The system for recognizing useful information of the client’s ID-card based on machine learning technologies. CEUR Workshop Proceedings, Vol. 3687, 115–120.
Mafi, M., Martin, H., Andrian, J., Barreto, A., Cabrerizo, M., & Adjouadi, M. (2019). A Comprehensive Survey on Impulse and Gaussian Denoising Filters for Digital Images. Signal Processing, 157, 236–260.
Mousavirad, S. J., & Ebrahimpour-Komleh, H. (2017). Multilevel image thresholding using entropy of histogram and recently developed population-based metaheuristic algorithms. Evolutionary Intelligence, 10(1–2), 45–75. https://doi.org/10.1007/s12065-017-0152-y
Ma, G., & Yue, X. (2022). An improved whale optimization algorithm based on multilevel threshold image segmentation using the Otsu method. Eng. Appl. Artif. Intell. 113. https://doi.org/10.1016/j. engappai.2022.104960
Abd Elaziz, M., & Lu, S. (2019). Many-objectives multilevel thresholding image segmentation using knee evolutionary algorithm. Expert Syst. Appl. 125, 305–316.
Yadav, R., & Pandey, M. (2022). Image segmentation techniques: A survey. Proceedings of data analytics and management: ICDAM 2021, 1, 231–239.
Endres, I., & Hoiem, D. (2014). Category-Independent Object Proposals with Diverse Ranking. IEEE Transactions on Pattern Analysis and Machine Intelligence, 36(2), 222–234. https://doi.org/10.1109/TPAMI.2013.122
Beideman, C., Chandrasekaran, K., & Chao, Xu. (2020). Licensed under Creative Commons License CC-BY Approximation, Randomization, and Combinatorial Optimization. Algorithms and Techniques (APPROX/RANDOM 2020), 17, 1–21.
Aranguren, I., Valdivia, A., Pérez-Cisneros, M., Oliva, D., & Osuna-Enciso, V. (2022). Digital image thresholding by using a lateral inhibition 2d histogram and a mutated electromagnetic field optimization. Multimed Tools Appl. 81(7), 10023–10049.
Maire, M. & Yu, S. X. (2013). Progressive multigrid eigensolvers for multiscale spectral segmentation. ICCV, 2184–2191.
Nadimi-Shahraki, M. H., Taghian. S., Mirjalili, S., & Faris, H. (2020). Mtde: An effective multi-trial vector-based differential evolution algorithm and its applications for engineering design problems. Appl. Soft. Comput. 97. https://doi.org/10.1016/j.asoc.2020.106761
Houssein, E. H., Saad, M. R., Hashim, F. A., Shaban, H., Hassaballah, M. (2020). Lévy flight distribution: A new metaheuristic algorithm for solving engineering optimization problems. Eng. Appl. Artif. Intell. 94. https://doi.org/10.1016/j.engappai.2020.103731
Ahmadianfar, I., Bozorg-Haddad, O, & Chu, X. (2020). Gradient-based optimizer: A new metaheuristic optimization algorithm. Inf. Sci. 540, 131–159. https://doi.org/10.1016/j.ins.2020.06.037
Abdel-Basset, M., Mohamed, R., & Abouhawwash, M. (2022). A new fusion of whale optimizer algorithm with kapur’s entropy for multi-threshold image segmentation: Analysis and validations. Artif. Intell. Rev. 55(8), 6389–6459.
Salehnia, T., MiarNaeimi, F., Izadi, S., Ahmadi, M., Montazerolghaem, A., Mirjalili, S., & Abualigah, L. (2024). A mtis method using a combined of whale and moth-flame optimization algorithms, 625–651.
Sharma, A., Chaturvedi, R., & Bhargava, A. (2022). A novel opposition based improved firefly algorithm for multilevel image segmentation. Multimed Tools Appl. 81(11), 15521–15544.
Chauhan, D., & Yadav, A. (2023). A crossover-based optimization algorithm for multilevel image segmentation. Soft. Comput. 1–33.
Thapliyal, S., & Kumar, N. (2024). Ascaeo: accelerated sine cosine algorithm hybridized with equilibrium optimizer with application in image segmentation using multilevel thresholding. Evolving Syst. 1–62
Liu, Q., Li, N., Jia, H., Qi, Q., & Abualigah, L. (2023). A chimp-inspired remora optimization algorithm for multilevel thresholding image segmentation using cross entropy. Artif. Intell. Rev. 56(1), 159–216.
Chen, Y., Wang, M., Heidari, A., Shi, B., Hu, Z., Zhang, Q., Chen, H., Mafarja, M., & Turabieh, H. (2022). Multi-threshold image segmentation using a multi-strategy shuffled frog leaping algorithm. Expert Syst. Appl. 194. https://doi.org/10.1016/j.eswa.2022.116511
Houssein, E. H., Abdalkarim, N., Hussain, K., & Mohamed, E. (2024). Accurate multilevel thresholding image segmentation via oppositional snake optimization algorithm: Real cases with liver disease. Comput. Biol. Med. 169.
Kumar, B. V., Oliva, D., & Suganthan, P. (2022). Differential Evolution: From Theory to Practice. Springer Singapore. https://doi.org/10.1007/978-981-16-8082-3
Reisenhofer, R., Bosse, S., Kutyniok, G., & Wiegand, T. (2018). A haar wavelet-based perceptual similarity index for image quality assessment. Signal Process: Image Commun. 61, 33–43.
Uijlings, J. R. R., van de Sande, K. E. A., Gevers, T. & Smeulders, A. W. M. (2013). Selective Search for Object Recognition. Int. J. Comput. Vis. 104, 154–171. https://doi.org/10.1007/s11263-013-0620-5
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2024 Людмила Зубик, Сергій Пужай-Череда , Олександр Сапельников, Денис Калугін, Максим Котляр
Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.