АНСАМБЛЕВА КЛАСТЕРИЗАЦІЯ МЕРЕЖЕВОГО ТРАФІКУ НА ОСНОВІ КОНСЕНСУСНОГО ПІДХОДУ

Денис Редько; Альона Десятко; Бісарінов Байтума

doi:10.28925/2663-4023.2026.33.1122

АНСАМБЛЕВА КЛАСТЕРИЗАЦІЯ МЕРЕЖЕВОГО ТРАФІКУ НА ОСНОВІ КОНСЕНСУСНОГО ПІДХОДУ

Автор(и)

Денис Редько Державний торговельно-економічний університет https://orcid.org/0009-0003-5827-264X
Альона Десятко Державний торговельно-економічний університет https://orcid.org/0000-0002-2284-3418
Бісарінов Байтума Казахський національний університет імені Аль-Фарабі, Алматинський університет енергетики та телекомунікацій https://orcid.org/0000-0002-2218-0749

DOI:

https://doi.org/10.28925/2663-4023.2026.33.1122

Ключові слова:

мережевий трафік, великі дані, методи аналізу даних, кластеризація, колективні рішення, ансамблеві моделі.

Анотація

В умовах стрімкого зростання обсягів мережевого трафіку та ускладнення корпоративних інформаційних систем (ІС) особливу актуальність набуває розробка ефективних методів аналізу й кластеризації даних. Сучасні підходи до обробки мережевого трафіку вимагають комплексного розгляду численних параметрів та характеристик, що зумовлює необхідність удосконалення існуючих методів кластерного аналізу. У роботі запропоновано вдосконалений підхід до ансамблевої кластеризації мережевого трафіку та методику побудови узгодженої матриці подібності для інтеграції результатів різних алгоритмів кластеризації на основі експоненціальної залежності з метою посилення різниць у вагах алгоритмів, що суттєво підвищує точність кінцевої кластеризації. Реалізована в рамках дослідження на мові Python програмна система об’єднує кілька методів кластеризації, що дозволяє досягти значно більшої стабільності результатів за рахунок використання консенсусного підходу, ефективність якого підтверджена результатами масштабних обчислювальних експериментів. У ході дослідження та обчислювальних експериментів продемонстровано, що ключовою перевагою розробленого підходу є підвищена стійкість до викидів порівняно з традиційними методами (KMeans, DBSCAN), що застосовуються для кластерного аналізу мережевого трафіку компанії, а також більш збалансована кластеризація для складних багатовимірних даних. Також запропоновано залежність для розрахунку ваг алгоритмів із використанням експоненціальної функції, що дає змогу комплексно підходити до інтеграції результатів різних методів кластеризації. Розроблене програмне рішення суттєво розширює методи аналізу мережевого трафіку та забезпечує ефективний практичний інструментарій для підвищення продуктивності роботи корпоративних інформаційних систем. Запропонований підхід може бути успішно адаптований для розв’язання широкого спектра задач аналізу даних, що потребують обробки великих обсягів багатовимірної інформації.

Завантаження

Дані завантаження ще не доступні.

Біографії авторів

Денис Редько, Державний торговельно-економічний університет

аспірант кафедри інженерії програмного забезпечення та кібербезпеки

Альона Десятко, Державний торговельно-економічний університет

доктор філософії «Комп’ютерні науки», доцент кафедри інженерії програмного забезпечення та кібербезпеки

Бісарінов Байтума, Казахський національний університет імені Аль-Фарабі, Алматинський університет енергетики та телекомунікацій

доктор філософії «Комп’ютерні науки», кафедра інформаційних систем

Посилання

Takyi, K., Bagga, A., & Goopta, P. (2018, August). Clustering techniques for traffic classification: A comprehensive review. In Proceedings of the 7th International Conference on Reliability, Infocom Technologies and Optimization (ICRITO 2018) (pp. 224-230). IEEE. https://doi.org/10.1109/ICRITO.2018.8748772

Li, J., Zhang, H., Tang, D., & Lin, C. (2021, September). Traffic classification using cluster analysis. In Proceedings of the International Conference on Computer Information Science and Artificial Intelligence (CISAI 2021) (pp. 463-467). IEEE. https://doi.org/10.1109/CISAI54367.2021.00094

Rodríguez-Rodríguez, J. E., García, V. H. M., & Usaquén, M. A. O. (2018). Corporate networks traffic analysis for knowledge management based on random interactions clustering algorithm. In Knowledge management in organizations (KMO 2018) (pp. 523-536). Springer. https://doi.org/10.1007/978-3-319-95204-8_44

MacQueen, J. (1967). Some methods for classification and analysis of multivariate observations. In Proceedings of the fifth Berkeley symposium on mathematical statistics and probability (Vol. 1, pp. 281-297).

Lloyd, S. (1982). Least squares quantization in PCM. IEEE Transactions on Information Theory, 28(2), 129-137. https://doi.org/10.1109/TIT.1982.1056489

Cheeseman, P. C., & Stutz, J. C. (1996). Bayesian classification (AutoClass): Theory and results. In Advances in knowledge discovery and data mining (pp. 153-180).

Zhang, T., Ramakrishnan, R., & Livny, M. (1997). BIRCH: A new data clustering algorithm and its applications. Data Mining and Knowledge Discovery, 1(2), 141-182. https://doi.org/10.1023/A:1009783824328

Guha, S., Rastogi, R., & Shim, K. (1998). CURE: An efficient clustering algorithm for large databases. ACM SIGMOD Record, 27(2), 73-84. https://doi.org/10.1145/276305.276312

Ester, M., Kriegel, H.-P., Sander, J., & Xu, X. (1996, August). A density-based algorithm for discovering clusters in large spatial databases with noise. In Proceedings of the International Conference on Knowledge Discovery and Data Mining (KDD 1996) (pp. 226-231).

Ankerst, M., Breunig, M. M., Kriegel, H.-P., & Sander, J. (1999). OPTICS: Ordering points to identify the clustering structure. ACM SIGMOD Record, 28(2), 49-60. https://doi.org/10.1145/304181.304187

Subramani, K., Velkov, A., Ntoutsi, I., Kröger, P., & Kriegel, H.-P. (2011, December). Density-based community detection in social networks. In Proceedings of the IEEE International Conference on Internet Multimedia Systems Architecture and Application (IMSAA 2011) (pp. 1-8). IEEE. https://doi.org/10.1109/IMSAA.2011.6156334

Zander, S., Nguyen, T., & Armitage, G. (2005, November). Automated traffic classification and application identification using machine learning. In Proceedings of the IEEE Conference on Local Computer Networks (LCN 2005) (pp. 250-257). IEEE. https://doi.org/10.1109/LCN.2005.35

McGregor, A., Hall, M., Lorier, P., & Brunskill, J. (2004). Flow clustering using machine learning techniques. In Passive and active network measurement (PAM 2004) (pp. 205-214). Springer. https://doi.org/10.1007/978-3-540-24668-8_21

Erman, J., Mahanti, A., Arlitt, M., Cohen, I., & Williamson, C. (2007). Offline/realtime traffic classification using semi-supervised learning. Performance Evaluation, 64(9-12), 1194-1213. https://doi.org/10.1016/j.peva.2007.06.014

Wang, Y., Xiang, Y., Zhang, J., Zhou, W., Wei, G., & Yang, L. T. (2013). Internet traffic classification using constrained clustering. IEEE Transactions on Parallel and Distributed Systems, 25(11), 2932-2943. https://doi.org/10.1109/TPDS.2013.307

Wang, P., Lin, S. C., & Luo, M. (2016, June). A framework for QoS-aware traffic classification using semi-supervised machine learning in SDNs. In Proceedings of the IEEE International Conference on Services Computing (SCC 2016) (pp. 760-765). IEEE. https://doi.org/10.1109/SCC.2016.105

Downloads

Переглядів анотації: 8

Опубліковано

2026-06-25

Як цитувати

Редько, Д., Десятко, А., & Байтума, Б. (2026). АНСАМБЛЕВА КЛАСТЕРИЗАЦІЯ МЕРЕЖЕВОГО ТРАФІКУ НА ОСНОВІ КОНСЕНСУСНОГО ПІДХОДУ. Електронне фахове наукове видання «Кібербезпека: освіта, наука, техніка», 1(33), 177–184. https://doi.org/10.28925/2663-4023.2026.33.1122