МЕТОДИКА ВИЯВЛЕННЯ ШКІДЛИВОГО КОНТЕНТУ ЗА ДОПОМОГОЮ СЕНТИМЕНТАЛЬНОГО АНАЛІЗУ
DOI:
https://doi.org/10.28925/2663-4023.2025.30.921Ключові слова:
виявлення на основі штучного інтелекту, дезінформація, фейк, пропаганда, ідентифікація дезінформації, NLP, кібербезпека, засоби масової інформації, опрацювання природної мови, мультимодальний аналіз, машинне навчанняАнотація
У статті досліджується проблема виявлення шкідливого контенту в персональних електронних комунікаціях, таких як електронна пошта, повідомлення в соціальних мережах або месенджерах. Сучасні системи фільтрації шкідливого контенту переважно базуються на аналізі ключових слів, структурних особливостей повідомлень та технічних параметрів, таких як IP‑адреси чи домени походження повідомлень. Такі системи мають обмежену ефективність проти сучасних кіберзагроз, що використовують контент повідомлень з емоційними маніпуляціями чи фейковою інформацією. Крім того, ефективність таких підходів є обмеженою, особливо коли йдеться про цільові атаки та новітні методи обходу захисних механізмів, що постійно еволюціонують.
В роботі запропоновано гібридну модель «MaliciousContentDetector», яка поєднує лексичні методи, методи машинного навчання (TF-IDF, Random Forest) та глибинне навчання (BERT) для аналізу сентименту тексту. Модель враховує лінгвістичні особливості української мови та контекстуальні емоційні тригери. Також запропоновану модель реалізовано у вигляді програмного забезпечення з можливістю інтеграції в браузери та інші застосунки для підвищення кіберзахиченості кінцевих користувачів. Розроблену модель було протестована на базі реальних повідомлень в одній із соціальних мереж на прикладі популярного новинного каналу. В ході аналізу 162 дописів модель «MaliciousContentDetector» показала високу ефективність та точність виявлення потенційно шкідливого текстового контенту.
Завантаження
Посилання
DeBounce. (2025). Email spam statistics 2025. Retrieved from https://debounce.io/email-spam-statistics
Medhat, W., Hassan, A., & Korashy, H. (2014). Sentiment analysis algorithms and applications: A survey. Ain Shams Engineering Journal. Retrieved from https://www.sciencedirect.com/science/article/pii/S2090447914000550
Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, L., & Polosukhin, I. (2017). Attention is all you need. Advances in Neural Information Processing Systems, 30.
Darchuk, N. (2019). Linguistic approach for development of computer-based sentiment analysis in the Ukrainian language. Science and Education a New Dimension, VII(189)(55), 10–13.* Retrieved from https://seanewdim.com/wp-content/uploads/2021/04/Linguistic-approach-for-development-of-computer-based-sentiment-analysis-in-the-Ukrainian-language-N.-Darchuk.pdf
Kyrychenko, R. (2021). Typology of tasks of machine analysis of texts in contemporary sociology. Sociological Studios, 2(19), 53–62. Retrieved from https://journals.indexcopernicus.com/api/file/viewByFileId/1564492
Riabyshev, O., Yerokhin, A., & Bakhmet, A. (2021). Analysis of the sentiment of the text in the Ukrainian language. Bionics of Intelligence, (96), 15–21. Retrieved from https://openarchive.nure.ua/server/api/core/bitstreams/f59561cb-66a5-4f99-b6ff-cf30a5162f91/content
Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2018). BERT: Pre-training of deep bidirectional transformers for language understanding. Cornell University. Retrieved from https://arxiv.org/abs/1810.04805
Amazon Web Services. (2025). What is sentiment analysis? Sentiment analysis explained. Retrieved from https://aws.amazon.com/what-is/sentiment-analysis
Baccianella, S., Esuli, A., & Sebastiani, F. (2010). SentiWordNet 3.0: An enhanced lexical resource for sentiment analysis and opinion mining. In Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC’10) (pp. 2000–2004).
scikit-learn. (n.d.). Machine learning in Python. Retrieved from https://scikit-learn.org
CrowdStrike. (2025). Falcon Endpoint Protection Platform (EPP). Retrieved from https://www.crowdstrike.co.uk/falcon-platform
Darktrace. (2025). ActiveAI Security Platform | The essential AI cybersecurity platform. Retrieved from https://www.darktrace.com/platform
Microsoft. (2025). Microsoft Security Copilot. Retrieved from https://www.microsoft.com/en-us/security/business/ai-machine-learning/microsoft-security-copilot
Sift. (2025). Why Sift. Retrieved from https://sift.com/why-sift
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2025 Дмитро Андрушко, Дмитро Шедін , Вадим Чакрян

Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.