ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ ВИЗНАЧЕННЯ ПОЛІТИЧНОГО СПРЯМУВАННЯ ДЖЕРЕЛ ІНФОРМАЦІЇ ДЛЯ ЗАБЕЗПЕЧЕННЯ ІНФОРМАЦІЙНОЇ БЕЗПЕКИ ДЕРЖАВИ ПІД ЧАС КРИЗОВИХ СИТУАЦІЙ
DOI:
https://doi.org/10.28925/2663-4023.2023.20.142152Ключові слова:
моніторинг, соціальні медіа, Інтернет, електронні джерела відкритої інформації, екстрагування сутностей, машинне навчання, штучний інтелект, інформаційна технологіяАнотація
Розроблено та запропоновано інформаційну технологію аналізу та визначення політичного спрямування джерел інформації в мережі Інтернет та соціальних мережах. На основі застосування бібліотеки машинного навчання та класифікації тексту fastText була створена модель для визначення політичного спрямування джерел відкритої інформації. Розроблено модулі сканування джерел відкритої інформації в мережі Інтернет та соціальних мережах, які забезпечують реалізацію таких функцій: формування баз даних шляхом збору інформації з визначених інформаційних ресурсів; налаштування модулів автоматичного сканування інформації з вебсайтів і соціальних мереж; повнотекстовий пошук; екстрагування сутностей із окремих документів; визначення політичного спрямування джерел інформації. Практичне значення отриманих результатів полягає в створенні діючого макету системи визначення політичного спрямування електронних джерел інформації. У системі передбачено екстрагування наступних сутностей із текстових повідомлень: ключові слова; персони; географічні локації (топоніми); організації. За допомого високорівневого відкритого Python-фреймворку для розробки вебсистем Django розроблено вебінтерфейс системи. Також, для зручності роботи користувачів мобільних пристроїв з системою аналізу та визначення політичного спрямування джерел інформації в мережі Інтернет, розроблений Телеграм-бот. В інтерфейсі системи доступні функції пошуку інформації, за ключовими словами, періодом часу, а також окремо за кожним джерелом інформації (соціальною мережею). Система дає можливість дослідити кожне джерело окремо, перевірити наявність інформації про нього, тим самим доповнюючи базу даних джерел відкритої інформації. В системі автоматично формується дайджест з найбільш релевантними потребам користувачів повідомленнями та концептами. Крім того, користувачі мають можливість переглянути найпопулярніші канали інформації за певним політичним спрямуванням. Реалізовано відображення найбільш актуальних топонімів на карті. Запропоновано варіанти можливого застосування системи. У теперішній час, система є актуальною і являє собою реалізацію інформаційної технології автоматизованого визначення політичного спрямування електронних джерел інформації.
Завантаження
Посилання
Lande, D., Puchkov, O., Subach, I. (2020). Cystema analizu velykykh obsiahiv danykh z pytan kiberbezpeky iz sotsialnykh media. Collection Information Technology and Security, 8(1), 4–18. https://doi.org/10.20535/2411-1031.2020.8.1.217993
Lande, D., Subach, I., Puchkov, O., Soboliev, A. (2021). A Clustering Method for Information Summarization and Modelling a Subject Domain. Information & Security: An International Journal 50, 1, 79-86. https://doi.org/10.11610/isij.5013.
Lande, D., Snarskii, A., Dmytrenko, O., Subach, I. (2020). Relaxation time in complex network. U ARES 2020: The 15th International Conference on Availability, Reliability and Security. ACM. https://doi.org/10.1145/3407023.3409231
Layton, R., Watters, P. A. (2016) Automating open source intelligence: algorithms for OSINT: Elsevier, Syngress. https://doi.org/10.1016/C2014-0-02170-3.
Dharma, E., Gaol, F., Warnars, H., Soewito, B. (2022). The accuracy comparison among word2vec, glove, and fasttext towards convolution neural network (cnn) text classification. Jakarta.
Bojanowski, P., Grave, E., Joulin, A., Mikolov, T. (2016). Bag of Tricks for Efficient Text Classification. https://arxiv.org/abs/1607.01759
Bojanowski, P., Grave, E., Joulin, A., Mikolov, T. (2017). Enriching Word Vectors with Subword Information. https://arxiv.org/abs/1607.04606
Ryan, K. (2016). Facebooks New Open Source Software Can Learn 1 Billion Words in 10 Minutes. https://www.inc.com/kevin-j-ryan/facebook-open-source-fasttext-learns-1-billion-words-in-10-minutes.html
Low, C. (2016). Facebook is open-sourcing its AI bot-building research. https://www.engadget.com/2016-08-18-facebook-open-sourcing-fasttext.html
Mannes, J. (2016). Facebooks Artificial Intelligence Research lab releases open source fastText on GitHub. https://techcrunch.com/2016/08/18/facebooks-artificial-intelligence-research-lab-releases-open-source-fasttext-on-github
Mannes, J. (2017). Facebooks fastText library is now optimized for mobile. https://techcrunch.com/2017/05/02/facebooks-fasttext-library-is-now-optimized-for-mobile
Sabin, D. (2017). Facebook Makes A.I. Program Available in 294 Languages. https://www.inverse.com/article/31075-facebook-machine-learning-language-fasttext
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2023 Admin Skladannyi; Олександр Пучков, Дмитро Ланде, Ігор Субач, Олександр Рибак

Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.