ЗАСТОСУВАННЯ ВЕЛИКИХ МОВНИХ МОДЕЛЕЙ ДЛЯ ПОБУДОВИ  “ЛІСУ ІЄРАХІЙ ТЕРМІНІВ”

Олександр Пучков; Дмитро Ланде; Ігор Субач

doi:10.28925/2663-4023.2025.27.712

Автор(и)

Олександр Пучков Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» https://orcid.org/0000-0002-8585-1044
Дмитро Ланде Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» https://orcid.org/0000-0003-3945-1178
Ігор Субач Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» https://orcid.org/0000-0002-9344-713X

DOI:

https://doi.org/10.28925/2663-4023.2025.27.712

Ключові слова:

великі мовні моделі, штучний інтелект, ліс ієрархій термінів, термінологічні онтології, візуалізація даних, кібербезпека

Анотація

Одним із способів упорядкування та систематизації знань є формування термінологічних онтологій, які дозволяють структурувати інформацію в конкретних предметних областях, таких як кібербезпека. У зв’язку з революційною появою великих мовних моделей (large language model, LLM) з’являються нові можливості для автоматизації процесу побудови “лісу ієрархій термінів” (ЛІТ). Побудова ЛІТ є необхідною для таких кількох ключових аспектів у сфері кібербезпеки та управління знаннями, як уніфікація термінології, покращення комунікації, оптимізація інформаційного пошуку, систематизація знань, адаптація до нових викликів, підтримка досліджень та інновацій. У статті розглядається роль LLM у побудові ЛІТ в контексті сучасних викликів інформаційного середовища. Завдяки революційним досягненням у сфері штучного інтелекту, LLM забезпечують автоматизацію та оптимізацію процесів обробки, аналізу та структурування великих обсягів текстових даних. Описано ключові етапи реалізації ЛІТ за допомогою LLM, зокрема обробка текстових даних, визначення дискримінантної сили термінів, встановлення зв’язків між ними та візуалізація результатів. Запропоновано методику визначення асоціативних зв’язків між заздалегідь визначеними термінами для побудови ЛІТ. Наведено приклади практичної реалізації запропонованої методики на основі застосування інформаційно-аналітичної системи “Кібер Агрегатор”. Продемонстровано приклад формування промпту для побудови ЛІТ до системи генеративного штучного інтелекту DeepSeek.com. Запропоновано технологію візуалізації ЛІТ шляхом застосування програми для аналізу і візуалізації графів CSV2Graph. Використання запропонованих технологій дозволяє підвищити ефективність і точність побудови термінологічних онтологій, що є важливим для адаптації до швидко зростаючих інформаційних потоків у сучасному світі.

Завантаження

Дані завантаження ще не доступні.

Посилання

Babayeva, G., Maennel, K., & Maennel, O. M. (2022). Building an ontology for cyber defence exercises. 2022 IEEE European Symposium on Security and Privacy Workshops (EuroS&PW), 423–432. https://doi.org/10.1109/EuroSPW55150.2022.00050

Adach, M., Hänninen, K., & Lundqvist, K. (2021). Structured information retrieval of security ontologies. MDH, Tech. Rep. http://www.es.mdh.se/pdf_publications/6449.pdf

Rackevičienė, S., & Mockienė, L. (2020). Cyber Law Terminology as a New Lexical Field in Legal Discourse. International Journal for the Semiotics of Law - Revue internationale de Sémiotique juridique, 33(4), 673–687. https://doi.org/10.1007/s11196-020-09690-0

Canito, A., Aleid, K., Praça, I., Corchado, J., & Marreiros, G. (2020). An ontology to promote interoperability between cyber-physical security systems in critical infrastructures. 2020 IEEE 6th International Conference on Computer and Communications (ICCC), 553–560. https://doi.org/10.1109/ICCC51575.2020.9345163

Satyapanich, T., Ferraro, F., & Finin, T. (2020). CASIE: Extracting cybersecurity event information from text. Proceedings of the AAAI Conference on Artificial Intelligence, 34(5), 8749–8757. https://doi.org/10.1609/aaai.v34i05.6401

Sikos, L. F. (2023). Cybersecurity knowledge graphs. Knowledge and Information Systems, 65(12), 3511–3531. https://doi.org/10.1007/s10115-023-01860-3

Lande, D. (2014). Formation of networks of natural hierarchies of terms based on the analysis of text corpora on legal topics. Legal informatics, 1(41), 12–17.

Lande, D., Snarskii, A., Yagunova, E., & Pronoza, E. (2014). Network of Natural Terms Hierarchy as a Lightweight Ontology. Thirteenth Mexican International Conference on Artificial Intelligence (MICAI 2014), 16–23.

Lande, D. V., Snarskii, A. A., Yagunova, E. V., & Pronoza, E. V. (2013). The Use of Horizontal Visibility Graphs to Identify the Words that Define the Informational Structure of a Text. 12th Mexican International Conference on Artificial Intelligence, 209–215.

Lande, D., Subach, I., & Puchkov, A. (2020). System of Analysis of Big Data from Social Media. Information & Security: An International Journal, 47(1), 44–61. https://doi.org/10.11610/isij.4703

BigSearch Space. (n.d.). https://bigsearch.space/uli.html

DeepSeek. (n.d.). https://www.deepseek.com/