TY - JOUR AU - Krivenko , Serhii AU - Rotaniova, Natalya AU - Lazarevska , Yulianna PY - 2021/09/30 Y2 - 2024/03/28 TI - АВТОМАТИЗОВАНА СИСТЕМА ВИЯВЛЕННЯ НЕСТАНДАРТНИХ ДІЙ ЗА ДОПОМОГОЮ СЦЕНАРНОГО АНАЛІЗА ТЕКСТУ JF - Електронне фахове наукове видання «Кібербезпека: освіта, наука, техніка» JA - Кібербезпека: освіта, наука, техніка VL - 1 IS - 13 SE - Статті DO - 10.28925/2663-4023.2021.13.92101 UR - https://csecurity.kubg.edu.ua/index.php/journal/article/view/284 SP - 92-101 AB - <p>Сценарій (narrative schemas) - деяка усталена (в соціумі) послідовність кроків для досягнення поставленої мети і містить максимально повну інформацію про всі можливі шляхи розвитку описуваної ситуації (з точками вибору та розгалуженнями). Створення XML-платформи поклало початок новому наукомісткому й технологічно більш досконалому етапу в розвитку Web. У результаті XML-платформа стає істотним компонентом у технології розробки інформаційних систем, а тенденція їх інтеграції на рівні корпорацій, відомств, міністерств тільки зміцнює позиції XML у сфері інформаційних технологій у цілому. Розроблено систему автоматичного виявлення нестандартних сценаріїв в текстових повідомленнях. Програмування системи складається з етапів формування онтологій, синтаксичного аналізу речення та порівняння сценаріїв. Для синтаксичного аналізу пропозицій в системі використаний класичний метод обробки природної мови (NLP), який підтримує найбільш поширені завдання, такі як токенізація, сегментація пропозицій, тегування частини мови, витяг іменованих сутностей, розбиття на частини, синтаксичний аналіз і дозвіл кореферентності. Також можлива максимальна ентропія і машинне навчання на основі перцептронів. Зберігання онтологій здійснюють за допомогою технології OWL. У процесі аналізу зіставляються парсери об'єкт-мета речення із описаною OWL. При виконанні з SPARQL запиту на об'єкті джерела або моделі запиту вертаються в об'єкт таблиці. Клас таблиці є базовим класом для всіх об'єктів таблиці й забезпечує інтерфейс для доступу до значень у рядках і стовпцях таблиці результатів. Якщо об'єкт таблиці має рівно три стовпці, то він може бути використаний для побудови нового об'єкта джерела даних. Це забезпечує зручний механізм для добування підмножини даних з одного джерела даних і додавання їх в іншій. ‎У контексті RDF API вузол визначається як усі твердження про предмет URI. ‎Вміст таблиці порівнюємо з семантикою речення. У разі не співпадіння сценарію речення з моделлю онтології OWL, існує вірогідність нетипових дій об’єкта. В такому варіанті формується висновок про підозрілість повідомлення. Для більш коректного використання можливостей аналізу текста потрібно формувати корпус онтологій або використовувати існуючі (Akutan, Amazon та ін.) з врахуванням їх особливостей. Для збільшення онтологій об'єктів можливе додаткове використання нейромережевих методів навчання.</p> ER -