АВТОМАТИЗОВАНА СИСТЕМА ВИЯВЛЕННЯ НЕСТАНДАРТНИХ ДІЙ ЗА ДОПОМОГОЮ СЦЕНАРНОГО АНАЛІЗА ТЕКСТУ
DOI:
https://doi.org/10.28925/2663-4023.2021.13.92101Ключові слова:
онтологія; сценарій; парсер; аналіз змісту; семантичний аналізАнотація
Сценарій (narrative schemas) - деяка усталена (в соціумі) послідовність кроків для досягнення поставленої мети і містить максимально повну інформацію про всі можливі шляхи розвитку описуваної ситуації (з точками вибору та розгалуженнями). Створення XML-платформи поклало початок новому наукомісткому й технологічно більш досконалому етапу в розвитку Web. У результаті XML-платформа стає істотним компонентом у технології розробки інформаційних систем, а тенденція їх інтеграції на рівні корпорацій, відомств, міністерств тільки зміцнює позиції XML у сфері інформаційних технологій у цілому. Розроблено систему автоматичного виявлення нестандартних сценаріїв в текстових повідомленнях. Програмування системи складається з етапів формування онтологій, синтаксичного аналізу речення та порівняння сценаріїв. Для синтаксичного аналізу пропозицій в системі використаний класичний метод обробки природної мови (NLP), який підтримує найбільш поширені завдання, такі як токенізація, сегментація пропозицій, тегування частини мови, витяг іменованих сутностей, розбиття на частини, синтаксичний аналіз і дозвіл кореферентності. Також можлива максимальна ентропія і машинне навчання на основі перцептронів. Зберігання онтологій здійснюють за допомогою технології OWL. У процесі аналізу зіставляються парсери об'єкт-мета речення із описаною OWL. При виконанні з SPARQL запиту на об'єкті джерела або моделі запиту вертаються в об'єкт таблиці. Клас таблиці є базовим класом для всіх об'єктів таблиці й забезпечує інтерфейс для доступу до значень у рядках і стовпцях таблиці результатів. Якщо об'єкт таблиці має рівно три стовпці, то він може бути використаний для побудови нового об'єкта джерела даних. Це забезпечує зручний механізм для добування підмножини даних з одного джерела даних і додавання їх в іншій. У контексті RDF API вузол визначається як усі твердження про предмет URI. Вміст таблиці порівнюємо з семантикою речення. У разі не співпадіння сценарію речення з моделлю онтології OWL, існує вірогідність нетипових дій об’єкта. В такому варіанті формується висновок про підозрілість повідомлення. Для більш коректного використання можливостей аналізу текста потрібно формувати корпус онтологій або використовувати існуючі (Akutan, Amazon та ін.) з врахуванням їх особливостей. Для збільшення онтологій об'єктів можливе додаткове використання нейромережевих методів навчання.
Завантаження
Посилання
Ontolohyia v kompiuternыkh systemakh. RSDN. https://rsdn.org/article/philosophy/what-is-onto.xml
Indurkhya, N., & Damerau, F. J. (2010). Handbook of Natural Language Processing, 2nd ed. USA. Taylor and Francis Group (с. 676).
Bisikalo, O. V., Vysotska, V. A. (2016). Zastosuvannia metodu syntaksychnoho analizu rechen dlia vyznachennia kliuchovykh sliv ukrainomovnoho tekstu. Radioelektronika, informatyka, upravlinnia, (3), 54–65.
Becheru, A., Badica, C. (2014). Complex networks’ analysis using an ontology-based approach: initial steps, lecture notes in artificial intelligence. Springer international publishing Switzerland, (8793), 326–337.
Bisikalo, O. V., Vysotska, V. A. (2016). Zastosuvannia metodu syntaksychnoho analizu rechen dlia vyznachennia kliuchovykh sliv ukrainomovnoho tekstu. Radioelektronika, informatyka, upravlinnia, (198), 36–41.
Semantic web - W3C. World Wide Web Consortium (W3C). https://www.w3.org/standards/semanticweb
Faltin (Geneva), A. V. (2017). Natural language processing tools for computer assisted language learning. Linguistik online, 5/03, 137–153.
M.-C. de Marneffe et al. (2021). Universal dependencies. Computational linguistics, 47 (2), 255–308.
Kotov, M. (2017). NLP resources for a rare language morphological analyzer: danish case. Proceedings of the 1st international conference computational linguistics and intelligent systems : International Conference, Kharkiv, 31–36.
Natural language processing tools and libraries in 2021. Best Web & Mobile App Developers Company | The APP Solutions. https://theappsolutions.com/blog/development/nlp-tools/#contents_1
Java API - LanguageTool Wiki. LanguageTool Wiki (Archived) - LanguageTool Wiki. http://wiki.languagetool.org/java-api
Software - the stanford natural language processing group. The Stanford Natural Language Processing Group. https://nlp.stanford.edu/software
Nykonenko, A. A. (2009). Obzor baz znanyi ontolohycheskoho typa. Yskusstvennыi yntellekt, (4), 208–219.
Brinkmann, H., Wortarten im Deutschen. (1965). Das Ringen um eine neue deutsche Grammatik / Darmstadt : Wissenschaftliche Buchgesellschaft, 118–124.
SPARQL 1.1 query language. World Wide Web Consortium (W3C). http://www.w3.org/TR/sparql11-query
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.