МЕТОД НЕЙРОМЕРЕЖЕВОГО АНАЛІЗУ ГОЛОСОВОГО СИГНАЛУ

Liudmyla Tereikovska

doi:10.28925/2663-4023.2020.7.3142

Автор(и)

Liudmyla Tereikovska Київський національний університет будівництва і архітектури https://orcid.org/0000-0002-8830-0790

DOI:

https://doi.org/10.28925/2663-4023.2020.7.3142

Ключові слова:

розпізнавання емоцій; аутентифікації; голосовий сигнал; нейронна мережа; метод розпізнавання

Анотація

Стаття присвячена підвищенню ефективності засобів аналізу біометричних характеристик суб'єктів, що взаємодіють з інформаційно-управляючими системами різного призначення. Показано, що з позицій можливості застосування в якості сенсора зчитування біометричних параметрів стандартного периферійного обладнання комп'ютера, широкого використання в інформаційно-управляючих системах голосових повідомлень, їх високої інформативності, складності підробки біометричної інформації, а також можливості проведення прихованого моніторингу широкі перспективи мають засоби аналізу голосового сигналу. Обґрунтовано необхідність вдосконалення методології нейромережевого аналізу голосового сигналу для розпізнавання емоцій і особи Визначено можливість підвищення ефективності нейромережевих засобів аналізу за рахунок адаптації параметрів нейромережевої моделі до умов використання. Сформовано принципи визначення допустимих нейромережевих моделей і найбільш ефективного виду нейромережевої моделі, що використовується для аналізу голосового сигналу. Розроблено процедуру кодування вхідного сигналу, що дозволяє використовувати в нейронній мережі компактне представлення найбільш інформативних ознак голосового сигналу. Також розроблено процедура кодування вихідного сигналу нейронної мережі, що дозволяє підвищити ефективність її навчання. Розроблено метод нейромережевого аналізу голосового сигналу, який за рахунок запропонованих принципів адаптації і процедур кодування вхідних і вихідних параметрів, дозволяє впровадити в засоби розпізнавання нейронну мережу, архітектура якої адаптована до очікуваних умов застосування. Ефективність запропонованого методу доведено експериментальним шляхом. Проведені експериментальні дослідження показали, що використання розробленого методу дозволяє забезпечити точність розпізнавання емоцій ідентифікованого диктора, яка дорівнює приблизно 0.94, що відповідає кращим сучасним рішенням в даній області. Запропоновано співвіднести шляхи подальших досліджень з розробкою рішень, які дозволили б аналізувати голосовий сигнал довільної тривалості в умовах дії шуму різного виду.

Завантаження

Дані завантаження ще не доступні.

Посилання

Gnatyuk S. Critical Aviation Information Systems Cybersecurity, Meeting Security Challenges Through Data Analytics and Decision Support, NATO Science for Peace and Security Series, D: Information and Communication Security. - IOS Press Ebooks, Vol.47, №3, рр. 308-316, 2016.

Tereikovskyi I. and Korchenko А. «Modeli etalonov lingvisticheskikh peremennykh dlya obnaruzheniya sniffing-atak», Protection of information, Vol. 19, №3, pp. 228-242, 2017. (In Russian).

Ivanov А. I. Neyrosetevyye algoritmy biometricheskoy identifikatsii lichnosti. Moskow, 144 p., 2004. (In Russian).

Gnatyuk S., Sydorenko V., Aleksander M. Unified data model for defining state critical information infrastructure in civil aviation, Proceedings of the 2018 IEEE 9th International Conference on Dependable Systems, Services and Technologies (DESSERT), Kyiv, Ukraine, May 24-27, 2018, pp. 37-42.

Tereikovska L., Tereikovskyi I., Mussiraliyeva S., Akhmed G. Recognition of emotions by facial Geometry using a capsule neural network. International Journal of Civil Engineering and Technology (IJCIET). Vol. 10, Issue 04, April 2019, pp. 270-279.

Akhmetov B., Tereykovsky I., Doszhanova A., Tereykovskaya L. Determination of input parameters of the neural network model, intended for phoneme recognition of a voice signal in the systems of distance learning. International Journal of Electronics and Telecommunications. Vol 64, No 4 (2018), 425-432.

ISO/IEC 19794-5:2011/AMD 2:2015 [ISO/IEC 19794-5:2011/AMD 2:2015] Information technology - Biometric data interchange formats - Part 5: Face image data - Amendment 2: XML encoding and clarification of defects. [Електронний ресурс]. Доступно: https://www.iso.org/standard/61589.html.

ISO/IEC 24713-1:2008 Information technology - Biometric profiles for interoperability and data interchange - Part 1: Overview of biometric systems and biometric profiles. [Електронний ресурс]. Доступно: https://www.iso.org/standard/38823.html.

Lebedeva N.N. and Karimova E.D. «Akusticheskiye kharakteristiki rechevogo signala kak pokazatel' funktsional'nogo sostoyaniya cheloveka». Advances in Physiological Sciences, №1, pp. 57-95, 2014. (In Russian).

Ajinkya N. Jadhav, Nagaraj V. Dharwadkarю. A Speaker Recognition System Using Gaussian Mixture Model, EM Algorithm and K-Means Clustering, International Journal of Modern Education and Computer Science, Vol.10, No.11, pp. 19-28, 2018.

Altincay H. (2003). Speaker identification by combining multiple classifiers using Dempster–Shafer theory of evidence. Speech Communication, v.41, N4, 531–547.

Toliupa S., Tereikovskiy I., Dychka I., Tereikovska L., Trush A.. The Method of Using Production Rules in Neural Network Recognition of Emotions by Facial Geometry. 3rd International Conference on Advanced Information and Communications Technologies (AICT). 2019, 2-6 July 2019, Lviv, Ukraine, pp. 323 – 327.

Campbell W., Sturim D., Reynolds D. (2006). Support vector machines using GMM supervectors for speaker verification. IEEE Signal Process. Lett., v.13, N5, pp. 308–311.

Tereykovska L., Tereykovskiy I., Aytkhozhaeva E., Tynymbayev S., Imanbayev A. Encoding of neural network model exit signal, that is devoted for distinction of graphical images in biometric authenticate systems (2017). // News of the national academy of sciences of the republic of kazakhstan series of geology and technical sciences. Volume 6, Number 426 (2017), pp. 217 – 224.

Akhmetov, B., Tereikovskyi, I., Tereikovska, L., Adranova, A. Neural Network User Authentication by Geometry of the Auricle // Recent Developments in Data Science and Intelligent Analysis of Information Proceedings of the XVIII International Conference on Data Science and Intelligent Analysis of Information, June 4–7, 2018, Kyiv, Ukraine, pp.11-19.

Tereikovskyi I, Chernyshev D., Tereikovska L.A., Mussiraliyeva S, Akhmed G. The Procedure for the Determination of Structural Parameters of a Convolutional Neural Network to Fingerprint Recognition. Journal of Theoretical and Applied Information Technology, No 8, Volume 97, 2019, pp. 2381-2392.

Oksiiuk O., Tereikovska L. and Tereikovskiy I. Determination of Expected Output Signals of the Neural Network Model Intended for Image Recognition. 4th International Scientific-Practical Conference Problems of Infocommunications Science and Technology (PIC S&T) 2017, pp. 596-599.

Tereikovskyi, I., Mussiraliyeva, S., Kosyuk, Y., Bolatbek, M., Tereikovska, L. An experimental investigation of infrasound influence hard drives of a computer system // International Journal of Civil Engineering and Technology. 2018. Volume 9, Issue 6, June 2018, pp. 1558–1566.

Dychka I., Chernyshev D., Tereikovskyi I., Tereikovska L., Pogorelov V. (2020) Malware Detection Using Artificial Neural Networks. Advances in Computer Science for Engineering and Education II. ICCSEEA 2019. Advances in Intelligent Systems and Computing, vol 938. Springer, pp. 3-12.

Tereikovska L. «Metod neyromerezhevoho analizu klaviaturnoho pocherku». Computer-integrated technologies: education, science, production, 2019, №37, pp. 53-59. (In Ukrainian).

Mihaylenko V. М. and Tereikovska L A. «Paradigmy neyrosetevogo raspoznavaniya emotsiy». Management of complex systems development. 2019. №39. pp. 179-186. (In Russian).

МЕТОД НЕЙРОМЕРЕЖЕВОГО АНАЛІЗУ ГОЛОСОВОГО СИГНАЛУ

Автор(и)

DOI:

Ключові слова:

Анотація

Завантаження

Посилання

Downloads

Опубліковано

Як цитувати

Номер

Розділ

Статті цього автора (авторів), які найбільше читають

index

Мова

Подати статтю

counter

Інформація

Developed By

Поточний номер