АДАПТИВНЕ ОЧИЩЕННЯ РІЗНОРІДНИХ СЕНСОРНИХ ДАНИХ У СИСТЕМАХ РОЗУМНОГО БУДИНКУ НА ОСНОВІ КЛАСИФІКАЦІЇ ШУМІВ
DOI:
https://doi.org/10.28925/2663-4023.2025.28.844Ключові слова:
очищення даних; розумний будинок; Інтернет речей; адаптивне усунення аномалій; класифікація шумів; машинне навчанняАнотація
Сучасні системи розумного будинку генерують значні обсяги даних, якість котрих є критично важливою для ефективного управління, аналізу та прогнозування. Однак необроблені потоки даних часто містять складні комбінації шумів та аномалій, включаючи викиди, дрейф показників та періоди незмінних значень. Такі артефакти суттєво знижують надійність даних, що може призводити до некоректної роботи інтелектуальних систем та прийняття помилкових рішень. Існуючі методи очищення даних часто демонструють обмежену ефективність при роботі з гетерогенними типами шумів у реальному часі, особливо коли йдеться про обробку даних від сенсорів з різними фізичними характеристиками.
У статті представлено новий метод ACRA, розроблений для адаптивного очищення різнорідних часових рядів сенсорних даних у контексті розумного будинку. Метод ACRA включає класифікатор на основі ансамблю дерев рішень (Random Forest) для ідентифікації специфічних типів шумів у ковзному вікні оброблюваних даних. Результати класифікації доповнюються евристичним правилом, яке використовує аналіз дисперсії вікна для точнішого виявлення періодів з низьким рівнем шуму. На основі комбінації висновку класифікатора та правила, активується модуль адаптивної стратегії, який динамічно обирає найбільш доцільний оператор для корекції поточного значення даних. Для оцінки ефективності запропонованого методу було проведено експериментальне дослідження на реальних часових рядах температури, вологості та загального енергоспоживання, зібраних у житловому приміщенні, до яких було синтетично додано контрольовані типи шумів.
Результати експериментів продемонстрували, що метод ACRA забезпечує значно вищу якість очищення порівняно з поширеними базовими методами, такими як ковзна медіана та фільтр Калмана, для всіх трьох досліджуваних типів сенсорних даних. Запропонований метод ACRA є надійним та гнучким інструментом для підвищення якості сенсорних даних у системах розумного будинку, що створює основу для розробки більш точних та ефективних інтелектуальних додатків.
Завантаження
Посилання
Gubbi, J., Buyya, R., Marusic, S., & Palaniswami, M. (2013). Internet of Things (IoT): A vision, architectural elements, and future directions. Future Generation Computer Systems, 29(7), 1645–1660. https://doi.org/10.1016/j.future.2013.01.010
Karkouch, A., Mousannif, H., Al Moatassime, H., & Noel, T. (2016). Data quality in internet of things: A state-of-the-art survey. Journal of Network and Computer Applications, 73, 57–81. https://doi.org/10.1016/j.jnca.2016.08.002
Sethi, S. (2024). Data Governance in Smart Home Systems: The S.H.I.E.L.D. Framework. International Journal For Multidisciplinary Research, 6(1). https://doi.org/10.36948/ijfmr.2024.v06i01.39041
Wang, X., & Wang, C. (2020). Time Series Data Cleaning: A Survey. IEEE Access, 8, 1866–1881. https://doi.org/10.1109/access.2019.2962152
Phan, M. Q., Vicario, F., Longman, R. W., & Betti, R. (2017). State-Space Model and Kalman Filter Gain Identification by a Kalman Filter of a Kalman Filter. Journal of Dynamic Systems, Measurement, and Control, 140(3). https://doi.org/10.1115/1.4037778
S., Mohanavalli, S., Sripriya, N., & Poornima, S. (2018). Outlier Detection using Clustering Techniques. International Journal of Engineering & Technology, 7(3.12), 813. https://doi.org/10.14419/ijet.v7i3.12.16508
Corrales, D., Corrales, J., & Ledezma, A. (2018). How to Address the Data Quality Issues in Regression Models: A Guided Process for Data Cleaning. Symmetry, 10(4), 99. https://doi.org/10.3390/sym10040099
Ibebuchi, C. C. (2024). Fuzzy time series clustering using autoencoders neural network. AIMS Geosciences, 10(3), 524–539. https://doi.org/10.3934/geosci.2024027
Kirichenko, L., Koval, Y., Yakovlev, S., & Chumachenko, D. (2024). Anomaly Detection in Fractal Time Series with LSTM Autoencoders. Mathematics, 12(19), 3079. https://doi.org/10.3390/math12193079
Raju, K. H. P., Sandhya, N., & Mehra, R. (2017). Supervised SVM Classification of Rainfall Datasets. Indian Journal of Science and Technology, 10(15), 1–6. https://doi.org/10.17485/ijst/2017/v10i15/106115
Zamani Sabzi, H., Abudu, S., Alizadeh, R., Soltanisehat, L., Dilekli, N., & King, J. P. (2018). Integration of time series forecasting in a dynamic decision support system for multiple reservoir management to conserve water sources. Energy Sources, Part A: Recovery, Utilization, and Environmental Effects, 40(11), 1398–1416. https://doi.org/10.1080/15567036.2018.1476934
Aguirre-Fraire, B., Beltrán, J., & Soto-Mendoza, V. (2024). A Comprehensive Dataset Integrating Household Energy Consumption and Weather Conditions in a North-eastern Mexican Urban City. Data in Brief, 110452. https://doi.org/10.1016/j.dib.2024.110452
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2025 Дмитро Ніщеменко, Олена Волощук

Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.