МЕХАНІЗМ ACTIVE ANTI-ENTROPY НА ОСНОВІ СПЕКТРАЛЬНОГО ФІЛЬТРУ БЛУМА ТА PH-2 АЛГОРИТМУ ХЕШУВАННЯ ДЛЯ УЗГОДЖЕННЯ РЕПЛІК У НЕРЕЛЯЦІЙНИХ РОЗПОДІЛЕНИХ ДОКУМЕНТО-ОРІЄНТОВАНИХ БАЗАХ ДАНИХ
DOI:
https://doi.org/10.32689/maup.it.2023.3.8Ключові слова:
нереляційна база даних, розподілена система, активна антіентропія, спектральний фільтр Блума, консистентність, алгоритм хешування PH2Анотація
Інформаційні системи використовуються у багатьох сферах діяльності людини, які не обмежуються однією країною або континентом. Це може призводити до необхідності горизонтального масштабування, щоб система могла нормально функціонувати. Ігнорування цього може впливати на швидкодію та доступність, що у свою чергу призведе до втрати репутації та користувачів. При горизонтальному масштабуванні збільшується кількість реплік бази даних, що створює необхідність в узгодженні даних, оскільки операції запису до різних вузлів збільшує ентропію. Є різні технології, які направлені на її зменшення, серед яких Active Anti-Entropy. Суть її полягає у тому, щоб виявити неконсистентність та розпочати процес узгодження між репліками. Вона активно використовується у такій базі даних, як Riak та використовує структуру даних Merkle Tree, яка базується на використанні алгоритмів хешування. Швидкість ідентифікування неузгодженості залежить від обраних алгоритмів хешування та кількості документів в колекції. Збільшення кількості документів або навіть їх розмір може погіршувати рівномірний розподіл та призводити до збільшення кількості колізій. Виникнення колізій збільшує проміжок часу неузгодженості даних, оскільки система не може вчасно виявити неконсистентність. Окрім колізій, які можуть виникати, потрібно враховувати затримку через передачу даних мережею при взаємодії вузлів та пам’ятати, що така перевірка не є поодинокою операцією, а вимагає постійного обчислення на репліках та відправки для перевірки. Мінімізація часу виконання цих операцій дозволить пришвидшити процес узгодження даних. Критично важливі дані повинні бути узгоджені з мінімальною затримкою, оскільки невчасно або неправильно прийняте рішення може призвести до матеріальних, або навіть людських втрат. Для запобігання цьому, повинно існувати рішення, яке дозволить мінімізувати затримку узгодження таких даних.
Посилання
Changlin H. Survey on NoSQL Database Technology. Journal of Applied Science and Engineering Innovation. 2015. 2, 50-54. URL: http://www.jasei.pub/PDF/2-2/2-50-54.pdf
Muniswamaiah M., Agerwala T., C. Tappert C. Performance of databases in IoT applications. 2020 7th IEEE International Conference on Cyber Security and Cloud Computing (CSCloud)/2020 6th IEEE International Conference on Edge Computing and Scalable Cloud (EdgeCom). 2020. (190-192). New York, NY, USA : IEEE. URL: https://doi.org/10.1109/CSCloud-EdgeCom49738.2020.00041
K. Aguilera M., B. Terry D. The Many Faces of Consistency. IEEE Database Engineering Bulletin. 2016. 3-13. URL: http://sites.computer. org/debull/A16mar/p3.pdf
Belous R., Krylov E. TIME OPTIMIZATION OF PROCESS OF DATA CONSISTENCY IN NOSQL. Herald of the Khmelnytskyi National University. Series: "Technical Sciences". 2023. 3, 37-42. URL: http://journals. khnu.km.ua/vestnik/wp-content/uploads/2023/07/vknu-ts-2023-n3321-37-42.pdf
Nikitin V., Krylov E. A collision-resistant hashing algorithm for maintaining consistency in distributed NoSQL databases. Adaptive Systems of Automatic Control Interdepartamental scientific and technical collection. 2022. 2, 45-57. URL: https://doi.org/10.20535/1560-8956.41.2022.271338
Tarkoma S., Rothenberg C., Lagerspetz E. Theory and Practice of Bloom Filters for Distributed Systems. IEEE Communications Surveys & Tutorials. 2011. 14, 131-155. URL: https://doi.org/10.1109/SURV.2011.031611.00024
Cohen S., Matias Y. Spectral Bloom Filters. Proceedings of the 2003 ACM SIGMOD International Conference on Management of Data. 2003. 1-12. URL: http://dx.doi.org/10.1145/872757.872787
Nikitin V., Krylov E. Comparison of hashing methods for supporting of consistency in distributed databases. Adaptive Systems of Automatic Control Interdepartmental scientific and technical collection. 2022. 1, 48-53. URL: http://asac.kpi.ua/article/view/261646/258069
Al-Dhief F., Sabri N., Latiff N., Obaid O. Performance comparison between TCP and udp protocols in different simulation scenarios. International Journal of Engineering & Technology. 2018. 7, 172-176. URL: https://doi.org/10.14419/ijet.v7i4.36.23739