РОЗВИТОК АРХІТЕКТУР, ТЕОРЕМ ТА МОДЕЛЕЙ ВЛАСТИВОСТЕЙ РОЗПОДІЛЕНИХ СИСТЕМ ЗБЕРІГАННЯ ІНФОРМАЦІЇ
DOI:
https://doi.org/10.31891/2219-9365-2022-70-2-1Ключові слова:
розподілені бази даних, моделі ACID та BASE, теореми CAP та PACELC, база даних Cassandra, Azure CosmosDB, MongoDB, нотація GSNАнотація
Бази даних пройшли певний шлях еволюції від архітектури мейнфреймів до глобально-розподілених нереляційних сховищ, що призначені для збереження величезних обсягів інформації та обслуговування мільйонів користувачів. У статті зазначено драйвери та передумови цього розвитку, а також розглянуто трансформацію моделей властивостей систем керування базами даних та теорем, що формалізують відносини між ними. Зокрема, розглянуто обумовленість переходу від моделі властивостей ACID до моделі BASE, яка пом’якшує вимоги до узгодженості даних, що є необхідним для забезпечення високої продуктивності розподілених баз даних з багатьма репліками. Крім того, надано стисле обґрунтування теорем САР та PACELC, які встановлюють взаємовиключні відносини між доступністю, узгодженістю та швидкодією у реплікованих інформаційних системах та проаналізованоо їх обмеження. Зазначено проблеми сумісності моделей узгодженості, що використовуються різними нереляційними сховищами даних, та, в якості прикладу, детально розглянуто можливі налаштування узгодженості NoSQL баз даних Cassandra, MongoDB та Azure CosmosDB. Результати еволюції архітектур розподілених баз даних узагальнено за допомогою нотації GSN (Goal Structuring Notation). Також окреслено подальші напрямки наукових досліджень та шляхи подальшого розвитку глобально-розподілених інформаційних систем та сховищ даних.