СУЧАСНІ ПАРАДИГМИ ПРОЄКТУВАННЯ СИСТЕМ ПІДТРИМКИ ПРИЙНЯТТЯ РІШЕНЬ: ВІД ІНТЕГРАЦІЇ СХОВИЩ ТА ОЗЕР ДАНИХ ДО АРХІТЕКТУРИ DATA LAKEHOUSE

Автор(и)

  • Голуб Белла Львівна Національний університет біоресурсів і природокористування України image/svg+xml
  • Шевченко Дмитро Віталійович Національний університет біоресурсів і природокористування України image/svg+xml

DOI:

https://doi.org/10.31548/itees.2026.01.028

Ключові слова:

система підтримки прийняття рішень, СППР, Data Lakehouse, Сховище даних, Озеро даних, медальйонна архітектура, інженерія даних, Data Governance.

Анотація

У статті розглядаються сучасні підходи до проєктування систем підтримки прийняття рішень в умовах стрімкого зростання обсягів інформації. Інформаційна технологія накопичення даних (data warehousing) народилася в надрах компанії IBM і була остаточно сформульована Б. Інмона і Р. Кімболом в 90-х роках минулого століття як метод вирішення інформаційно-аналітичних завдань в області прийняття і підтримки рішень. Виникнувши на стику технології баз даних, систем підтримки прийняття рішень (СППР - DSS) і комп'ютерного аналізу даних, в подальшому концепція сховища даних, зазнала еволюцію, оскільки виявилася придатною для широкого кола додатків в бізнесі, науці і технології. Системи, побудовані на основі сховищ даних, мають ряд характерних особливостей, які виділяють їх як особливий клас інформаційних систем. До таких особливостей відносяться предметна орієнтація системи, інтегрованість збережених у ній даних, зібраних з різних джерел, інваріантність цих даних в часі, відносно висока стабільність даних, необхідність пошуку компромісу в надмірності даних. У статті досліджено еволюційний перехід від використання ізольованих Сховищ даних (Data Warehouses) та Озер даних (Data Lakes) до концептуально нової гібридної архітектури Data Lakehouse. Проаналізовано технологічний фундамент відкритих форматів таблиць (Dalta Lake, Apache Iceberg, Apache Hudi) та їхню роль у забезпеченні транзакційної надійності (ACID) файлових систем. Обґрунтовано доцільність застосування патерну «медальйонної архітектури» (бронзовий, срібний та золотий рівні) для ефективного управління якістю даних, спільної роботи алгоритмів машинного навчання та підготовки управлінської BI-звітності.

Отримано 2026-02-27

Прийнято 2026-04-08

Посилання

1. Armbrust, M., Ghodsi, A., Xin, R., & Zaharia, M. (2021). Lakehouse: A new generation of open platforms that unifies data warehousing and advanced analytics. Proceedings of the 11th Annual Conference on Innovative Data Systems Research (CIDR '21). https://cidrdb.org/cidr2021/papers/cidr2021_paper17.pdf.

2. Reis, J., & Housley, M. (2022). Fundamentals of data engineering: Plan and build robust data systems (1st ed.). O'Reilly Media.

3. Sharda, R., Delen, D., & Turban, E. (2020). Analytics, data science, & artificial intelligence: Systems for decision support (11th ed.). Pearson.

4. Armbrust, M., Das, T., Torres, J., Yavuz, B., Zhu, S., Xin, R., Ghodsi, A., Stoica, I., & Zaharia, M. (2020). Delta Lake: High-performance ACID table storage over cloud object stores. Proceedings of the VLDB Endowment, 13(12), 3411–3424. https://doi.org/10.14778/3415478.341556.

5. Inmon, W. H., & Linstedt, D. (2019). Data architecture: A primer for the data scientist (2nd ed.). Morgan Kaufmann.

6. Databricks. (2023). What is a medallion architecture? https://docs.databricks.com/en/lakehouse/medallion.html.

7. Apache Software Foundation. (2023). Apache Iceberg documentation. https://iceberg.apache.org/docs/latest/.

8. Amazon Web Services. (2022). What is a data lakehouse? https://aws.amazon.com/data-lake-house/.

9. Shevchenko, D. V., & Holub, B. L. (2025). Multidimensional analytics of environmental data: Application of OLAP in monitoring systems [Multidimensional analytics of environmental data: Application of OLAP in monitoring systems]. Mathematical Machines and Systems [Matematychni Mashyny i Systemy], 2025 (3–4), 54–65.

Завантаження

Опубліковано

2026-04-22

Номер

Розділ

Комп'ютерні науки