Хранилища данных. Книга для проектировщиков, разработчиков и руководителей проектов

Хранилища данных. Книга для проектировщиков, разработчиков и руководителей проектов

Хранилища данных. Книга для проектировщиков, разработчиков и руководителей проектов
Автор: Туманов Владимир Евгеньевич
Дата выхода: 2024
Издательство: IPR MEDIA
Количество страниц: 438
Размер файла: 36,7 МБ
Тип файла: PDF
Добавил: codelibs
 Проверить на вирусы

ПРЕДИСЛОВИЕ ....8

О ЧЕМ ЭТА КНИГА ....10

1. ДЛЯ ЧЕГО НУЖНЫ ХРАНИЛИЩА ДАННЫХ ....12

О понятии «хранилище данных» ....12

Что такое архитектура хранилищ данных ....23

Какие бывают архитектуры хранилищ данных ....29

2. В ЧЕМ ОСОБЕННОСТИМНОГОМЕРНОЙ МОДЕЛИ ДАННЫХ ....36

На каких понятиях базируется многомерная модель данных ....36

Каковы основные операции многомерной модели данных ....40

Как работает ОLАР-технология ....45

Для чего нужны многомерные диаграммы ....53

3. КАК РЕАЛИЗУЕТСЯ МНОГОМЕРНАЯ МОДЕЛЬВ РЕЛЯЦИОННЫХ БАЗАХ ДАННЫХ ....59

Многомерная модель данных и реляционные отношения ....59

Факты, таблица фактов, ключи таблицы фактов ....62

Измерения, таблицы измерений, ключи таблицы измерений ....70

Иерархии, таблицы иерархий ....78

Отношение «многие - ко-многим» в хранилищах данных ....79

4 . КАК ПРЕДСТАВЛЯЕТСЯ ТЕМПОРАЛЬНОСТЬВ БАЗАХ ДАННЫХ ....83

Темпоральные данные в базах данных ....83

Как строится модель темпоральных данных ....87

Как происходит учет временных зависимостей предметнойобласти ....93

5. ЧТО ТАКОЕ МЕТАДАННЫЕ ХРАНИЛИЩА ДАННЫХ ....101

Какие основные функции выполняют метаданныев хранилищах данных ....101

Логическая структура метаданных хранилища данных ....108

Какие существуют стандарты метаданныххранилища данных ....113

Как осуществляется проектирование моделиметаданных хранилища данных ....118

6. КАК СОЗДАЕТСЯ ХРАНИЛИЩЕ ДАННЫХ ....122

Что нужно для организации проекта хранилища данных ....122

Как выглядят жизненный цикл хранилища данныхи его модель ....124

Какие процессы включает бизнес-модельтипового проекта создания хранилища данных ....141

7. КАК СОЗДАЕТСЯ ХРАНИЛИЩЕ ДАННЫХИЗ КОРПОРАТИВНОЙ МОДЕЛИ ДАННЪIХ ....151

О корпоративной модели данных ....151

Каков алгоритм преобразования корпоративноймодели данных в модель хранилища данных ....156

Для чего создаются массивы данных и как происходитсекционирование таблиц фактов ....169

Нужно ли группировать данные в соответствиис частотой использования ....170

8. КАК ИСПОЛЬЗУЮТСЯ КИОСКИ ДАННЫХДЛЯ СОЗДАНИЯ ХРАНИЛИЩА ДАННЫХ ....173

О понятии «киоски данных» ....173

В чем особенность хранилищ данныхпо Ральфу Ким баллу ....174

Как происходит согласование измерений ....179

Как происходит согласование фактов ....181

О реализации шины данных ....182

9. В ЧЕМ СМЫСЛ МОДЕЛИ «СВОД ДАННЫХ»(DATA VAULT) ....186

О модели «свод данных» ....186

Каковы основные элементы модели «свод данных» ....190

Как выглядит алгоритм построения модели«свод данных» ....199

Пример проектирования модели « свод данных» ....201

Создание и заполнение модели «свод данных» ....209

10. О ТЕНДЕНЦИЯХ РАЗВИТИЯИ ДРУГИХ МОДЕЛЯХ ХРАНИЛИЩ ДАННЫХ ....212

Каковы тенден ции в обработке данныхи хранилищах данных ....212

Какие хранилища данных называют облачными ....216

Что такое озера данных ....221

В чем особенность якорной модели хранилища данных ....223

11. ЧТО ТАКОЕ ФИЗИЧЕСКАЯ МОДЕЛЬ ДАННЫХ ....234

Каковы объекты физической модели данных ....234

Об основных объектах реляционной базы данных ....237

Как используются домены в физической модели данных ....241

Как создать физическую модель хранилища данных ....243

Как сгенерировать скрипт для созданияхранилища данных ....252

12. КАК ОБЕСПЕЧИТЬ ПРОИЗВОДИТЕЛЬНОСТЬПРИ СОЗДАНИИ ФИЗИЧЕСКОЙ МОДЕЛИ ....261

Чтo такое транзакция ....261

Об использовании денормализации ....263

Как и для чего применяется разбиениеи объединение таблиц ....268

Какие существуют встроенные средства СУБД для увеличения производительности ....271

13. КАК ПРОИСХОДИТ ПРОЕКТИРОВАНИЕИ РАЗРАБОТКА ПРОЦЕССА ИЗВЛЕЧЕНИЯ,ПРЕОБРАЗОВАНИЯ И ЗАГРУЗКИ ДАННЫХ ....283

Об извлечении, преобразовании и загрузке данных ....283

Какие существуют подходы к реализации процессаизвлечения, преобразования и загрузки данных ....287

Как разрабатывается процесс извлечения,преобразования и загрузки данных ....290

14. КАК ВЫГЛЯДИТ ПРОЦЕСС ИЗВЛЕЧЕНИЯ,ПРЕОБРАЗОВАНИЯ И ЗАГРУЗКИ ДАННЫХ (CASE) ....303

Каким образом используются САSЕ-инструментыдля проектирования процессов преобразования данных ....303

В чем особенности моделирования движения данных ....307

Как смоделировать процесс преобразования данных ....309

Как строится диаграмма управления потокомпреобразования данных ....310

Об управлении бизнес- правилами в хранилищах данных ....311

15. КАК ВЫПОЛНЯЕТСЯ НАСТРОЙКАПРОИЗВОДИТЕЛЬНОСТИ ЗАПРОСОВК ХРАНИЛИЩУ ДАННЫХ ....314

Для чего оптимизировать обработку данныхи какие языки для этого используются ....314

Об особенностях оптимизации запросов ....318

Синтаксическая оптимизация ....319

Оптимизация, основанная на правилах ....321

Оптимизация, основанная на вычислении стоимости ....324

Как выглядит структура плана запроса ....330

Как повысить скорость выполнения запросовс помощью их анализа ....333

В чем особенности оптимизации запросовдля схем типа « звезда» ....341

16. SQL В ХРАНИЛИЩАХ ДАННЫХ:АГРЕГАЦИЯ И СУММИРОВАНИЕ ....350

Расширение команды SELECT для обработки данных ....350

Расширение SQL для агрегации данных ....351

Предложение ROLLUP ....355

Как использовать ROLLUP для вычислениячастичных сумм ....357

Предложение CUBE ....361

Функция GROUPING ....366

Как осуществляется управление иерархиейв предложениях ROLLUP и CUBE ....370

17. SQL В ХРАНИЛИЩАХ ДАННЫХ:АНАЛИТИЧЕСКАЯ ОБРАБОТКА ....373

Каковы аналитические функции SQL ....373

Что такое окно и оконные функциии как с ними связано предложение OVER ....377

Каковы функции ранжирования ....382

Функция CUME_DIST ....390

Агрегатные и статистические оконные функции ....394

Какие существуют функции управления доступомк строкам в секции ....408

18. КАК ИСПОЛЬЗОВАТЬ ХРАНИЛИЩА ДАННЫХДЛЯ БИЗНЕС-АНАЛИЗА ....411

Об аналитике в бизнесе ....411

Каковы алгоритмы анализа данныхв хранилищах данных ....414

Машинное обучение, Big Data и Data Science ....419

ЭТО ИНТЕРЕСНО. СПИСОК ТЕРМИНОВ ................................. ....424

Хранилища данных как информационная технология появились в результате применения прикладного искусственного интеллекта в области систем принятия и поддержки решений. И в обозримой перспективе хранилища данных будут оставаться базовым элементом систем бизнес-аналитики в части обработки структурированных данных. В издании рассматривается архитектура хранилищ данных, многомерная модель данных и сложившиеся подходы к многомерному проектированию (корпоративное хранилище данных, связанные киоски данных, Data Vault, Anchor-модель), обзор SQL для агрегации и аналитики, вопросы проектирования производительности, основы оптимизации запросов, представление о метаданных и базовые схемы процессов извлечения, преобразования и загрузки данных. Книга будет интересна широкому кругу специалистов IT-сферы и бизнеса, чья деятельность связана с анализом данных.


Похожее:

Список отзывов:

Нет отзывов к книге.