Презентация на тему: Модель типового проекта создания хранилища данных

Модель типового проекта создания хранилища данных
Создание хранилища данных
Жизненный цикл разработки хранилища данных
Подготовка данных
Модель жизненного цикла хранилища данных
Планирование
Разработка требований
Анализ
Проектирование
Построение
Внедрение
Поддержка
Бизнес-модель типового проекта создания хранилища данных
Процесс разработки хранилища данных
Формулирование требований
Создание вычислительной среды
Моделирование данных
Определение процедур извлечения, преобразования и загрузки данных
Проектирование аналитических отчетов
Разработка приложений
Настройка производительности
Проверка качества
Передача в эксплуатацию
Сопровождение и модификация
1/24
Средняя оценка: 4.4/5 (всего оценок: 4)
Код скопирован в буфер обмена
Скачать (571 Кб)
1

Первый слайд презентации: Модель типового проекта создания хранилища данных

Распределённые базы данных и хранилища данных

Изображение слайда
2

Слайд 2: Создание хранилища данных

Проектировщик хранилища данных должен иметь план проектирования хранилища данных. Каждый член команды должен знать, какова цель проекта, какие задачи решаются в рамках проекта, какие задачи и в какие сроки должен решить каждый член команды. Плохо спроектированная структура хранилища данных обычно приводит к сложности реализации хранилища данных и к увеличению сроков проекта. Плохо организованный проект создания хранилища данных, даже при качественном проектировании, часто приводит к провалу проекта.

Изображение слайда
3

Слайд 3: Жизненный цикл разработки хранилища данных

Изображение слайда
4

Слайд 4: Подготовка данных

Точная идентификация бизнес-информации, которая должна храниться в хранилище данных. Идентификация предметных областей, которые составят набор предметных областей хранилища данных. Управление границами каждой предметной области. Разработка масштабируемой архитектуры, точное определение и выбор структурных компонент. Определение процедур извлечения, очистки, агрегации, преобразования и проверки данных. Определение корректных уровней суммирования числовых показателей для поддержки бизнес-решений. Определение и разработка процедур своевременного обновления данных. Разработка дружественных интерфейсов и мощных инструментов аналитической обработки данных. Разработка словаря метаданных для обеспечения общения с хранилищем данных пользователей. Обучение персонала для работы с приложениями хранилища данных. Определение и регламентирование процесса сопровождения и обслуживания хранилища данных.

Изображение слайда
5

Слайд 5: Модель жизненного цикла хранилища данных

Жизненный цикл продукта – набор определенным образом расположенных во времени этапов, которые проходит продукт от момента его создания до момента его утилизации. Стадии процесса создания и разработки хранилища данных: планирование; формулирование требований к системе складирования данных; анализ; проектирование; конструирование; внедрение; поддержка.

Изображение слайда
6

Слайд 6: Планирование

Задачи: выбор стратегии реализации и методологии разработки; анализ задач, для которых создается хранилище данных; анализ ресурсов разработки; выбор архитектуры хранилища данных; определение бюджета проекта; разработка сценариев использования хранилища данных; сбор метаданных для хранилища данных.

Изображение слайда
7

Слайд 7: Разработка требований

Задачи: определение требований владельца хранилища данных; определение требований конечных пользователей; определение технологических требований; определение архитектурных требований.

Изображение слайда
8

Слайд 8: Анализ

Задачи: разработка логической модели данных для хранилища данных и киосков данных; определение набора инструментальных средств для работы с хранилищем данных.

Изображение слайда
9

Слайд 9: Проектирование

Задачи: проектирование архитектуры данных (логическое и физическое проектирование); проектирование архитектуры приложений (анализ запросов и фиксация процессов взаимодействия хранилища данных с внешними источниками и пользователями).

Изображение слайда
10

Слайд 10: Построение

Цель этапа – разработка программ и физической базы данных под хранилище данных. Результат этапа – комплекс программ, работающих с хранилищем данных.

Изображение слайда
11

Слайд 11: Внедрение

Результат этапа – всесторонняя подготовка перехода хранилища данных в промышленную эксплуатацию.

Изображение слайда
12

Слайд 12: Поддержка

Поддержка работоспособности и масштабируемости программно-аппаратного обеспечения хранилища данных. Сбор, очистка, преобразование, загрузка и актуализация данных в соответствии с установленными процедурами. Поддержка автоматизированных мест пользователей. Техническая поддержка со стороны разработчика хранилища данных.

Изображение слайда
13

Слайд 13: Бизнес-модель типового проекта создания хранилища данных

Изображение слайда
14

Слайд 14: Процесс разработки хранилища данных

Этапы: формулирование требований; моделирование данных; разработка приложений хранилища данных; создание вычислительной среды; проектирование аналитических отчетов; определение процедур извлечения, преобразования и загрузки данных ( ETL ); проверка качества; настройка производительности; передача системы складирования данных в эксплуатацию.

Изображение слайда
15

Слайд 15: Формулирование требований

Задача – идентификация требований заказчика хранилища данных и оформление их в виде документа. Время выполнения – от двух недель до двух месяцев. Результат – каталог требований, утвержденный заказчиком, и уточненный план проекта, который точно определяет используемые ресурсы и даты контрольных точек проверки хода выполнения проекта. Потенциальные опасности – конфликт внутрикорпоративных интересов и необходимость наладить коммуникации для успешного выполнения и этапа и проекта в целом.

Изображение слайда
16

Слайд 16: Создание вычислительной среды

Задача – создание информационно-вычислительной среды, в которой будет разрабатываться хранилище данных. Время выполнения – от двух до четырех недель. Результат – спецификации на программно-аппаратное обеспечение и программное обеспечение. Потенциальные опасности – использование одного сервера базы данных для моделирования различных вычислительных сред.

Изображение слайда
17

Слайд 17: Моделирование данных

Задача – разработка логической и физической моделей данных для хранилища данных. Время выполнения – от двух недель до двух месяцев. Результат – перечень источников данных и их описание, а также логическая и физическая модели данных. Потенциальные опасности – недостаточная осведомленность проектировщиков о предметной области хранилища данных и низкое качество информации, поставляемой аналитиками предметной области.

Изображение слайда
18

Слайд 18: Определение процедур извлечения, преобразования и загрузки данных

Задача – идентификация и определение процедур извлечения, очистки (фильтрации), преобразования и загрузки данных. Время выполнения – от одной недели до полутора месяцев. Результат – схема соответствия данных исходных систем и хранилища данных, программы или ETL- инструменты. Потенциальные опасности – недооценка временных параметров, стремление сделать процесс ETL как можно более всеобъемлющим.

Изображение слайда
19

Слайд 19: Проектирование аналитических отчетов

Задача – проектирование и разработка аналитических отчетов на спроектированной структуре данных. Время выполнения – до двух недель. Результат – спецификация кубов данных (измерения и метрики) и разработанные отчеты. Потенциальные опасности – не уделяется достаточного внимания оптимизации времени получения отчета.

Изображение слайда
20

Слайд 20: Разработка приложений

Задача – формирование программной среды, в которой пользователи будут извлекать данные из хранилища данных и просматривать предопределенные отчеты. Время выполнения – от одной недели до месяца. Результат – документация, описывающая механизм доставки пользователям отчетов и спецификации экранных форм. Потенциальные опасности – ложное представление о достаточной квалификации пользователей хранилища данных для работы с ИТ-технологиями.

Изображение слайда
21

Слайд 21: Настройка производительности

Задача – добиться оптимальной производительности ЕТL-процессов, производства отчетов и их доставки конечному пользователю. Время выполнения – не более двух недель. Результат – перечень рекомендаций по настройке производительности. Потенциальные опасности – использование вычислительной среды разработки хранилища данных, которая не масштабируется к вычислительной среде эксплуатации хранилища данных.

Изображение слайда
22

Слайд 22: Проверка качества

Задача – убедиться, что хранилище данных готово к эксплуатации. Время выполнения – от одной до четырех недель. Результат – план тестирования хранилища данных и заключение о готовности хранилища данных к эксплуатации. Потенциальные опасности – недостаточная квалификация людей, проверяющих хранилище данных, в области складирования данных.

Изображение слайда
23

Слайд 23: Передача в эксплуатацию

Задача – передача системы складирования данных заказчику и представление ее конечным пользователям. Время выполнения – от одного дня до нескольких недель. Результат – акт приемки-сдачи. Потенциальные опасности – неготовность потенциальных пользователей к работе с хранилищем данных.

Изображение слайда
24

Последний слайд презентации: Модель типового проекта создания хранилища данных: Сопровождение и модификация

Процессы сопровождения хранилища данных требуют от ИТ-специалистов иной квалификации, чем процессы его разработки. Если необходимость в модернизации хранилища данных возникает спустя несколько месяцев после сдачи его в эксплуатацию, это говорит о том, что проект не был успешным. Потребность в модернизации реально может сформироваться спустя шесть месяцев после интенсивной его эксплуатации.

Изображение слайда