Презентация на тему: Метод многомерного моделирования

Метод многомерного моделирования
Основные понятия
Основные понятия
Основные понятия
Куб данных
Свертывание и развертывание данных
Классы фактов
Примеры
Ключи в таблице фактов
Пример с уникальным первичным ключом таблицы фактов ( гранулированность фактов – одни сутки)
Пример с уникальным первичным ключом таблицы фактов ( гранулированность фактов – один час)
Категории таблиц фактов
Основные характеристики таблицы фактов
Основные характеристики таблицы измерений
Примеры таблицы фактов и таблицы измерений
Схемы многомерной модели
Схема «звезда»
Схема «снежинка»
Схема «снежинка»
Схема «созвездие»
Моделирование таблиц фактов
Пример таблицы агрегатов фактов периодических моментальных снимков
Пример таблицы агрегатов фактов периодических моментальных снимков
Пример таблицы агрегатов фактов кумулятивных моментальных снимков
Сравнение видов таблиц фактов
Моделирование таблиц измерений
Медленно меняющиеся измерения (тип 1)
Медленно меняющиеся измерения (тип 2)
Медленно меняющиеся измерения (тип 3)
Пример медленно меняющегося измерения (тип 2)
Пример медленно меняющегося измерения (тип 3)
Схема принятия решения при выборе типа медленно меняющегося измерения
Моделирование таблиц измерений
Пример быстро меняющегося измерения
Пример разбиения быстро меняющегося измерения
Моделирование таблиц измерений
Пример вырожденного измерения
Иерархии измерений
Сбалансированная иерархия
Несбалансированная иерархия
Несбалансированная иерархия
Иерархия с пропущенными уровнями
Отношение «многие ко многим» в измерениях
Таблица фактов без метрик
Таблица фактов отслеживания событий
Таблица фактов охвата событий
Таблица-мост
1/47
Средняя оценка: 4.3/5 (всего оценок: 25)
Код скопирован в буфер обмена
Скачать (1776 Кб)
1

Первый слайд презентации: Метод многомерного моделирования

Распределённые базы данных и хранилища данных

Изображение слайда
2

Слайд 2: Основные понятия

Многомерное моделирование – это метод моделирования и визуализации данных как множества числовых или лингвистических показателей или параметров ( measures ), которые описывают общие аспекты деятельности организации. Многомерная модель ( Dimensional model ) ориентирована в первую очередь на выполнение сложных запросов к базе данных.

Изображение слайда
3

Слайд 3: Основные понятия

Факт ( fact ) – это набор связанных элементов данных, содержащих метрики и описательные данные. Каждый факт обычно представляет элемент данных, численно описывающий деятельность организации, бизнес-операцию или событие, которое может быть использовано для анализа деятельности организации или бизнес-процессов. Атрибут ( Attribute ) – это описание характеристики реального объекта предметной области. Измерение ( dimension ) – это интерпретация факта с некоторой точки зрения в реальном мире. Обычно измерения представляются как оси многомерного пространства, точками которого являются связанные с ними факты. Измерения задаются перечислением своих элементов ( members ). Элемент измерения ( dimensional member ) – уникальное имя или идентификатор (лингвистическая переменная), используемая для определения позиции элемента.

Изображение слайда
4

Слайд 4: Основные понятия

Иерархия ( hierarchy ) – группировка объектов одного измерения в объекты более высокого уровня. Иерархия целиком основывается на одном измерении и формируется из уровней ( hierarchy levels ). Параметр, метрика или показатель ( measure ) – это числовая характеристика факта, который определяет эффективность деятельности или бизнес-действия организации с точки зрения измерения. Гранулированность ( Granularity ) – это уровень детализации данных, сохраняемых в хранилище данных.

Изображение слайда
5

Слайд 5: Куб данных

Изображение слайда
6

Слайд 6: Свертывание и развертывание данных

Развертка ( drill down ) и свертка ( drill up ) являются операциями перемещения вниз и вверх по уровням иерархии измерения.

Изображение слайда
7

Слайд 7: Классы фактов

Аддитивные факты ( Additive facts ). Факт называется аддитивным, если его имеет смысл использовать с любыми измерениями для выполнения операций суммирования с целью получения какого-либо значимого результата. Полуаддитивные факты ( Semiadditive facts ). Факт называется полуаддитивным, если его имеет смысл использовать совместно с некоторыми измерениями для выполнения операций суммирования с целью получения какого-либо значимого результата. Неаддитивные факты (Non-additive facts). Факт называется неаддитивным, если его не имеет смысла использовать совместно с каким-либо измерением для выполнения операций суммирования с целью получения какого-либо значимого результата. Числовые меры интенсивности (Numerical Measures of Intensity). Факт называется числовой мерой интенсивности, если он, являясь неаддитивным по времени, допускает агрегацию и суммирование по некоторому числу временных периодов.

Изображение слайда
8

Слайд 8: Примеры

Изображение слайда
9

Слайд 9: Ключи в таблице фактов

Первичный ключ в таблице фактов является, как правило, составным первичным ключом. Он состоит из множества внешних ключей, которые служат первичными ключами измерений, связанных с фактами. Гранулированность фактов определяет смысл значения факта с точки зрения уровня детализации, связываемой с фактом информации.

Изображение слайда
10

Слайд 10: Пример с уникальным первичным ключом таблицы фактов ( гранулированность фактов – одни сутки)

Изображение слайда
11

Слайд 11: Пример с уникальным первичным ключом таблицы фактов ( гранулированность фактов – один час)

Изображение слайда
12

Слайд 12: Категории таблиц фактов

Транзакционная таблица фактов. В такой таблице фактов сохраняют факты, которые фиксируют определенные события (транзакции). Таблица фактов периодических моментальных снимков. В такой таблице собирают факты, фиксирующие текущее состояние определенного направления бизнеса. Таблица фактов кумулятивных моментальных снимков. В такой таблице собирают факты, фиксирующие некоторое итоговое состояние определенного направления бизнеса на текущий момент времени.

Изображение слайда
13

Слайд 13: Основные характеристики таблицы фактов

Таблица фактов содержит числовые параметры (метрики). Каждая таблица фактов имеет составной ключ, состоящий из первичных ключей таблиц измерений. Первичный ключ таблицы измерений является внешним ключом в таблице фактов. Таблица фактов имеет, как правило, небольшое количество полей. Данные в таблице фактов обладают следующими свойствами: числовые параметры используются для агрегации и суммирования; значения данных должны обладать свойствами аддитивности или полуаддитивности по отношению к измерениям, для того чтобы их можно было суммировать; все данные таблицы фактов должны быть однозначно идентифицированы через ключи таблиц измерений, чтобы обеспечить доступ к ним через таблицы измерений.

Изображение слайда
14

Слайд 14: Основные характеристики таблицы измерений

Таблицы измерений содержат данные о детализации фактов. Таблицы измерений содержат описательную информацию о числовых значениях в таблице фактов. Как правило, денормализованные таблицы измерений содержат большое количество полей. Таблицы измерений содержат обычно значительно меньше строк, чем таблицы фактов. Атрибуты таблиц измерений обычно используются при визуализации данных в отчетах и запросах.

Изображение слайда
15

Слайд 15: Примеры таблицы фактов и таблицы измерений

Таблица фактов Таблица измерений

Изображение слайда
16

Слайд 16: Схемы многомерной модели

Схема «звезда» ( star schema ) имеет одну таблицу фактов и несколько таблиц измерений. Схема «снежинка» ( snowflake schema ) имеет одну таблицу фактов и несколько нормализованных таблиц измерений. Схема «созвездие» ( fact constellation schema ) имеет несколько таблиц фактов.

Изображение слайда
17

Слайд 17: Схема «звезда»

Изображение слайда
18

Слайд 18: Схема «снежинка»

Изображение слайда
19

Слайд 19: Схема «снежинка»

Изображение слайда
20

Слайд 20: Схема «созвездие»

Изображение слайда
21

Слайд 21: Моделирование таблиц фактов

Агрегатами являются суммы значений параметров или статистические функции от значений параметров, взятые на определенном уровне детализации ( гранулированности ). Таблицей агрегатов фактов ( Aggregate fact table ) называется таблица фактов, которая содержит агрегаты некоторых фактов модели. Обычно в хранилище данных используют два типа таблиц агрегатов фактов: со степенью детализации на уровне периодического снимка данных, представляющего промежуток времени заданной продолжительности (таблица фактов периодических моментальных снимков); со степенью детализации на уровне аккумулирующего снимка, представляющего всю историю фактов (исторические данные) с заданного и до текущего моментов времени (таблица фактов кумулятивных моментальных снимков).

Изображение слайда
22

Слайд 22: Пример таблицы агрегатов фактов периодических моментальных снимков

Изображение слайда
23

Слайд 23: Пример таблицы агрегатов фактов периодических моментальных снимков

Изображение слайда
24

Слайд 24: Пример таблицы агрегатов фактов кумулятивных моментальных снимков

Изображение слайда
25

Слайд 25: Сравнение видов таблиц фактов

Транзакционная таблица фактов Таблица фактов периодических моментальных снимков Таблица фактов кумулятивных моментальных снимков Определение гранулированности таблицы фактов Одна строка на бизнес-операцию Одна строка на период Одна строка для всего периода завершенного события Измерения Используют факты на самом низком уровне детализации по измерению «дата/время» Используют факты на некотором уровне агрегации по измерению «дата/время» (по концу периода) Используют факты по нескольким измерениям «дата/время» для фиксации результатов в различных контрольных точках Общее количество задействованных измерений Больше, чем в таблицах фактов периодических снимков Меньше, чем в транзакционных таблицах фактов Наибольшее количество измерений для таблиц фактов Факты Факты связаны с операционной деятельностью Факты связаны с периодической деятельностью Факты связаны с деятельностью, которая имеет определенное время существования Обновления Не допускаются Не допускаются Допускаются Кардинальность таблицы фактов Растет быстро Растет медленнее, чем в транзакционных таблицах фактов Растет медленнее, чем в таблицах фактов периодических моментальных снимков

Изображение слайда
26

Слайд 26: Моделирование таблиц измерений

Медленно меняющимися измерениями ( slowly changing dimensions ) называются таблицы измерений, в которых некоторые атрибуты могут изменить свои значения по истечении некоторого периода времени, причем частота таких изменений является небольшой. Типы действий: Тип 1. Изменить значение атрибута таблицы измерений на новое значение. При этом будет потеряна хронология. Тип 2. Создать новую строку в таблице измерений с новым значением суррогатного ключа. Тип 3. Создать дополнительный атрибут таблицы измерений с новым значением.

Изображение слайда
27

Слайд 27: Медленно меняющиеся измерения (тип 1)

Старое значение атрибута меняется на новое значение.

Изображение слайда
28

Слайд 28: Медленно меняющиеся измерения (тип 2)

Создается новая запись в таблице измерения с новым суррогатным ключом.

Изображение слайда
29

Слайд 29: Медленно меняющиеся измерения (тип 3)

Создаются новые поля в таблице измерения.

Изображение слайда
30

Слайд 30: Пример медленно меняющегося измерения (тип 2)

Изображение слайда
31

Слайд 31: Пример медленно меняющегося измерения (тип 3)

Изображение слайда
32

Слайд 32: Схема принятия решения при выборе типа медленно меняющегося измерения

ЕСЛИ требуется сохранять историю измерения, ТО следует выбрать тип 2 В ПРОТИВНОМ СЛУЧАЕ ЕСЛИ необходимо сравнивать текущее значение атрибута с первоначальным или предыдущим, ТО следует выбрать тип 3 В ПРОТИВНОМ СЛУЧАЕ следует выбрать тип 1.

Изображение слайда
33

Слайд 33: Моделирование таблиц измерений

Быстро меняющимися измерениями ( rapidly changing dimensions ) называются таблицы измерений, в которых некоторые атрибуты могут часто менять свои значения в короткие периоды времени. Модели для управления такими измерениями зависят от кардинальности таблиц измерений. Если кардинальность таблиц измерений является небольшой (до 10000 записей), то может быть использован такой же подход, как в случае медленно меняющихся измерений. В случае очень больших таблиц измерений (до миллиона записей) следует избегать дублирования записей и не создавать новые дополнительные записи.

Изображение слайда
34

Слайд 34: Пример быстро меняющегося измерения

Изображение слайда
35

Слайд 35: Пример разбиения быстро меняющегося измерения

Изображение слайда
36

Слайд 36: Моделирование таблиц измерений

Вырожденным измерением ( degenerate dimension ) называется ключ в таблице фактов, по которому не производится соединение с таблицей, поскольку все связанные с этим ключом атрибуты размещаются в других измерениях. Обычно вырожденное измерение представлено атрибутами ключа измерения в таблице фактов без соответствующей таблицы измерений.

Изображение слайда
37

Слайд 37: Пример вырожденного измерения

Изображение слайда
38

Слайд 38: Иерархии измерений

Иерархией называется взаимосвязанный набор отношений «многие к одному», состоящий из последовательности уровней. В многомерном моделировании различают три типа иерархий: сбалансированные иерархии ( Balanced hierarchy ); несбалансированные иерархии ( Unbalanced hierarchy ); иерархии с пропущенными уровнями ( Ragged hierarchy ).

Изображение слайда
39

Слайд 39: Сбалансированная иерархия

Сбалансированная иерархия – это иерархия, в которой все ветви измерения имеют одно и то же количество уровней. Сбалансированная иерархия состоит из фиксированного числа уровней.

Изображение слайда
40

Слайд 40: Несбалансированная иерархия

Несбалансированная иерархия – это иерархия, в которой все ветви измерения имеют различное число уровней. Рекурсивный указатель ( recursive pointer ) – ключ сущности потомка в сущности родителя.

Изображение слайда
41

Слайд 41: Несбалансированная иерархия

Таблица-мост ( bridge table ) – вспомогательная таблица, которая предназначена упростить работу с рекурсивными отношениями, отношениями «многие ко многим», отношениями типа иерархии при использовании реляционной модели данных.

Изображение слайда
42

Слайд 42: Иерархия с пропущенными уровнями

Иерархия с пропущенными уровнями – это иерархия, в которой допускается отсутствие одного из уровней при заполнении ее данными.

Изображение слайда
43

Слайд 43: Отношение «многие ко многим» в измерениях

Таблицы измерений могут находиться в отношении «многие ко многим» между собой. Отношение «многие ко многим» может существовать между: таблицей измерения и таблицей фактов; между таблицами измерений. В многомерном моделировании хранилища данных для разрешения отношения «многие ко многим» между таблицами измерений могут быть использованы два типа таких дополнительных таблиц: «пустая» таблица фактов или таблица фактов без метрик ( factless fact table ); таблица-мост ( bridge table ).

Изображение слайда
44

Слайд 44: Таблица фактов без метрик

Таблица фактов без метрик – это таблица фактов, которая не содержит числовых параметров или метрик. Обязательным атрибутом этой таблицы является составной ключ, который состоит из первичных ключей сущностей, находящихся в отношении «многие ко многим». Типы таблиц фактов без метрик: таблицы фактов отслеживания событий ( event tracking tables ); таблицы фактов охвата событий ( coverage tables ).

Изображение слайда
45

Слайд 45: Таблица фактов отслеживания событий

Таблица фактов отслеживания событий фиксирует событие, т.е. дату или время события и его описание.

Изображение слайда
46

Слайд 46: Таблица фактов охвата событий

Таблица фактов охвата событий содержит описание того, что еще не произошло.

Изображение слайда
47

Последний слайд презентации: Метод многомерного моделирования: Таблица-мост

Изображение слайда