Эти термины используются повсюду, и я не знаю четких определений. Я почти уверен, что знаю, что такое витрина данных. И я создал кубы отчетов с помощью таких инструментов, как Business Objects и Cognos.
Мне также приходилось слышать от людей, что витрина данных - это больше, чем просто набор кубов.
У меня также были люди, которые говорили мне, что витрина данных - это куб отчетов, не более того.
Какие различия вы понимаете?





Для меня витрина данных - это просто место, куда данные выгружаются в относительно плоском, непригодном для использования формате.
Cube берет эти данные и заставляет их танцевать.
О да, производительность денормализованных таблиц НАМНОГО лучше, чем у полностью нормализованных. Однако расплачиваться за потраченное впустую пространство.
Куб может (и, возможно, должно) означать что-то вполне конкретное - артефакты OLAP, представленные через Сервер OLAP, такие как MS Analysis Services или Oracle (в девичестве Hyperion) Essbase. Однако он также используется гораздо более свободно. Кубы OLAP этого типа используют инструменты запросов с поддержкой кубов, которые используют API, отличный от стандартной реляционной базы данных. Обычно серверы OLAP поддерживают свои собственные оптимизированные структуры данных (известные как MOLAP), хотя они могут быть реализованы как интерфейс для реляционного источника данных (известный как ROLAP) или в различных гибридных режимах (известных как HOLAP)
Я стараюсь быть конкретным и использую слово «куб» специально для обозначения кубов на серверах OLAP, таких как SSAS.
Бизнес-объекты работает, запрашивая данные из одного или нескольких источников (которые могут быть реляционными базами данных, кубами OLAP или плоскими файлами) и создавая структуру данных в памяти, называемую MicroCube, которую он использует для поддержки интерактивных операций среза и кости. Службы Analysis Services и MSQuery могут создавать файл куба (.cub), который может быть открыт клиентским программным обеспечением AS или Excel и аналогичным образом разрезан на части. IIRC Последние версии Business Objects также могут открывать файлы .cub.
Чтобы быть педантичным, я считаю, что Business Objects находится в пространстве «полуструктурированной отчетности» где-то между настоящей системой OLAP, такой как ProClarity, и специальным инструментом отчетности, таким как Построитель отчетов, Oracle Discoverer или Брио. Круговые обходы панели запросов делают ее несколько неуклюжей как простой инструмент OLAP с потоком мыслей, но он предлагает уровень интерактивности, которого нет в традиционных отчетах. Я считаю, что Business Objects удобно размещается в двух местах: специальная отчетность сотрудниками, не обязательно знакомыми с SQL, и предоставление запланированного отчета в интерактивном формате, позволяющем детализировать данные.
"Витрина данных" также является довольно широко используемым термином и может означать любой пользовательский носитель доступа к данным для системы хранилища данных. Определение может включать или не включать инструменты отчетности и уровни метаданных, таблицы уровней отчетности или другие элементы, такие как кубы или другие аналитические системы.
Я склонен думать о витрине данных как о базе данных, из которой создается отчетность, особенно если это легко определяемая подсистема общей архитектуры хранилища данных. Однако вполне разумно рассматривать его как уровень отчетности, с которым сталкивается пользователь, особенно если существуют специальные инструменты отчетности, такие как Business Objects или системы OLAP, которые позволяют конечным пользователям напрямую получать данные.
Термин «витрина данных» стал несколько двусмысленным, но он традиционно ассоциируется с предметно-ориентированным подмножеством информационных систем организации. Витрина данных явно не подразумевает наличие многомерной технологии, такой как OLAP, а витрина данных не подразумевает явным образом наличие обобщенных числовых данных.
С другой стороны, куб обычно подразумевает, что данные представлены с использованием многомерной номенклатуры (обычно это технология OLAP) и что данные обычно суммируются как пересечения нескольких иерархий. (т.е. чистая стоимость вашей семьи по сравнению с вашей личной чистой стоимостью и всем, что между ними) Как правило, «куб» подразумевает что-то очень конкретное, тогда как «витрина данных» имеет тенденцию быть немного более общим.
Я полагаю, что на языке ООП вы могли бы точно сказать, что витрина данных «имеет» куб, «имеет» реляционную базу данных, отличный интерфейс отчетов и т. д., Но было бы менее правильным утверждать, что любой из тех индивидуально «является» витриной данных. Термин «витрина данных» является более широким.
Витрина данных традиционно означала статические данные, обычно ориентированные на дату и время, используемые аналитиками для статистики, составления бюджета, отчетов о производительности и продажах, а также для других операций планирования.
Куб - это база данных OLAP, которая довольно полно преобразует данные OLTP в статическую схему, ориентированную на дату / время, которая использует язык запросов, который не является SQL, но создан специально для ответов на вопросы типа витрины данных. В нем используются такие термины, как меры, измерения, звездообразная схема и т. д., А не таблицы, столбцы и строки. Лучшая знакомая аналогия - это сводные таблицы в электронной таблице.
Витрина данных - это набор данных о конкретном бизнес-процессе. Неважно, как хранятся данные. Куб хранит данные особым образом, многомерно, в отличие от таблицы со строкой и столбцом. Куб в базе данных olap похож на таблицу в традиционной базе данных. Витрина данных может содержать таблицы или кубы. Кубы ускоряют анализ, поскольку заранее вычисляют агрегаты.
Я согласен с Мэтью. Мы склонны использовать термин «витрина данных» для любого источника данных, в котором хранятся общие данные и сопоставления, используемые в различных приложениях на предприятии. Мы не храним измеримые данные в витрине данных, поэтому я рассматриваю витрину данных как один из нескольких источников данных для куба. Однако именно так это делает мы. Я уверен, что ничто не мешает вам хранить измеримые данные в витрине данных.
Как следует из названия, куб - это структурированный многомерный набор данных (обычно три измерения, каждое из которых представляет три стороны куба). Витрина данных - это просто контейнер, а не структура сама по себе, хотя она содержит наборы данных, четко организованные (в виде таблиц) по измерениям и фактам.
Структура куба позволяет легко визуализировать или концептуализировать данные по различным измерениям куба. Таким образом, большинству бизнес-аналитиков или разработчиков легко запрашивать куб и взаимодействовать с ним.
Поскольку витрина данных - это просто контейнер с кучей таблиц; пользователям необходимо сначала концептуализировать и понять размерные структуры, прежде чем запрашивать и анализировать данные.
Помнить:
Хранилище данных - это процесс получения данных из устаревших систем баз данных и баз данных транзакций и их преобразования в организованную информацию в удобном для пользователя формате, чтобы стимулировать анализ данных и поддерживать принятие бизнес-решений на основе фактов.
Хранилище данных - это система, которая извлекает, очищает, согласовывает и доставляет источник данных в размерное хранилище данных, а затем поддерживает и реализует опрос и анализ с целью принятия решения.
КИМБОЛ напр. последовательно определила витрину данных как ориентированное на процесс подмножество данных всей организации, основанное на элементарных данных, и это зависит только от физики событий измерения данных, а не от ожидаемых вопросов пользователя.
ПРАВИЛЬНОЕ ОПРЕДЕЛЕНИЕ
НЕПРАВИЛЬНОЕ ОПРЕДЕЛЕНИЕ
Иногда эти плоские форматы не только удобны, но и работают намного лучше, чем нормализованные структуры данных.