Datamart и Report Cube, в чем различия?

Эти термины используются повсюду, и я не знаю четких определений. Я почти уверен, что знаю, что такое витрина данных. И я создал кубы отчетов с помощью таких инструментов, как Business Objects и Cognos.

Мне также приходилось слышать от людей, что витрина данных - это больше, чем просто набор кубов.

У меня также были люди, которые говорили мне, что витрина данных - это куб отчетов, не более того.

Какие различия вы понимаете?

Стоит ли изучать PHP в 2026-2027 годах?
Стоит ли изучать PHP в 2026-2027 годах?
Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Приемы CSS-макетирования - floats и Flexbox
Приемы CSS-макетирования - floats и Flexbox
Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...
Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest
В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
18
0
51 686
8
Перейти к ответу Данный вопрос помечен как решенный

Ответы 8

Для меня витрина данных - это просто место, куда данные выгружаются в относительно плоском, непригодном для использования формате.

Cube берет эти данные и заставляет их танцевать.

Иногда эти плоские форматы не только удобны, но и работают намного лучше, чем нормализованные структуры данных.

JeffO 06.03.2013 23:59

О да, производительность денормализованных таблиц НАМНОГО лучше, чем у полностью нормализованных. Однако расплачиваться за потраченное впустую пространство.

Brian Knoblauch 07.03.2013 00:23
Ответ принят как подходящий

Куб может (и, возможно, должно) означать что-то вполне конкретное - артефакты OLAP, представленные через Сервер OLAP, такие как MS Analysis Services или Oracle (в девичестве Hyperion) Essbase. Однако он также используется гораздо более свободно. Кубы OLAP этого типа используют инструменты запросов с поддержкой кубов, которые используют API, отличный от стандартной реляционной базы данных. Обычно серверы OLAP поддерживают свои собственные оптимизированные структуры данных (известные как MOLAP), хотя они могут быть реализованы как интерфейс для реляционного источника данных (известный как ROLAP) или в различных гибридных режимах (известных как HOLAP)

Я стараюсь быть конкретным и использую слово «куб» специально для обозначения кубов на серверах OLAP, таких как SSAS.

Бизнес-объекты работает, запрашивая данные из одного или нескольких источников (которые могут быть реляционными базами данных, кубами OLAP или плоскими файлами) и создавая структуру данных в памяти, называемую MicroCube, которую он использует для поддержки интерактивных операций среза и кости. Службы Analysis Services и MSQuery могут создавать файл куба (.cub), который может быть открыт клиентским программным обеспечением AS или Excel и аналогичным образом разрезан на части. IIRC Последние версии Business Objects также могут открывать файлы .cub.

Чтобы быть педантичным, я считаю, что Business Objects находится в пространстве «полуструктурированной отчетности» где-то между настоящей системой OLAP, такой как ProClarity, и специальным инструментом отчетности, таким как Построитель отчетов, Oracle Discoverer или Брио. Круговые обходы панели запросов делают ее несколько неуклюжей как простой инструмент OLAP с потоком мыслей, но он предлагает уровень интерактивности, которого нет в традиционных отчетах. Я считаю, что Business Objects удобно размещается в двух местах: специальная отчетность сотрудниками, не обязательно знакомыми с SQL, и предоставление запланированного отчета в интерактивном формате, позволяющем детализировать данные.

"Витрина данных" также является довольно широко используемым термином и может означать любой пользовательский носитель доступа к данным для системы хранилища данных. Определение может включать или не включать инструменты отчетности и уровни метаданных, таблицы уровней отчетности или другие элементы, такие как кубы или другие аналитические системы.

Я склонен думать о витрине данных как о базе данных, из которой создается отчетность, особенно если это легко определяемая подсистема общей архитектуры хранилища данных. Однако вполне разумно рассматривать его как уровень отчетности, с которым сталкивается пользователь, особенно если существуют специальные инструменты отчетности, такие как Business Objects или системы OLAP, которые позволяют конечным пользователям напрямую получать данные.

Термин «витрина данных» стал несколько двусмысленным, но он традиционно ассоциируется с предметно-ориентированным подмножеством информационных систем организации. Витрина данных явно не подразумевает наличие многомерной технологии, такой как OLAP, а витрина данных не подразумевает явным образом наличие обобщенных числовых данных.

С другой стороны, куб обычно подразумевает, что данные представлены с использованием многомерной номенклатуры (обычно это технология OLAP) и что данные обычно суммируются как пересечения нескольких иерархий. (т.е. чистая стоимость вашей семьи по сравнению с вашей личной чистой стоимостью и всем, что между ними) Как правило, «куб» подразумевает что-то очень конкретное, тогда как «витрина данных» имеет тенденцию быть немного более общим.

Я полагаю, что на языке ООП вы могли бы точно сказать, что витрина данных «имеет» куб, «имеет» реляционную базу данных, отличный интерфейс отчетов и т. д., Но было бы менее правильным утверждать, что любой из тех индивидуально «является» витриной данных. Термин «витрина данных» является более широким.

Витрина данных традиционно означала статические данные, обычно ориентированные на дату и время, используемые аналитиками для статистики, составления бюджета, отчетов о производительности и продажах, а также для других операций планирования.

Куб - это база данных OLAP, которая довольно полно преобразует данные OLTP в статическую схему, ориентированную на дату / время, которая использует язык запросов, который не является SQL, но создан специально для ответов на вопросы типа витрины данных. В нем используются такие термины, как меры, измерения, звездообразная схема и т. д., А не таблицы, столбцы и строки. Лучшая знакомая аналогия - это сводные таблицы в электронной таблице.

Витрина данных - это набор данных о конкретном бизнес-процессе. Неважно, как хранятся данные. Куб хранит данные особым образом, многомерно, в отличие от таблицы со строкой и столбцом. Куб в базе данных olap похож на таблицу в традиционной базе данных. Витрина данных может содержать таблицы или кубы. Кубы ускоряют анализ, поскольку заранее вычисляют агрегаты.

Я согласен с Мэтью. Мы склонны использовать термин «витрина данных» для любого источника данных, в котором хранятся общие данные и сопоставления, используемые в различных приложениях на предприятии. Мы не храним измеримые данные в витрине данных, поэтому я рассматриваю витрину данных как один из нескольких источников данных для куба. Однако именно так это делает мы. Я уверен, что ничто не мешает вам хранить измеримые данные в витрине данных.

Как следует из названия, куб - это структурированный многомерный набор данных (обычно три измерения, каждое из которых представляет три стороны куба). Витрина данных - это просто контейнер, а не структура сама по себе, хотя она содержит наборы данных, четко организованные (в виде таблиц) по измерениям и фактам.

Структура куба позволяет легко визуализировать или концептуализировать данные по различным измерениям куба. Таким образом, большинству бизнес-аналитиков или разработчиков легко запрашивать куб и взаимодействовать с ним.

Поскольку витрина данных - это просто контейнер с кучей таблиц; пользователям необходимо сначала концептуализировать и понять размерные структуры, прежде чем запрашивать и анализировать данные.

Помнить:

Хранилище данных - это процесс получения данных из устаревших систем баз данных и баз данных транзакций и их преобразования в организованную информацию в удобном для пользователя формате, чтобы стимулировать анализ данных и поддерживать принятие бизнес-решений на основе фактов.

Хранилище данных - это система, которая извлекает, очищает, согласовывает и доставляет источник данных в размерное хранилище данных, а затем поддерживает и реализует опрос и анализ с целью принятия решения.

КИМБОЛ напр. последовательно определила витрину данных как ориентированное на процесс подмножество данных всей организации, основанное на элементарных данных, и это зависит только от физики событий измерения данных, а не от ожидаемых вопросов пользователя.

  • Витрины данных основаны на источнике данных, а не на представлении данных отделом.
  • Витрины данных содержат все элементарные детали, необходимые для поддержки детализации до самого нижнего уровня.
  • Витрины данных могут управляться централизованно или децентрализованно.

ПРАВИЛЬНОЕ ОПРЕДЕЛЕНИЕ

  • На основе процесса
  • Основание атомных данных
  • Измерение данных

НЕПРАВИЛЬНОЕ ОПРЕДЕЛЕНИЕ

  • На базе кафедры
  • Только агрегированные данные
  • На основе вопросов пользователя

Другие вопросы по теме