RedDeveloper
Блог
Вопросы
Теги
Топ 100 вопросов про Data Warehouse
Коллекция из 100 самых популярных вопросов про
data-warehouse
с ответами и комментариями.
Топ 100
Топ 15
Топ 20
Топ 25
Топ 30
Топ 50
Все вопросы
Вопросы на собеседовании
1
Дизайн звездообразной схемы
2
20 миллиардов строк в месяц - Hbase / Hive / Greenplum / What?
3
Концепции Apache Spark + Delta Lake
4
Datamart и Report Cube, в чем различия?
5
Есть ли фреймворки для хранилищ данных?
6
Экстраполировать ежедневные исторические значения из таблицы, которая записывает только изменение значения (Postgresql 9.3)
7
Где я могу скачать образец базы данных, который можно использовать как хранилище данных?
8
Можете ли вы порекомендовать хороший источник лучших практик Teradata?
9
Внутренняя ошибка SSAS: произошла непредвиденная ошибка (файл pfcre.cpp, функция PFCREngine::SelectCartridge)
10
SQL заменить все таблицы кластеризованным индексом Columnstore
11
Каковы плюсы и минусы загрузки данных непосредственно в Google BigQuery по сравнению с первым прохождением через облачное хранилище?
12
Эффективность Redshift плоских таблиц по сравнению с размерами и фактами
13
Является ли таблица фактов в размерной модели таблицей событий?
14
Должен ли первичный ключ в таблице измерений быть частью первичного ключа в таблице фактов?
15
Дизайн звездной схемы для социальных сетей
16
Эффективный запрос для получения длительности шага из таблицы журналов событий в sql в накопленный моментальный снимок
17
Как исправить ошибку OLE DB в SQL Server Data Tools
18
Выяснение размеров для DW
19
Многомерное моделирование в столбчатых базах данных
20
В чем разница между фактами без фактов и таблицей фактов?
21
Как извлечь данные с помощью хранимой процедуры ETL с помощью SQL Server
22
Отказано в разрешении на выбор таблицы в хранимой процедуре - SQL Server
23
Может ли SSIS импортировать записи TXT в том же порядке, что и в файле TXT? Если нет (по умолчанию), то как?
24
Подход к модели хранилища данных
25
Схема хранилища данных: можно ли напрямую связывать таблицы фактов в DWH?
26
Лучший способ загрузить данные в хранилище данных
27
Зависание / истечение времени ожидания конвейера фабрики данных Azure
28
Удаление строк из места назначения, которые были удалены из исходного SSIS с помощью условного разделения
29
Преобразование данных на основе событий Kafka в реляционные звездообразные схемы с помощью Spark или Flink
30
Есть ли необходимость в хранилище данных при использовании Azure Data Lake?
31
Рекомендация для крупномасштабной системы хранения данных
32
Объединить факты из разных источников? Или загружать отдельно?
33
Типичное хранилище данных со звездообразной схемой Кимбалла - Возможны ли модельные представления? и как создать код
34
Таблица Q: вычисление среднего из повторяющихся строк
35
Является ли таблица, связывающая измерение с таблицей фактов, измерением факта?
36
Как работать с таблицей Bridge в схеме Star
37
Когда использовать пользовательские функции в хранилище данных SQL Server
38
Слияние, удаление, когда не на исходном коде
39
Потоковая передача данных из SQL Server в хранилище данных Azure
40
Лучше иметь суррогатный ключ или nk + effective_time в таблицах измерений в apache hive
41
Как суррогатные ключи являются дескрипторами в улье
42
Как обеспечить показатели YTD, 12M и Annualized в хранилище данных SQL Server?
43
Как соединить две таблицы фактов?
44
Коннектор Snowflake python не работает с большим набором данных в AWS Lambda
45
Как автоматизировать развертывание и запуск задания ETL?
46
Airflow сохраняет то же соединение с базой данных?
47
Не удалось установить SSDT для Visual Studio 2017 Professional
48
Хранилище данных - часы работы
49
Как обрабатывать несколько записей измерений с одинаковым именем, даже если они имеют уникальный ключ/отношение с таблицей фактов (1:M)?
50
Каков наиболее эффективный способ создания набора данных изменений с учетом двух файлов резервных копий SQL Server?
51
Схема звезды (созвездия) Power BI: 2 таблицы фактов, связанные друг с другом
52
Представление последовательных правил в интеллектуальном анализе данных (интеллектуальный анализ шаблонов последовательностей)
53
Обходной путь для превышения лимита oreplace в Teradata
54
Bigquery: частые обновления записи
55
Как изменить способ расширения и сжатия?
56
Группировка запроса в Redshift занимает огромное количество времени
57
Реализация темпоральных таблиц для измерений для отслеживания изменений
58
Как объединить факты из двух разных баз данных в таблицу фактов в хранилище данных?
59
Как глубоко заходить при денормализации
60
Условное выражение «Где»
61
Связывание валюты и измерения сущности
62
Таблица фактов о конструкции
63
Какой должна быть моя стратегия разделения улья и стратегия просмотра, чтобы запрос мог эффективно выполняться и возвращать результаты в течение 10 секунд?
64
В чем разница между единым хранилищем данных и единой моделью данных?
65
Хранилище данных SQL Azure — максимальное количество одновременных запросов
66
Таблица фактов с неизмеренными данными
67
Создание озера данных с нуля
68
Apache kylin и PostgreSQL
69
Как вычислить, используя один и тот же столбец
70
Многоязычное моделирование хранилища данных
71
Служба анализа SQL Server передает нулевые и пустые значения в атрибуте строки измерения
72
Запрос к хранилищу данных на основе переменной даты
73
Наборы исторических данных в начальной сборке
74
Перенести данные базы данных SQL Server в SAP BW
75
Дизайн моделирования данных
76
Создание Datamart с информацией GitHub
77
Используете подмножество таблицы фактов для другой таблицы фактов?
78
Может ли хранилище данных включать озеро данных?
79
В чем сложность оператора CUBE в SQL?
80
MySQL Рассчитайте процентное изменение продаж между годами на основе SUM и GROUP BY
81
Что такое хранилище данных и можно ли его применить к сложным данным?
82
Альтернативы SSIS для ETL в фабрике данных Azure
83
Объединение реляционных таблиц в единую плоскую таблицу
84
О суррогатном ключе в процессе загрузки в хранилище данных
85
Случай, когда оператор SQL
86
Суррогатные ключи с использованием Apache Spark
87
Размерное моделирование: как создать таблицу без суррогатных первичных ключей?
88
Как работать с "один ко многим" в звездообразной схеме?
89
Можно ли считать BigQuery хранилищем данных общего назначения?
90
Хранилище данных - управление версиями данных
91
Postgres - принудительное использование значений NULL в числовых столбцах с помощью \ COPY
92
Табличные показатели SSAS: нужно ли в DAX выражать поэтапные факты из DW в качестве показателей для использования в качестве показателей?
93
Извлечение и загрузка данных из нескольких источников SSIS
94
FactLoanVolume - одна или несколько таблиц фактов
95
Архитектура / моделирование с несколькими датами в облачном хранилище данных Snowflake
96
Использование первичного ключа в DWH / Dimensional Model помимо функций поиска
97
Схема DataFrame метода pandas to_gbq не соответствует таблице
98
Какая альтернатива типу данных извлечения красного смещения
99
Я получаю исключение: «Формальный параметр« @ param1 »не был объявлен как параметр OUTPUT, но фактический параметр передан в запрошенном выводе»
100
От таблицы измерения даты к иерархии