RedDeveloper
Блог
Вопросы
Теги
Топ 20 вопросов про Bigdata
Коллекция из 20 самых популярных вопросов про
bigdata
с ответами и комментариями.
Топ 20
Топ 15
Топ 25
Топ 30
Топ 50
Топ 100
Все вопросы
Вопросы на собеседовании
1
Какие методы мы можем использовать для изменения формы ОЧЕНЬ больших наборов данных?
2
Обновите singleton HashMap с помощью Google pub / sub
3
Озеро данных и большие данные - это одно и то же?
4
Есть ли более быстрый способ, чем fread(), для чтения больших данных?
5
Как подключиться к HDFS с помощью spark?
6
Лучший способ проверить, зависают ли задания потоковой передачи Spark
7
Функция ограничения Spark DataFrame требует слишком много времени для отображения
8
Архитектура потоковой обработки
9
Pyspark: как дублировать строку n раз в фрейме данных?
10
Динамический раздел Spark 2.3 Не работает на S3 AWS EMR 5.13.0
11
Объединение большого и массивного фрейма данных Spark
12
Что лучше между несколькими маленькими файлами h5 или одним огромным?
13
Загрузите огромные данные из BigQuery в python/pandas/dask
14
Хранение глубокого дерева каталогов в базе данных
15
Развертывание кодовой базы Airflow
16
Предотвращение случайного выбора GROUP BY в Spark SQL
17
Что такое память драйвера и память исполнителя в искре?
18
Как отслеживать изменение данных JSON с течением времени для большого количества сущностей?
19
Oracle PGX on Yarn - 404 на WebService
20
Объединить панд в группу по объектам