RedDeveloper
Блог
Вопросы
Теги
Топ 50 вопросов про Amazon Emr
Коллекция из 50 самых популярных вопросов про
amazon-emr
с ответами и комментариями.
Топ 50
Топ 15
Топ 20
Топ 25
Топ 30
Топ 100
Все вопросы
Вопросы на собеседовании
1
Ошибка pyspark не существует в ошибке jvm при инициализации SparkContext
2
Ограничения параллелизма AWS Athena: количество отправленных запросов VS количество запущенных запросов
3
Блокноты EMR устанавливают дополнительные библиотеки
4
Сохранение фрейма данных в локальной файловой системе приводит к пустым результатам
5
Не удается получить SparkContext в новом кластере AWS EMR
6
Как установить livy.server.session.timeout на ускорение кластера EMR?
7
Структурированная потоковая передача не будет записывать DF в приемник файлов, поскольку /_spark_metadata/9.compact не существует
8
Python pip install pyarrow error, невозможно выполнить cmake
9
Amazon emr jupyterhub и искровой кластер; в записной книжке нет автозаполнения
10
AWS EMR: параметр синтаксического анализа ошибки: ожидается: '=', получено: 'EOF' для ввода:
11
Как создать прокси-сервер для просмотра задания в пользовательском интерфейсе AWS Glue Spark?
12
Как автоматически завершить работу кластера AWS EMR через некоторое время
13
EMR conf настройки искры по умолчанию
14
В чем разница между EMR_EC2_DefaultRole и EMR_DefaultRole?
15
Проблема с каталогом данных AWS Glue в качестве хранилища метастазов для Spark SQL в EMR
16
Потоковая передача Amazon EMR и Spark
17
Как запустить 2 EMR Spark Step одновременно?
18
Могут ли задачи также выполняться на главном узле при запуске задания Spark в режиме кластера в EMR?
19
Учетные данные для доступа к EMR Jupyter Notebook
20
Чтение сжатого Zstandard файла в Spark 2.3.0
21
Динамический раздел Spark 2.3 Не работает на S3 AWS EMR 5.13.0
22
Aws: кластер EMR дает сбой «ОШИБКА UserData: ошибка при попытке получить данные пользователя» при отправке задания Spark
23
Отправка скрипта pyspark на удаленный сервер Spark?
24
Как отправить задания Spark в кластер EMR из Airflow?
25
AWS EMR 5.20 и поддержка версии Java
26
Плюсы и минусы Amazon SageMaker VS. Amazon EMR для развертывания моделей глубокого обучения на основе TensorFlow?
27
Aws - Как добавить несколько коннекторов postgresql в EMR через файл конфигурации
28
Как я могу использовать графические кадры с pyspark в AWS EMR?
29
Как получить доступ к общедоступной корзине S3 из другой учетной записи AWS?
30
Spark Streaming Kinesis на EMR выдает ошибку «Ошибка при сохранении блока в Spark»
31
Как перенастроить spark / hadoop для чтения файлов, начинающихся с "_" (подчеркивание)?
32
Каков правильный синтаксис для запуска сценария bash в качестве шага в EMR?
33
Python Connect to Hive на EMR
34
Как одновременно запускать задания Spark в одном кластере AWS EMR?
35
Странные ошибки импорта Python
36
От Google Cloud Bigtable до AWS EMR (HBase)
37
Время сеанса записной книжки EMR истекает в течение нескольких секунд (с использованием pyspark) на большом фрейме данных (pyspark)
38
Как читать большие zip-файлы в pyspark
39
Укажите минимальное количество сгенерированных файлов из вставки Hive
40
EMR 5.21, Spark 2.4 — зависимость Json4s нарушена
41
Как отслеживать Apache Flink в AWS EMR (ElasticMapReduce)?
42
Искра не удалась - время ожидания фьючерсов истекло
43
Поведение автоматического масштабирования EMR с несколькими правилами масштабирования на узлах задач
44
Как запустить задание Spark в EMR через Cloudformation
45
Org.apache.flink.client.program.ProgramInvocationException: не удалось получить результат выполнения
46
Пользовательское разделение Kinesis на S3
47
Попытка установить pandas для Pyspark, работающего на Amazon EMR
48
Не удалось открыть SSH-туннель к главному узлу EMR
49
Задание пакетной обработки (Spark) с таблицей поиска, которая слишком велика для размещения в памяти
50
Как убить контейнер YARN для проверки сценариев сбоя