Я хочу использовать образ Docker с Apache Spark в Ubuntu 18.04.
Более популярный образ из хаба имеет Искра 1.6. Второй образ имеет более позднюю версию Искра 2.2
Образ не имеет установленного numpy. Базовые примеры для Spark Основное руководство MLlib требуют этого.
Я попытался запустить Dockerfile для безуспешной установки numpy, добавив это в исходный образ Dockerfile для Spark 2.2:
RUN apt-get install python-numpy python-scipy python-matplotlib ipython ipython-notebook python-pandas python-sympy python-nose
Как вы настраиваете контейнер для использования установки numpy ОС? Какова процедура? Это вообще правильное направление?
Редактировать: ОС Ubuntu 18.04
@atline в файле докеров не работает, т.е. RUN pip установить numpy .
В чем ошибка, когда вы говорите, что это не работает?
Полностью работает на моей стороне, см. ответ.
Докерфайл:
FROM p7hb/docker-spark
RUN apt-get update && apt install -y python-numpy
Команда сборки:
docker build -t my_image .
Запустить контейнер:
docker run -it --rm my_image /bin/bash
Проверьте число:
root@55ce4c59122c:~# python
Python 2.7.13 (default, Jan 19 2017, 14:48:08)
[GCC 6.3.0 20170118] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import numpy
>>> print(numpy.__version__)
1.12.1
пип установить numpy?