Я создал докер jupyter_lab, и обычно он работает нормально, но иногда зависает. Обычно я никогда не мог воспроизвести эту проблему, но теперь, видимо, ему совершенно не нравится этот файл (https://hgdownload.soe.ucsc.edu/goldenPath/mm39/bigZips/genes/refGene.gtf.gz). Используя R, как только я
gtf=read.table("refGene.gtf",header=TRUE,sep = "\t")
вроде все нормально грузится но если в другой ячейке звоню
print(gtf)
он просто застревает там. И самое странное, что он зависает, даже если вместо того, чтобы печатать переменную gtf, я прошу его напечатать любую другую вещь. Также, если я соберу в одной ячейке
gtf=read.table("refGene.gtf",header=TRUE,sep="\t") печать (гтф)
Он работает правильно, но тогда я больше не могу использовать другие ячейки. Если я запускаю /bin/bash в тот же открытый докер, в котором застрял jupyterlab, и я открываю R с помощью терминала и выполняю те же задачи, у меня нет никаких проблем, поэтому похоже, что это проблема Cell jupyter lab.
Я нашел проблему. @lckr/jupyterlab_variablespawn замедляет работу с большими данными. Просто удалите это, и все снова заработает.
Этот файл
gtf
особенно большой? Судя по тому, что вы описываете, это просто звучит как проблема с памятью. У Jupyter больше накладных расходов, и поэтому вы не видите его в своем терминале. Поскольку ваше сообщение не сводится к конкретному вопросу, его, вероятно, лучше всего разместить на дискуссионный форум Jupyter, так как этот сайт больше подходит для обсуждения и обмена идеями. Если вы в конечном итоге опубликуете там, обратите внимание на перекрестную публикацию в обоих местах, чтобы отвечающие не дублировали ответы и чтобы другие последующие действия могли последовать за ними позже.