У нас все еще нет возможности получить доступ к папкам с Google Диска на Kaggle?

У меня относительно огромный набор данных (около 5 ГБ) изображений, хранящихся на диске Google в папке. Я хотел немного обработать и применить к набору данных алгоритмы глубокого обучения. Чтобы это было возможно, у меня должен быть набор данных в среде Kaggle. Я поискал в Интернете и понял, что выхода нет, или, по крайней мере, это то, что мне пока удалось собрать.

В этом ответе используется библиотека gdown, но, вероятно, Google Drive отказывает в доступе из-за проблем с файлами cookie. Я попытался подключить файлы cookie к среде Kaggle. Но это было бесполезно.

Возможно, мне придется написать еще какие-то скрипты для загрузки самих данных. Возможно, сначала поможет сохранение ссылок на отдельные файлы в папке на диске Google, а затем просмотр ссылок в среде Kaggle. Но мне было лениво.

Я хотел знать, можно ли как-то это сделать?

На самом деле, ваш лучший вариант по-прежнему конвертировать данные в один (или несколько) сжатых файлов с помощью colab, а затем использовать gdown, чтобы разместить их в ядре Kaggle.

PaoloJ42 19.03.2024 12:29

@PaoloJ42 PaoloJ42 задолго до этого я попробовал это, сначала установив папку на свой локальный компьютер, а затем загрузив заархивированную папку для Kaggle через загрузку. но и это пошло не очень хорошо.

harshmangalamv 19.03.2024 12:48

@PaoloJ42 да, я наконец нашел решение. Ваш сработал. Наверное, раньше я делал это неправильно. Спасибо

harshmangalamv 20.03.2024 15:13
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
0
3
160
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Хотя лучшего способа я не нашел. Но вот что сработало для меня, как мне посоветовал @PaoloJ42:

  1. Загрузите набор данных с диска Google. (Он уже будет в заархивированном виде)

  2. Вместо загрузки заархивированной папки в параметр «Загрузить данные» в среде Kaggle лучше создать собственный набор данных в Kaggle. Используйте Набор данных > Новый набор данных. Вы можете сделать его приватным.

  3. После загрузки заархивированная папка автоматически разархивируется. Вы можете воспользоваться ссылкой. Просто добавьте следующий фрагмент:

    import os
    os.environ['KAGGLE_USERNAME'] = 'username'
    os.environ['KAGGLE_KEY'] = 'kaggle_key'
    

Вы можете получить вышеизложенное в «Настройки» > «Создать новый токен» (в разделе API).

Таким образом, вам не придется время от времени загружать файлы.

Другие вопросы по теме