Не могу установить Textract на windows

Я много чего пробовал, но все равно не могу установить пакет textract в Windows с помощью команды pip.

Я получаю следующую ошибку:

Не могу установить Textract на windows

Я понятия не имею, что делать, поэтому буду очень благодарен за любой совет. Спасибо

Похоже, что файл закодирован кодировкой, которую невозможно прочитать. Что происходит, когда вы пытаетесь найти и открыть README в редакторе?

an earwig 07.06.2018 16:27

@James_Parsons Я даже не могу найти этот файл

Sebastian Wdowiarz 07.06.2018 16:32

Местоположение файла python, который пытается его прочитать, находится в трассировке стека. Вы можете проверить этот файл на предмет контекста, который может привести к местоположению README

an earwig 07.06.2018 16:33

Привет, @SebastianWdowiarz, ты заставил его работать? Если да, выберите мой ответ или создайте новый ответ, если вы нашли другой способ.

Marcus Mann 21.01.2019 22:54
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
7
4
10 927
4

Ответы 4

Похищено с здесь:

Требуется сначала установить swig из conda (miniconda)

conda install swig

Затем загрузил zip-архив EbookLib 0.15 из релизов

https://github.com/aerkalov/ebooklib/releases

После распаковки я вручную удалил (я использовал блокнот ++) символ Unicode в файле README.md. (символ юникода находится в строке 44)

А затем установил модуль с помощью pip.

cd to_unzipped_folder_path_here
pip install .

И наконец

pip install textract

(Windows 10, Python 3.7) У меня было больше проблем, чем у других, но это основано на предыдущих ответах:

  1. Убедитесь, что установлен компилятор Microsoft Visual Studio C++ для Python.

  2. python -m pip install --upgrade pip setuptools wheel

  3. pip install six --upgrade

  4. Скачать EbookLib версии 0.15:

    • Разархивируйте файл .zip Чтобы избежать ошибок кодирования, измените присвоение переменной long_description на long_description = open ('README.md', encoding = "utf-8"). read (), "
  5. Скачать Swig:

    • http://www.swig.org/download.html
    • Разархивируйте файл .zip
    • Скопируйте файл swig.exe в путь Python: например, "C: \ Users \ имя пользователя \ AppData \ Local \ Programs \ Python \ Python37"
    • Скопируйте папку "typemaps" в папку "Lib" Python: например, "C: \ Program Files \ swigwin-4.0.0 \ Lib \ typemaps" -> "C: \ Users \ имя пользователя \ AppData \ Local \ Programs \ Python \ Python37 \ Lib \"
    • Скопируйте файлы "* .swg" в папку "Lib" Python: например, "C: \ Program Files \ swigwin-4.0.0 \ Lib * .swg" -> "C: \ Users \ имя пользователя \ AppData \ Local \ Programs \ Python \ Python37 \ Lib \"
    • Скопируйте все файлы python swig в папку "Lib" python: например, "C: \ Program Files \ swigwin-4.0.0 \ Lib \ python *" -> "C: \ Users \ имя пользователя \ AppData \ Local \ Programs \ Python \ Python37 \ Lib \"
  6. cd в распакованную папку Ebooklib из командной строки: например, C:> cd "C: \ Users \ имя пользователя \ Desktop \ ebooklib-0.15"

  7. запустите установку для EbookLib: pip install.

  8. запустите установку textract: pip install textract

Результат должен быть:

C:\Users\username\Desktop\ebooklib-0.15>pip install textract
Collecting textract
Requirement already satisfied: docx2txt==0.6 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (0.6)
Requirement already satisfied: beautifulsoup4==4.5.3 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (4.5.3)
Requirement already satisfied: EbookLib==0.15 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (0.15)
Requirement already satisfied: xlrd==1.0.0 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (1.0.0)
Requirement already satisfied: SpeechRecognition==3.6.3 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (3.6.3)
Requirement already satisfied: six==1.10.0 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (1.10.0)
Collecting pocketsphinx==0.1.3 (from textract)
  Using cached https://files.pythonhosted.org/packages/93/5f/a968e5d53d25e32deb78c3e169fd8612ecf53cc76e32cb40e19be35696af/pocketsphinx-0.1.3.tar.bz2
Requirement already satisfied: chardet==2.3.0 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (2.3.0)
Requirement already satisfied: argcomplete==1.8.2 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (1.8.2)
Requirement already satisfied: python-pptx==0.6.5 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (0.6.5)
Requirement already satisfied: lxml in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from EbookLib==0.15->textract) (4.3.3)
Requirement already satisfied: XlsxWriter>=0.5.7 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from python-pptx==0.6.5->textract) (1.1.8)
Requirement already satisfied: Pillow>=2.6.1 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from python-pptx==0.6.5->textract) (6.0.0)
Building wheels for collected packages: pocketsphinx
  Building wheel for pocketsphinx (setup.py) ... done
  Stored in directory: C:\Users\username\AppData\Local\pip\Cache\wheels\38\80\4f\ddc3e8c2b788f2c7f1d625ae870f6bafd3038ff04a3445a2f8
Successfully built pocketsphinx
Installing collected packages: pocketsphinx, textract
Successfully installed pocketsphinx-0.1.3 textract-1.6.1

C:\Users\username\Desktop\ebooklib-0.15>

На момент написания этой статьи jsonschema будет иметь конфликтующие зависимости с textract. Следующие ошибки также возникли, когда я пытался выяснить правильную установку:

ERROR: requests 2.22.0 has requirement chardet<3.1.0,>=3.0.2, but you'll have chardet 2.3.0 which is incompatible.
ERROR: camelot-py 0.7.2 has requirement chardet>=3.0.4, but you'll have chardet 2.3.0 which is incompatible.

ERROR: Command "python setup.py egg_info" failed with error code 1 in C:\Users\username\AppData\Local\Temp\pip-install-msmb9od3\EbookLib\
    UnicodeDecodeError: 'charmap' codec can't decode byte 0x8d in position 1671: character maps to <undefined>
error: command 'C:\\Users\\username\\AppData\\Local\\Programs\\Python\\Python37\\swig.exe' failed with exit status 1

ERROR: Failed building wheel for pocketsphinx
error: command 'swig.exe' failed: No such file or directory
  (1) : Error: Unable to find 'swig.swg'
  (3) : Error: Unable to find 'python.swg'

Решение намного проще теперь, когда проект, похоже, был передан другому человеку (недавно начал обновлять проект снова, 3 месяца назад, когда я написал этот ответ).

Теперь вы можете перейти к https://github.com/deanmalmgren/textract/releases и загрузить v1.6.2, который предоставляет только обновления требований по сравнению с v1.6.1 (исправление ошибки отладки Unicode) или v1.6.3, который является последним (на момент написания).

После загрузки распакуйте cd [folder extracted to] и pip install .

Просто имейте в виду, что всегда существует опасение, что по мере обновления требований вредоносный код может быть вставлен в зависимости и обновлять его на свой страх и риск.

Не самое элегантное решение, но оно работает!

pip install git+https://github.com/jpweytjens/textract

Спасибо jpweytjens

Самый лучший ^ _ ^ большое спасибо.

Sidou Mahmoud 02.02.2021 17:38

Другие вопросы по теме