Я хотел преобразовать формат conllu для хинди в json, используя spacy convert, и он генерирует формат jsonl. Когда я передаю тот же файл .jsonl в spacy train, я получаю сообщение об ошибке. Если я передам файл json команде поезда, он работает. Разве вывод spacy convert не должен быть совместим с spacy train?
Сообщение об ошибке выглядит следующим образом:
Я использую : Спайси версия - 2.1.3 Питон 3.6.8 убунту 18.04
У меня была такая же проблема при выводе конверсий как формат jsonl по умолчанию. Исправлено путем преобразования с типом файла: атрибут json, например.
python -m spacy convert lang_train.conllu output-folder --file-type json