ConversationalRetrivalChain вызывает ошибку KeyError

Я реализую RAG на модели Gemma-2B-it, используя HuggingFaceEmbeddings и ConversationalRetrievalChain от langchain.

При запуске:

chat_history = []
question = "My prompt"
result = qa.invoke({"question": question, "chat_history": chat_history})

я получил

    276 
    277                 if self.pipeline.task == "text-generation":
--> 278                     text = response["generated_text"]
    279                 elif self.pipeline.task == "text2text-generation":
    280                     text = response["generated_text"]

KeyError: 'generated_text'

Я не понимаю, почему это происходит. Раньше работало, а сегодня просто перестало работать. Я также пробовал использовать qa.run вместо invoke , но это все равно вызывает то же исключение.

Я пробовал менять модели, устройства, но ничего не помогает.

@AhmetBirim Я нет

— 25.03.2024 19:57

python huggingface-transformers langchain large-language-model

21.03.2024 11:41

Почему в Python есть оператор "pass"?

Почему в Python есть оператор "pass"?

Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.

Некоторые методы, о которых вы не знали, что они существуют в Python

Некоторые методы, о которых вы не знали, что они существуют в Python

Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...

Основы Python Часть I

Основы Python Часть I

Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:

Оптимизация кода с помощью тернарного оператора Python

Оптимизация кода с помощью тернарного оператора Python

И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это

Советы по эффективной веб-разработке с помощью Python

Советы по эффективной веб-разработке с помощью Python

Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.

1

1

199

1

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Если вы используете transformers.pipeline, убедитесь, что этот параметр return_tensors='pt' не передан.

25.03.2024 20:45

Другие вопросы по теме

Ошибка при загрузке модели из HuggingFace

Ошибка конвейера Langchain/Huggingface о model_kwargs, которую я не включил

Алгоритм ML для определения того, является ли предложение вопросом

Huggingface Seq2seqTrainer зависает при оценке

Как разобраться в выводе модели вознаграждения, как узнать, какую строку она предпочитает?

Токенизатор Huggingface имеет два идентификатора для одного и того же токена

Как устранить ValueError: вам следует указать кодировку или список кодировок для этого метода, который включает input_ids, но вы указали ['label']

Проверьте разницу в предварительно обученной и точно настроенной модели

Вопрос о data_collator, выдающем ключевую ошибку в Hugging face

Целевые модули для применения PEFT/LoRA на разных моделях

Похожие вопросы

Соединение Apache Airflow и Oracle

Немедленно выдать sqlalchemy.exc.OperationalError: (pymysql.err.OperationalError) (2013, «Потеряно соединение с сервером MySQL во время запроса»)

Python с подпроцессом Javascript

Как мне заставить «нулевые» шипы matplotlib обрезаться за пределами оси?

Python в VSCode — ошибка PIP (cmd не найден)

Построение графика и решение трех связанных ОДУ в Python

Python: создание Zip-файла из объектов Minio приводит к дублированию записей для каждого файла

Как установить Pyregion под Python 3.9.6 и MacOS Sonoma 14.3.1

Макет графической визуализации Python NetworkX — RuntimeWarning о зависимостях gvplugin_pango.dll

Firebase, Active Directory. Будут ли пользователи AD создаваться и в Firebase?