Ошибка конвейера Langchain/Huggingface о model_kwargs, которую я не включил

В настоящее время я пытаюсь использовать модели Helsinki-NLP/opus-mt-en-de и de-en. Я пытался настроить конвейер и использовать оба как LLMChain, но постоянно получаю ту же ошибку:

ValueError: The following `model_kwargs` are not used by the model: ['pipeline_kwargs', 'return_full_text'] (note: typos in the generate arguments will also show up in this list)

Я использовал следующий фрагмент для инициализации обеих моделей, а затем запустил его, чтобы проверить результат:

def get_translation_chains():
    _de_en_translation_prompt = PromptTemplate.from_template(
        """Translate the following text from German to English:
        {text}
        """
    )

    _en_de_translation_prompt = PromptTemplate.from_template(
        """Translate the following text from English to German:
        {text}
        """
    )

    _en_to_de_tokenizer = AutoTokenizer.from_pretrained("Helsinki-NLP/opus-mt-en-de")
    _en_to_de_model = AutoModelForSeq2SeqLM.from_pretrained("Helsinki-NLP/opus-mt-en-de")
    _de_to_en_tokenizer = AutoTokenizer.from_pretrained("Helsinki-NLP/opus-mt-de-en")
    _de_to_en_model = AutoModelForSeq2SeqLM.from_pretrained("Helsinki-NLP/opus-mt-de-en")

    _en_to_de_pipeline = pipeline(
        model=_en_to_de_model,
        tokenizer=_en_to_de_tokenizer,
        task = "translation",
    )

    _de_to_en_pipeline = pipeline(
        model=_de_to_en_model,
        tokenizer=_de_to_en_tokenizer,
        task = "translation",
    )

    _de_to_en_llm = HuggingFacePipeline(pipeline=_de_to_en_pipeline)
    _en_to_de_llm = HuggingFacePipeline(pipeline=_en_to_de_pipeline)

    _de_to_en_chain = LLMChain(
        prompt=_de_en_translation_prompt,
        llm=_de_to_en_llm,
    )

    _en_to_de_chain = LLMChain(
        prompt=_en_de_translation_prompt,
        llm=_en_to_de_llm,
    )

    return _en_to_de_chain, _de_to_en_chain

en_to_de_chain, de_to_en_pipeline = get_translation_chains()

print(en_to_de_chain.invoke({"text": "Hello, how are you?"}))

Я новичок в использовании LLM, а также библиотек Huggingface и Langchain и не смог найти ничего, что могло бы дать мне подсказку по этому вопросу.

Я пытался использовать конвейер, устанавливая только нужную мне задачу «translation_de_to_en» и наоборот, а также используя «перевод» только для конвейера по умолчанию и для более подробного конвейера. Я также пытался установить для параметра kwargs значения None и False, но безуспешно.

pipeline translation huggingface-transformers langchain large-language-model

13.03.2024 17:06

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

915

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Ваш код не содержит ошибок.

Причина ошибки в том, что начиная с версии 0.0.28 из langchain-community, только задачи

text2text-generation
text-generation
summarization

поддерживаются HuggingFacePipeline.

Ваша задача — translation, которая пока не поддерживается.

Что касается причины возникновения ошибки, Langchain передает аргумент return_full_text (см. это, строка 264) базовой модели HuggingFace. Однако MarianMTModel (модель, которую вы используете) не принимает это в качестве параметра.

Лучше использовать базовую модель HuggingFace напрямую. Это самое простое решение.

translation = _en_to_de_pipeline("Hello, how are you?")
print(translation)

Выход

[{'translation_text': "Hallo, wie geht's?"}]

Он возвращается без ошибок.

Начиная с этого коммита я также добавил поддержку перевода.

— 17.03.2024 05:05

14.03.2024 04:06

Другие вопросы по теме

Изменить HTML из woocomerce

Перевод Годо – как быть с более длинными строками на других языках?

Как вставить всего несколько слов в переведенные строки WooCommerce

Как заменить строку другой строкой во входных данных

Как улучшить португальскую версию Git, исправив переводы?

Перевод файлов на разные языки в Laravel

Candy translate для перевода данных, возвращаемых из controllers.py, в javascript?

Изменить язык Django по умолчанию

Автоматически добавлять пару ключ-значение в словарь

Вращение и перемещение 3D-точек на основе треугольника в Python

Ошибка конвейера Langchain/Huggingface о model_kwargs, которую я не включил

Ответы 1

Другие вопросы по теме

Похожие вопросы