недавно я настроил модель Mistral 7B Instruct v0.3 и развернул ее на конечной точке AWS Sagemaker. Но получил такие ошибки:
" Получена ошибка клиента (422) от первичного сервера с сообщением "{"error":"Ошибка проверки ввода: inputs токены + max_new_tokens должно быть <= 4096. Дано: 877 inputs токенов и 4096 max_new_tokens","error_type":"validation"} "."
Это означает, что я ограничен 4096 токенами. Но макс. токены должны быть следующими: Мистраль 7Б Инструкция v0.1 = 8192 Мистраль 7Б Инструкт v0.2,v0.3=32к
Я также разместил базовые модели Huggingface на конечных точках Sagemaker, и все они, похоже, ограничены 4096 токенами.
Кто-нибудь знает, как это исправить?





Хорошо, я понял это.
Сначала я протестировал все параметры модели и тонкой настройки со значением 4096, которых было довольно много, так как все кратно 512. Это ничего не дало, так что это был провал. Выяснив, что это в основном означает, что ошибка связана с контейнером развертывания, я, по крайней мере, получил подсказку. После долгого гугления это превратилось в джекпот :)
Итак, для тех, у кого похожие проблемы, вот как это сделать: Вместо использования функций развертывания, перечисленных на странице Huggingface модели Mistral-7B-Instruct, я использовал функции, как написано здесь: https://github.com/aws-samples/Mistral-7B-Instruct-fine-tune-and-deploy-on-SageMaker/blob/main/Deploy_Mistral_7B_on_Amazon_SageMaker_with_vLLM.ipynb
По сути:
Кроме того, я также нашел ссылку (https://github.com/awslabs/extending-the-context-length-of-open-source-llms/blob/main/MistralLite/sagemaker-tgi-custom/example_usage. ipynb), описывающий, как изменить среду Huggingface, что, вероятно, тоже помогает, но контейнер мне еще не удалось запустить. Но у меня есть одно решение, так что... хех~ ¯_(ツ)_/¯