Я пытаюсь использовать API Google Gemini, чтобы генерировать ответы для списка зданий в Нью-Йорке. Я структурировал подсказку так, чтобы она представляла собой список пунктов, касающихся информации о здании. При написании того же приглашения в браузере в Gemini я получаю точную информацию, но при написании приглашений для проверки в почтальоне ответы оказываются неточными. Я привел и объяснил свой пример ниже:
Адрес в ответе строился в 2001 году, а не в 1929 году
Проблема здесь в том, что здание было построено в 2001 году и завершено в 2003 году, а не в 1929 году. Другие попытки изменить дату указывают на другие годы, которые также относятся к началу 1900-х годов. Некоторая другая информация в ответе на изображение выше также неточна, но я предполагаю, что если я смогу заставить работать один из них, то они все будут работать.
Я играл с GenerationConfig, но безрезультатно. Что мне нужно сделать, чтобы получить практически такой же ответ, который я получал бы в браузере в качестве вывода вызова API, или что мне нужно изменить, чтобы получить точную информацию?

Что мне нужно сделать, чтобы получить почти такой же ответ, который я получил бы в браузере в качестве вывода вызова API?
Вы не можете. В настоящее время невозможно получить точно такой же ответ от AI studio в API.
Если вы пытаетесь получить тот же ответ от веб-приложения Gemini, то в большинстве случаев ответ будет совершенно другим. Приложение чата Gemini на сайте Gemini.google.com включает в себя множество моделей и наборов информации, некоторые из которых являются собственностью компании. У него нет API.
Помните, что это искусственный интеллект, а не база данных, ответ генерируется в реальном времени и может измениться. Он выбирает наиболее вероятный ответ, который может прийти во время запуска.
Ответ, генерируемый моделью LLM, основан на данных, на которых она была обучена. Важно отметить, что сеть и API Google Gemini могут иметь некоторые различия в микромодели в своих моделях под названием Gemini, что приводит к разным ответам. Даже если обе модели идентичны, они все равно могут давать разные ответы, поскольку данные генерируются в режиме реального времени.
Чтобы постоянно получать точные данные, я рекомендую построить конвейер RAG и использовать ответ LLM на основе ваших данных вместо данных модели Gemini. Однако он имеет свои ограничения и может реагировать не всегда. RAG по-прежнему не обеспечивает 100% точности модели.
Короче говоря, делайте любые изменения, чтобы получить точную информацию, но LLM пока не гарантирует предоставление 100% точных ответов.
Как сейчас написано, ваш ответ неясен. Пожалуйста, отредактируйте , чтобы добавить дополнительную информацию, которая поможет другим понять, как это относится к заданному вопросу. Более подробную информацию о том, как писать хорошие ответы, вы можете найти в справочном центре.
Не прикрепляйте изображения текста. Скопируйте и вставьте текст в свой вопрос. Я не думаю, что многие из нас будут вручную печатать ваше приглашение для проверки. Если ответ неправильный, укажите весь неправильный ответ и правильный ответ.