Я работаю над поиском Azure AI и Azure OpenAI. Я создал службу поиска Azure AI под названием cent****service1. После этого я создал набор навыков под названием «Навык разделения текста». После этого я создал индекс azureblob-index1 с хранилищем BLOB-объектов Azure, где есть контейнер с именем rg, в котором хранятся все важные документы. Теперь, когда я создал игровой процесс чата с помощью службы поиска и индекса Azure AI, тогда, когда я задаю вопросы, он дает ответ типа:
Напишите небольшой параграф об исследованиях и разработках Centelon? ответ, который я получил: Усилия Ce***** в области исследований и разработок (НИОКР) сосредоточены на стимулировании инноваций и сотрудничестве, при этом особое внимание уделяется использованию новейших технологий и передового опыта. Компания получила признание за свою работу в области искусственного интеллекта для фармацевтической промышленности, включая получение налоговых льгот на НИОКР. Кроме того, cen**** продемонстрировал свою приверженность инновациям, разработав робота-гуманоида для больниц и внедрив решения на основе больших языковых моделей для таких задач, как генерация кода, создание тестовых данных и запрос документов. Эти достижения подчеркивают ****** стремление расширять границы технологий и способствовать значительным достижениям в различных областях 1 .
Ссылки: Цитирование1
Эта цитата при нажатии отображает справочный документ.
Как обсуждалось, если существует, скажем, 100 документов, поэтому, если я хочу увидеть название документа вместе со ссылкой на документ, возможно ли это?
Если это возможно, пожалуйста, дайте мне знать.
Поля, которые я использовал в своем индексе:
content (String)
metadata_storage_content_type (String)
metadata_storage_size (Int64)
metadata_storage_last_modified (DateTimeOffset)
metadata_storage_path (String)
metadata_author (String)
metadata_title (String)
metadata_creation_date (DateTimeOffset)
language (String)
split_text (StringCollection)
keywords (String)
summary (String)
section_titles (String)
metadata_file_type (String)
merged_content (String)
text (StringCollection)
layoutText (StringCollection)
metadata_storage_file_extension (String)
metadata_content_type (String)
metadata_language (String)
Все работает, кроме имени документа, как я могу отобразить его в веб-приложении, чтобы пользователю было легко ориентироваться в том, что данный вопрос и ответ принадлежат этому конкретному документу.
По умолчанию имя файла будет автоматически сопоставлено с результатами цитирования, если у вас есть правильное имя поля, например имя файла.
При интеграции с Azure Open AI следующие поля должны быть сопоставлены.
данные контента
имя файла
заголовок
URL-адрес
Если вы не получаете сопоставления, как показано на изображении ниже.
Затем вернитесь в раздел «Источник данных» и сопоставьте детали с вашим индексным полем.
После установки флажка нажмите «Далее», чтобы сопоставить поля.
Данные контента: выберите поля, которые использовались для поиска по вашему запросу (content
).
Имя файла: выберите поле, содержащее имя файла, если оно отсутствует, перестройте индекс с помощью поля имени файла. (metadata_storage_name
или metadata_storage_path
)
Заголовок: выберите поле заголовка (metadata_title
).
URL: выберите поле пути к хранилищу (metadata_storage_path
).
Далее сохраните источник данных и задайте поисковый запрос.
Выход:
У меня есть вопрос, на который всякий раз, когда я задаю вопрос, иногда он не может ответить. Там написано, что я могу ответить на этот вопрос. Но снова, примерно через 15-30 секунд, если я снова задаю тот же вопрос, он дает ответ. Знаете ли вы, в чем может быть проблема?
Вы столкнулись с этой проблемой для определенного типа запроса или для всего вашего запроса?
Я столкнулся с этой проблемой только для нескольких запросов. Скажем, если я задам вопрос типа «Как компания использует большие языковые модели?» или если я спрошу, как компания использует LLM? Итак, иногда он дает ответ на оба запроса за один раз, но иногда не дает ответов. Если я спрошу еще раз через 15-20 секунд, то ответ будет правильный.
Пробовали ли вы сохранить фактическое имя файла в поле
filepath
при создании индекса?