МОСС 2007 Ползание

Я пытаюсь заставить сканирование работать на двух отдельных фермах, которые у меня есть, но не могу заставить его работать ни на одной из них. У них обоих есть два WFE с дополнительным WFE, настроенным как сервер индекса. Есть еще один сервер, выделенный для запросов, и два кластерных внутренних сервера SQL 2005 для базы данных. Я безуспешно пробовал по крайней мере 50 различных веб-сайтов, которые я нашел с помощью решений из поисковой системы. Я настроил (расширил) свое веб-приложение для использования http: // servername: 12345 в качестве зоны по умолчанию и http://abc.companyname.com в качестве настраиваемой зоны и зоны интрасети. Когда я ввожу каждый из них в источник контента, а затем пытаюсь запустить сканирование, я получаю пару ошибок в журнале сканирования:

http: // имя сервера: 12345 возвращает:
«Не удалось подключиться к серверу. Убедитесь, что сайт доступен».

http://abc.companyname.com возвращает:
«Удалено сборщиком. (Начальный адрес или источник контента, который содержал этот элемент, был удален, и, следовательно, этот элемент был удален.)»

Однако я могу щелкнуть оба URL-адреса, и страница станет доступной.

Есть идеи?

Больше информации:

Я, так сказать, вытер сланец и запустил еще одно сканирование, чтобы получить обновленный образец.

Мои источники контента таковы:

http: // имя сервера: 33333
http://sharepoint.portal.fake.com
sps3: // имя сервера: 33333

Мои текущие ошибки журнала сканирования:

sps3: // имя сервера: 33333
Ошибка в веб-службе PortalCrawl.

http: // servername: 33333 / mysites
Контент для этого URL-адреса исключен сервером из-за атрибута без индекса.

http: // servername: 33333 / mysites
Проскочил

sts3: // имя сервера: 33333 / contentdbid = {62a647a ...
Проскочил

sts3: // имя сервера: 33333
Проскочил

http: // имя сервера: 33333
Проскочил

http://sharepoint.portal.fake.com
Сканер не смог связаться с сервером. Убедитесь, что сервер доступен и что доступ к брандмауэру настроен правильно.

Я дважды проверил опечатки выше и не нашел их, так что это должно быть точное отражение.

sharepoint search

19.09.2008 15:25

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

16 680

Перейти к ответу Данный вопрос помечен как решенный

Ответы 6

В разделе «Службы на сервере» проверьте свойства учетной записи обхода при поиске, чтобы убедиться, что она настроена и имеет разрешения на доступ к этим сайтам.

22.09.2008 07:59

Меня немного смущает топология вашей фермы. Машина, установленная как WFE, не может быть индексатором. Машина, установленная как "полная", может быть индексатором, запросом и / или wfe ...

Кроме того, вместо изменения учетной записи доступа к контенту по умолчанию вы можете вместо этого добавить правило обхода (когда все будет запущено и запущено)

Можете ли вы увидеть, есть ли что-нибудь полезное в% commonprogramfiles% / microsoft shared / web server extensions / 12 / logs на вашем индексаторе?

Файл журнала может быть немного подробным, вы можете выполнить поиск по словам «запущен» или «полный», и это обычно приведет вас к строке в журнале, где началось сканирование.

Кроме того, на вашем компьютере с sql вы можете получить дополнительную информацию из таблицы MSScrawlurlhistory.

02.10.2008 22:43

Можете ли вы создать источник контента для http://www.cnn.com и начать полное сканирование? Вы получаете такую же ошибку (и)?

Кроме того, мы можем сделать это в автономном режиме, дайте мне знать, если вы хотите это сделать.

Я не уверен, есть ли способ отправлять личные сообщения через stackoverflow.

03.10.2008 21:54

Ответ принят как подходящий

Следует помнить, что сканирование сайтов SharePoint отличается от сканирования общих файловых ресурсов или веб-сайтов, не относящихся к SharePoint.

Еще несколько полезных советов:

протокол sps3: предназначен для сканирования профилей пользователей для поиска людей. Вы можете игнорировать все, что об этом говорит поисковый робот, пока не будете готовы к работе с профилями пользователей.
ваша учетная запись сканирования должна иметь доступ ко всей вашей ферме. Если вы видите ошибки разрешений, найдите статью базы знаний, в которой рассказывается, как сбросить учетную запись сканирования (это специальная команда stsadm.exe). Если вы пытаетесь сканировать контент другой фермы, вам придется придумать что-то еще, чтобы предоставить доступ к вашей учетной записи сканирования. Я думаю, что это ваша самая большая проблема на данный момент.
Сканер (запущенный с сервера индексирования) попытается посетить общедоступный URL. Раньше у меня были проблемы с коммуникацией между серверами; убедитесь, что все три сервера могут пинговать друг друга, и убедитесь, что сервер индексирования может получить доступ к общедоступному URL-адресу (откройте IE на сервере индексирования и проверьте его). Если у вас возникли проблемы, пора испачкать файл hosts на вашем сервере индексирования. В любом случае это то, что SharePoint делает за вас, так что не расстраивайтесь, делая это. Если вы настроили что-либо, кроме встроенной проверки подлинности Windows, вам придется потрудиться, чтобы ваш сканер заработал.

Как бы то ни было, в ответах было много споров, так что я просто выстреливаю кучу предложений, может быть, одно из них попадает в цель.

06.10.2008 17:05

Спасибо за новый вклад!

Итак, я вернулся с выходных и хотел просмотреть ваши указатели и попробовать все, а затем сообщить о том, как они не работают, а затем опубликовать полученные результаты. Однако случилось забавное.

Я зашел в свой индексатор (servername5) и попытался подключиться к Central Admin и главному порталу из Internet Explorer. Ни то, ни другое не сработало. Итак, я вошел в IIS через Indexer, чтобы попытаться перейти на главный портал из IIS. Это тоже не сработало, и я получил сообщение об ошибке, сообщающее мне, что что-то другое использует этот порт. Итак, я увидел свой старый веб-сайт из предыдущей сборки и удалил его из IIS вместе с соответствующим пулом приложений. Затем я запустил пул приложений для веб-сайта из новой сборки и перешел на веб-сайт. Успех. Затем я перешел на веб-сайт из браузера на своем ПК. И снова успех. Затем я запустил сканирование по полному URL-адресу, а не по имени сервера, например:

http://sharepoint.portal.fake.com

И снова успех. Он просканировал весь портал, включая подсайты, как я и хотел. «Элементы в индексе» заполнялись быстро, и я мог сказать, что катился.

Я по-прежнему не могу получить доступ к сайту Central Admin, размещенному на servername4, с servername5. Я не уверен, почему бы и нет, но не знаю, насколько это важно в данный момент.

Что это меня оставит? Какое было исправление?

Я все еще не уверен. Может, это была перестройка. Возможно, как только я перестроил ферму серверов, у меня было все необходимое, чтобы заставить ее работать, но это просто не сработало, потому что предыдущий веб-сайт все еще был в IIS. (Забавно, насколько небрежной может быть деинсталляция SharePoint. Ручное удаление баз данных контента, веб-сайтов и пулов приложений кажется необходимым, а этого, вероятно, быть не должно.)

В любом случае, сейчас он работает на моей «тестовой» ферме, поэтому главное - заставить его работать на производственной ферме. Надеюсь, после этого опыта это не будет так сложно.

Спасибо всем за помощь!

08.10.2008 11:48

Похоже, большинство ваших проблем связано с Kerberos. Если у вас не применено обновление инфраструктуры, Sharepoint не сможет использовать аутентификацию Kerberos для веб-сайтов с портами, отличными от портов по умолчанию (80/443). Вот почему (я готов поспорить), что вы не можете получить доступ к CA с сервера 5, когда он находится на сервере 4. Если у вас неправильно настроены SPN, тогда CA будет доступен только с машины, на которой он установлен. Если бы вы установили Sharepoint с использованием порта 80 в качестве URL-адреса по умолчанию, вы могли бы выполнять сканирование локальной точки доступа без каких-либо проблем. Но по замыслу обход локальных сайтов sharepoint использует URL-адрес по умолчанию для доступа к сайтам sharepoint. Ознакомьтесь с http://codefrob.spaces.live.com/blog/cns!7C69E7B2271B08F6!363.entry, чтобы получить более подробную информацию о том, как заставить Kerberos и Sharepoint хорошо работать вместе.

19.01.2009 19:35

Другие вопросы по теме

Как сделать так, чтобы Vim не выделял то, что вы искали?

Упорядочивайте результаты поиска SharePoint по большему количеству столбцов

API облегченного поискового индексирования / Lbrary

Настройка отображения результатов поиска в Sharepoint Services 3.0 Wiki

Поиск текста SQL и заказ

Какой лучший вариант для поиска в Ruby on Rails?

Как в Applescript попасть в поле поиска в меню «Справка», например в «В центре внимания»?

Окно поиска в стиле Plone в Django?

Какие существуют поисковые серверы?

МОСС 2007 Ползание

Ответы 6

Другие вопросы по теме

Похожие вопросы