Я пытаюсь заставить сканирование работать на двух отдельных фермах, которые у меня есть, но не могу заставить его работать ни на одной из них. У них обоих есть два WFE с дополнительным WFE, настроенным как сервер индекса. Есть еще один сервер, выделенный для запросов, и два кластерных внутренних сервера SQL 2005 для базы данных. Я безуспешно пробовал по крайней мере 50 различных веб-сайтов, которые я нашел с помощью решений из поисковой системы. Я настроил (расширил) свое веб-приложение для использования http: // servername: 12345 в качестве зоны по умолчанию и http://abc.companyname.com в качестве настраиваемой зоны и зоны интрасети. Когда я ввожу каждый из них в источник контента, а затем пытаюсь запустить сканирование, я получаю пару ошибок в журнале сканирования:
http: // имя сервера: 12345 возвращает:
«Не удалось подключиться к серверу. Убедитесь, что сайт доступен».
http://abc.companyname.com возвращает:
«Удалено сборщиком. (Начальный адрес или источник контента, который содержал этот элемент, был удален, и, следовательно, этот элемент был удален.)»
Однако я могу щелкнуть оба URL-адреса, и страница станет доступной.
Есть идеи?
Больше информации:
Я, так сказать, вытер сланец и запустил еще одно сканирование, чтобы получить обновленный образец.
Мои источники контента таковы:
http: // имя сервера: 33333
http://sharepoint.portal.fake.com
sps3: // имя сервера: 33333
Мои текущие ошибки журнала сканирования:
sps3: // имя сервера: 33333
Ошибка в веб-службе PortalCrawl.
http: // servername: 33333 / mysites
Контент для этого URL-адреса исключен сервером из-за атрибута без индекса.
http: // servername: 33333 / mysites
Проскочил
sts3: // имя сервера: 33333 / contentdbid = {62a647a ...
Проскочил
sts3: // имя сервера: 33333
Проскочил
http: // имя сервера: 33333
Проскочил
http://sharepoint.portal.fake.com
Сканер не смог связаться с сервером. Убедитесь, что сервер доступен и что доступ к брандмауэру настроен правильно.
Я дважды проверил опечатки выше и не нашел их, так что это должно быть точное отражение.





В разделе «Службы на сервере» проверьте свойства учетной записи обхода при поиске, чтобы убедиться, что она настроена и имеет разрешения на доступ к этим сайтам.
Меня немного смущает топология вашей фермы. Машина, установленная как WFE, не может быть индексатором. Машина, установленная как "полная", может быть индексатором, запросом и / или wfe ...
Кроме того, вместо изменения учетной записи доступа к контенту по умолчанию вы можете вместо этого добавить правило обхода (когда все будет запущено и запущено)
Можете ли вы увидеть, есть ли что-нибудь полезное в% commonprogramfiles% / microsoft shared / web server extensions / 12 / logs на вашем индексаторе?
Файл журнала может быть немного подробным, вы можете выполнить поиск по словам «запущен» или «полный», и это обычно приведет вас к строке в журнале, где началось сканирование.
Кроме того, на вашем компьютере с sql вы можете получить дополнительную информацию из таблицы MSScrawlurlhistory.
Можете ли вы создать источник контента для http://www.cnn.com и начать полное сканирование? Вы получаете такую же ошибку (и)?
Кроме того, мы можем сделать это в автономном режиме, дайте мне знать, если вы хотите это сделать.
Я не уверен, есть ли способ отправлять личные сообщения через stackoverflow.
Следует помнить, что сканирование сайтов SharePoint отличается от сканирования общих файловых ресурсов или веб-сайтов, не относящихся к SharePoint.
Еще несколько полезных советов:
Как бы то ни было, в ответах было много споров, так что я просто выстреливаю кучу предложений, может быть, одно из них попадает в цель.
Спасибо за новый вклад!
Итак, я вернулся с выходных и хотел просмотреть ваши указатели и попробовать все, а затем сообщить о том, как они не работают, а затем опубликовать полученные результаты. Однако случилось забавное.
Я зашел в свой индексатор (servername5) и попытался подключиться к Central Admin и главному порталу из Internet Explorer. Ни то, ни другое не сработало. Итак, я вошел в IIS через Indexer, чтобы попытаться перейти на главный портал из IIS. Это тоже не сработало, и я получил сообщение об ошибке, сообщающее мне, что что-то другое использует этот порт. Итак, я увидел свой старый веб-сайт из предыдущей сборки и удалил его из IIS вместе с соответствующим пулом приложений. Затем я запустил пул приложений для веб-сайта из новой сборки и перешел на веб-сайт. Успех. Затем я перешел на веб-сайт из браузера на своем ПК. И снова успех. Затем я запустил сканирование по полному URL-адресу, а не по имени сервера, например:
http://sharepoint.portal.fake.com
И снова успех. Он просканировал весь портал, включая подсайты, как я и хотел. «Элементы в индексе» заполнялись быстро, и я мог сказать, что катился.
Я по-прежнему не могу получить доступ к сайту Central Admin, размещенному на servername4, с servername5. Я не уверен, почему бы и нет, но не знаю, насколько это важно в данный момент.
Что это меня оставит? Какое было исправление?
Я все еще не уверен. Может, это была перестройка. Возможно, как только я перестроил ферму серверов, у меня было все необходимое, чтобы заставить ее работать, но это просто не сработало, потому что предыдущий веб-сайт все еще был в IIS. (Забавно, насколько небрежной может быть деинсталляция SharePoint. Ручное удаление баз данных контента, веб-сайтов и пулов приложений кажется необходимым, а этого, вероятно, быть не должно.)
В любом случае, сейчас он работает на моей «тестовой» ферме, поэтому главное - заставить его работать на производственной ферме. Надеюсь, после этого опыта это не будет так сложно.
Спасибо всем за помощь!
Похоже, большинство ваших проблем связано с Kerberos. Если у вас не применено обновление инфраструктуры, Sharepoint не сможет использовать аутентификацию Kerberos для веб-сайтов с портами, отличными от портов по умолчанию (80/443). Вот почему (я готов поспорить), что вы не можете получить доступ к CA с сервера 5, когда он находится на сервере 4. Если у вас неправильно настроены SPN, тогда CA будет доступен только с машины, на которой он установлен. Если бы вы установили Sharepoint с использованием порта 80 в качестве URL-адреса по умолчанию, вы могли бы выполнять сканирование локальной точки доступа без каких-либо проблем. Но по замыслу обход локальных сайтов sharepoint использует URL-адрес по умолчанию для доступа к сайтам sharepoint. Ознакомьтесь с http://codefrob.spaces.live.com/blog/cns!7C69E7B2271B08F6!363.entry, чтобы получить более подробную информацию о том, как заставить Kerberos и Sharepoint хорошо работать вместе.