МОСС 2007 Ползание

Я пытаюсь заставить сканирование работать на двух отдельных фермах, которые у меня есть, но не могу заставить его работать ни на одной из них. У них обоих есть два WFE с дополнительным WFE, настроенным как сервер индекса. Есть еще один сервер, выделенный для запросов, и два кластерных внутренних сервера SQL 2005 для базы данных. Я безуспешно пробовал по крайней мере 50 различных веб-сайтов, которые я нашел с помощью решений из поисковой системы. Я настроил (расширил) свое веб-приложение для использования http: // servername: 12345 в качестве зоны по умолчанию и http://abc.companyname.com в качестве настраиваемой зоны и зоны интрасети. Когда я ввожу каждый из них в источник контента, а затем пытаюсь запустить сканирование, я получаю пару ошибок в журнале сканирования:

http: // имя сервера: 12345 возвращает:
«Не удалось подключиться к серверу. Убедитесь, что сайт доступен».

http://abc.companyname.com возвращает:
«Удалено сборщиком. (Начальный адрес или источник контента, который содержал этот элемент, был удален, и, следовательно, этот элемент был удален.)»

Однако я могу щелкнуть оба URL-адреса, и страница станет доступной.

Есть идеи?


Больше информации:

Я, так сказать, вытер сланец и запустил еще одно сканирование, чтобы получить обновленный образец.

Мои источники контента таковы:

http: // имя сервера: 33333
http://sharepoint.portal.fake.com
sps3: // имя сервера: 33333

Мои текущие ошибки журнала сканирования:

sps3: // имя сервера: 33333
Ошибка в веб-службе PortalCrawl.

http: // servername: 33333 / mysites
Контент для этого URL-адреса исключен сервером из-за атрибута без индекса.

http: // servername: 33333 / mysites
Проскочил

sts3: // имя сервера: 33333 / contentdbid = {62a647a ...
Проскочил

sts3: // имя сервера: 33333
Проскочил

http: // имя сервера: 33333
Проскочил

http://sharepoint.portal.fake.com
Сканер не смог связаться с сервером. Убедитесь, что сервер доступен и что доступ к брандмауэру настроен правильно.

Я дважды проверил опечатки выше и не нашел их, так что это должно быть точное отражение.

Стоит ли изучать PHP в 2026-2027 годах?
Стоит ли изучать PHP в 2026-2027 годах?
Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Приемы CSS-макетирования - floats и Flexbox
Приемы CSS-макетирования - floats и Flexbox
Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...
Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest
В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
3
0
16 680
6
Перейти к ответу Данный вопрос помечен как решенный

Ответы 6

В разделе «Службы на сервере» проверьте свойства учетной записи обхода при поиске, чтобы убедиться, что она настроена и имеет разрешения на доступ к этим сайтам.

Меня немного смущает топология вашей фермы. Машина, установленная как WFE, не может быть индексатором. Машина, установленная как "полная", может быть индексатором, запросом и / или wfe ...

Кроме того, вместо изменения учетной записи доступа к контенту по умолчанию вы можете вместо этого добавить правило обхода (когда все будет запущено и запущено)

Можете ли вы увидеть, есть ли что-нибудь полезное в% commonprogramfiles% / microsoft shared / web server extensions / 12 / logs на вашем индексаторе?

Файл журнала может быть немного подробным, вы можете выполнить поиск по словам «запущен» или «полный», и это обычно приведет вас к строке в журнале, где началось сканирование.

Кроме того, на вашем компьютере с sql вы можете получить дополнительную информацию из таблицы MSScrawlurlhistory.

Можете ли вы создать источник контента для http://www.cnn.com и начать полное сканирование? Вы получаете такую ​​же ошибку (и)?

Кроме того, мы можем сделать это в автономном режиме, дайте мне знать, если вы хотите это сделать.

Я не уверен, есть ли способ отправлять личные сообщения через stackoverflow.

Ответ принят как подходящий

Следует помнить, что сканирование сайтов SharePoint отличается от сканирования общих файловых ресурсов или веб-сайтов, не относящихся к SharePoint.

Еще несколько полезных советов:

  • протокол sps3: предназначен для сканирования профилей пользователей для поиска людей. Вы можете игнорировать все, что об этом говорит поисковый робот, пока не будете готовы к работе с профилями пользователей.
  • ваша учетная запись сканирования должна иметь доступ ко всей вашей ферме. Если вы видите ошибки разрешений, найдите статью базы знаний, в которой рассказывается, как сбросить учетную запись сканирования (это специальная команда stsadm.exe). Если вы пытаетесь сканировать контент другой фермы, вам придется придумать что-то еще, чтобы предоставить доступ к вашей учетной записи сканирования. Я думаю, что это ваша самая большая проблема на данный момент.
  • Сканер (запущенный с сервера индексирования) попытается посетить общедоступный URL. Раньше у меня были проблемы с коммуникацией между серверами; убедитесь, что все три сервера могут пинговать друг друга, и убедитесь, что сервер индексирования может получить доступ к общедоступному URL-адресу (откройте IE на сервере индексирования и проверьте его). Если у вас возникли проблемы, пора испачкать файл hosts на вашем сервере индексирования. В любом случае это то, что SharePoint делает за вас, так что не расстраивайтесь, делая это. Если вы настроили что-либо, кроме встроенной проверки подлинности Windows, вам придется потрудиться, чтобы ваш сканер заработал.

Как бы то ни было, в ответах было много споров, так что я просто выстреливаю кучу предложений, может быть, одно из них попадает в цель.

Спасибо за новый вклад!

Итак, я вернулся с выходных и хотел просмотреть ваши указатели и попробовать все, а затем сообщить о том, как они не работают, а затем опубликовать полученные результаты. Однако случилось забавное.

Я зашел в свой индексатор (servername5) и попытался подключиться к Central Admin и главному порталу из Internet Explorer. Ни то, ни другое не сработало. Итак, я вошел в IIS через Indexer, чтобы попытаться перейти на главный портал из IIS. Это тоже не сработало, и я получил сообщение об ошибке, сообщающее мне, что что-то другое использует этот порт. Итак, я увидел свой старый веб-сайт из предыдущей сборки и удалил его из IIS вместе с соответствующим пулом приложений. Затем я запустил пул приложений для веб-сайта из новой сборки и перешел на веб-сайт. Успех. Затем я перешел на веб-сайт из браузера на своем ПК. И снова успех. Затем я запустил сканирование по полному URL-адресу, а не по имени сервера, например:

http://sharepoint.portal.fake.com

И снова успех. Он просканировал весь портал, включая подсайты, как я и хотел. «Элементы в индексе» заполнялись быстро, и я мог сказать, что катился.

Я по-прежнему не могу получить доступ к сайту Central Admin, размещенному на servername4, с servername5. Я не уверен, почему бы и нет, но не знаю, насколько это важно в данный момент.

Что это меня оставит? Какое было исправление?

Я все еще не уверен. Может, это была перестройка. Возможно, как только я перестроил ферму серверов, у меня было все необходимое, чтобы заставить ее работать, но это просто не сработало, потому что предыдущий веб-сайт все еще был в IIS. (Забавно, насколько небрежной может быть деинсталляция SharePoint. Ручное удаление баз данных контента, веб-сайтов и пулов приложений кажется необходимым, а этого, вероятно, быть не должно.)

В любом случае, сейчас он работает на моей «тестовой» ферме, поэтому главное - заставить его работать на производственной ферме. Надеюсь, после этого опыта это не будет так сложно.

Спасибо всем за помощь!

Похоже, большинство ваших проблем связано с Kerberos. Если у вас не применено обновление инфраструктуры, Sharepoint не сможет использовать аутентификацию Kerberos для веб-сайтов с портами, отличными от портов по умолчанию (80/443). Вот почему (я готов поспорить), что вы не можете получить доступ к CA с сервера 5, когда он находится на сервере 4. Если у вас неправильно настроены SPN, тогда CA будет доступен только с машины, на которой он установлен. Если бы вы установили Sharepoint с использованием порта 80 в качестве URL-адреса по умолчанию, вы могли бы выполнять сканирование локальной точки доступа без каких-либо проблем. Но по замыслу обход локальных сайтов sharepoint использует URL-адрес по умолчанию для доступа к сайтам sharepoint. Ознакомьтесь с http://codefrob.spaces.live.com/blog/cns!7C69E7B2271B08F6!363.entry, чтобы получить более подробную информацию о том, как заставить Kerberos и Sharepoint хорошо работать вместе.

Другие вопросы по теме