У рубиновых ребят есть Хорек. Кто-нибудь знает о подобной инициативе для Python? В настоящее время мы используем PyLucene, но я хотел бы изучить возможность перехода к поиску на чистом Python.
Кстати, старый URL-адрес Ferret теперь перенаправляется на chandanweb.com/solutions/web-applications.html - я заменил URL-адрес на новую страницу github github.com/dbalmain/ferret :)
Для доступа к индексам Lucene я нашел (и пробую) plush: pypi.python.org/pypi/plush/0.3.0
есть ли причина для перехода на чистый питон?






пухлый был портом lucene на чистый python.Люповые люди предлагают вам использовать PyLucene. Простите. Возможно, вы можете использовать исходные коды Java в сочетании с Jython.
Интересно, что Ферре, кажется, очень ценили и использовали, когда Лупи бросили.
Что ж, PyLucene, похоже, обслуживает подобное сообщество. Кроме того, некоторые люди даже готовы выполнять полнотекстовый поиск на Java из-за Lucene ;-)
Я недавно нашел пиндекстер. Он предоставляет абстрактный интерфейс для различных серверных полнотекстовых поисковых систем / индексаторов. И он поставляется с реализацией на чистом питоне по умолчанию.
Однако в Python эти вещи могут быть катастрофически медленными.
Я пришел сюда в поисках чего-то для доступа к индексам Lucene в python, на данный момент меня не слишком беспокоит скорость. Я просто не хочу быть привязанным к Java. Так что спасибо за пинтер.
Последний выпуск pyndexter был 2007 года, и, к сожалению, приведенная здесь ссылка мертва.
Для некоторых приложений чистый Python переоценен. Взгляните на Xapian.
Спасибо за упоминание Xapian. Не то, что мне сейчас нужно, но я обязательно запомню это на потом.
После нескольких недель поисков я нашел хорошее решение Python: repoze.catalog. Это не только для Python, потому что он использует ZODB для хранения, но мне кажется, что это лучшая зависимость, чем что-то вроде SOLR.
Я хочу Solr на Python, каков был вывод о таком программном обеспечении, как Solr, но написанном на Python?
+1 к ответам Xapian и Pyndexter.
На самом деле Ferret написан на C с привязками Ruby наверху. Поисковая машина на чистом Ruby будет даже медленнее, чем на чистом Python. Я хотел бы, чтобы «кто-то другой» напишет слой Cython / Pyrex для интерфейса Python с Ferret, но я не буду делать этого сам, потому что зачем беспокоиться, когда есть привязки Python для Xapian.
Спасибо. Я использовал термин «чистый» в грязной манере. =) Если я смогу установить его с помощью easy_setup, я счастлив.
Свист - новый проект, похожий на lucene, но являющийся чистым питоном.
Просто использовал whoosh для проекта, и им действительно было легко пользоваться. Никакого возни - просто сработало.
К сожалению, от whoosh, похоже, сейчас отказались (и в нем много плохих ошибок).
он не будет работать с данными> 1G. объединение сегментов занимает час
Для не чистого Python Поиск сфинкса с Python API работает быстрее всего. Судя по тестам из нескольких блогов, Sphinx Search намного быстрее, чем Lucene, использует гораздо меньше памяти и находится на C.
Я разрабатываю на его основе поисковую систему по нескольким документам, используя python и web2py в качестве фреймворка.
Вероятно, это не ответ на вопрос, но Elasticsearch реализует простой веб-интерфейс поверх Lucene, а PyES - это оболочка python над Elasticsearch. Я с комфортом использовал pyES, но некоторые расширенные функции, присутствующие в Lucene, по-прежнему отсутствуют в Elasticsearch.