Есть ли чистый Python Lucene?

У рубиновых ребят есть Хорек. Кто-нибудь знает о подобной инициативе для Python? В настоящее время мы используем PyLucene, но я хотел бы изучить возможность перехода к поиску на чистом Python.

Вероятно, это не ответ на вопрос, но Elasticsearch реализует простой веб-интерфейс поверх Lucene, а PyES - это оболочка python над Elasticsearch. Я с комфортом использовал pyES, но некоторые расширенные функции, присутствующие в Lucene, по-прежнему отсутствуют в Elasticsearch.

amit 06.09.2011 10:32

Кстати, старый URL-адрес Ferret теперь перенаправляется на chandanweb.com/solutions/web-applications.html - я заменил URL-адрес на новую страницу github github.com/dbalmain/ferret :)

icedwater 05.09.2013 08:12

Для доступа к индексам Lucene я нашел (и пробую) plush: pypi.python.org/pypi/plush/0.3.0

icedwater 05.09.2013 08:33

есть ли причина для перехода на чистый питон?

avi 06.02.2014 09:47
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
43
4
23 841
8
Перейти к ответу Данный вопрос помечен как решенный

Ответы 8

пухлый был портом lucene на чистый python.Люповые люди предлагают вам использовать PyLucene. Простите. Возможно, вы можете использовать исходные коды Java в сочетании с Jython.

Интересно, что Ферре, кажется, очень ценили и использовали, когда Лупи бросили.

PEZ 13.01.2009 12:22

Что ж, PyLucene, похоже, обслуживает подобное сообщество. Кроме того, некоторые люди даже готовы выполнять полнотекстовый поиск на Java из-за Lucene ;-)

Yuval F 13.01.2009 12:42

Единственное известное мне решение поиска на чистом питоне (не включающее даже расширение C) - это Ядерный. Он медленный (намного медленнее, чем PyLucene) и пока что нестабилен.

Мы перешли от домашнего поиска и индексации на основе PyLucene к Solr, но YMMV.

Я недавно нашел пиндекстер. Он предоставляет абстрактный интерфейс для различных серверных полнотекстовых поисковых систем / индексаторов. И он поставляется с реализацией на чистом питоне по умолчанию.

Однако в Python эти вещи могут быть катастрофически медленными.

Я пришел сюда в поисках чего-то для доступа к индексам Lucene в python, на данный момент меня не слишком беспокоит скорость. Я просто не хочу быть привязанным к Java. Так что спасибо за пинтер.

icedwater 05.09.2013 08:26

Последний выпуск pyndexter был 2007 года, и, к сожалению, приведенная здесь ссылка мертва.

webtweakers 15.11.2016 16:39

Для некоторых приложений чистый Python переоценен. Взгляните на Xapian.

Спасибо за упоминание Xapian. Не то, что мне сейчас нужно, но я обязательно запомню это на потом.

PEZ 14.01.2009 01:55

После нескольких недель поисков я нашел хорошее решение Python: repoze.catalog. Это не только для Python, потому что он использует ZODB для хранения, но мне кажется, что это лучшая зависимость, чем что-то вроде SOLR.

Я хочу Solr на Python, каков был вывод о таком программном обеспечении, как Solr, но написанном на Python?

tursunWali 23.02.2021 01:05

+1 к ответам Xapian и Pyndexter.

На самом деле Ferret написан на C с привязками Ruby наверху. Поисковая машина на чистом Ruby будет даже медленнее, чем на чистом Python. Я хотел бы, чтобы «кто-то другой» напишет слой Cython / Pyrex для интерфейса Python с Ferret, но я не буду делать этого сам, потому что зачем беспокоиться, когда есть привязки Python для Xapian.

Спасибо. Я использовал термин «чистый» в грязной манере. =) Если я смогу установить его с помощью easy_setup, я счастлив.

PEZ 07.02.2009 14:38
Ответ принят как подходящий

Свист - новый проект, похожий на lucene, но являющийся чистым питоном.

Просто использовал whoosh для проекта, и им действительно было легко пользоваться. Никакого возни - просто сработало.

John Montgomery 17.07.2009 19:49

К сожалению, от whoosh, похоже, сейчас отказались (и в нем много плохих ошибок).

OrangeDog 31.07.2018 13:09

он не будет работать с данными> 1G. объединение сегментов занимает час

TomSawyer 19.04.2020 22:58

Для не чистого Python Поиск сфинкса с Python API работает быстрее всего. Судя по тестам из нескольких блогов, Sphinx Search намного быстрее, чем Lucene, использует гораздо меньше памяти и находится на C.

Я разрабатываю на его основе поисковую систему по нескольким документам, используя python и web2py в качестве фреймворка.

Другие вопросы по теме