Как соотносятся системы полнотекстового поиска PostgreSQL и MySQL? Есть ли что-нибудь лучше, чем одер? В чем они разные?






Update: Starting in MySQL 5.6, InnoDB supports fulltext search
К сожалению, я плохо разбираюсь в PostgreSQL, но если вы используете ПОЛНЫЙ ТЕКСТОВЫЙ поиск в MySQL, вы сразу же будете привязаны к MyISAM. Если вы хотите использовать InnoDB (и если соответствие ACID что-то для вас значит, вам следует использовать InnoDB), вы застряли в использовании других решений.
Часто развертываются две популярные альтернативы: Lucene (проект apache с модулем Zend, если вы используете PHP) и Сфинкс.
Я думаю, вы можете использовать Sphinx как с MySQL, так и с Postgres. Вот статья, чтобы объяснить, как использовать Sphinx с MySQL (вы можете добавить его как плагин)
Sphinx работает только с MySQL. То есть он поддерживает только выборку данных из MySQL.
PostgreSQL 8.3 имеет встроенный полнотекстовый поиск, который является интегрированной версией "tsearch2".
Вот документация: http://www.postgresql.org/docs/8.3/static/textsearch.html
И пример из документации:
SELECT title
FROM pgweb
WHERE to_tsvector(body) @@ to_tsquery('friend');
Где body - текстовое поле. Вы можете индексировать специально для этих типов поиска, и, конечно, они могут стать более сложными, чем этот простой пример. Функциональность очень солидная, и стоит погрузиться в нее, когда вы примете решение.
Удачи.
Изначально полнотекстовый поиск выполняется довольно медленно, обязательно тщательно изучите стратегии оптимизации запросов на этом, потому что в противном случае ваш UX будет ужасным, как модемы 28,8k.
Если вы используете Hibernate в качестве ORM, я настоятельно рекомендую использовать поиск Hibernate. Он построен на основе Lucene, поэтому он очень быстрый.
Карл
У меня был довольно хороший опыт работы с postgresql / tsearch2, особенно после того, как он был включен в стандартный дистрибутив (до версии 8.0 - я думаю - это была дополнительная функция contrib, и обновление до tsearch2 потребовало небольшой работы).
Если я правильно помню, вы должны установить некоторые свойства (нечеткое соответствие, словарный запас) перед запуском, тогда как в других базах данных эти вещи гибко отображаются через сам полнотекстовый синтаксис (здесь я думаю об Oracle Text, хотя я знаю, что это не так. имеет отношение к вашему вопросу).
Полнотекстовый поиск MySQL выполняется очень медленно. Он не может обрабатывать данные более 1 миллиона (несколько десятков секунд на запрос).
У меня нет опыта использования полнотекстового поиска postgresql.
Я использовал sphinxsearch. Это очень быстро и просто в использовании. Но это не так уж и мощно. Я имею в виду поисковый функционал. Например, он не поддерживает такие, как «abc?», Где «?» обозначает любой персонаж.
Я тоже знаю Люцен. Это мощно, но трудно научиться.
Для всех, кто читает это сейчас, начиная с MySQL 5.6, InnoDB поддерживает полнотекстовый поиск.