Можно ли выполнять нечеткий поиск T-SQL без служб SSIS?

SSIS 2005/2008 выполняет нечеткий поиск и группирование. Есть ли функция, которая делает то же самое в T-SQL?

29.10.2008 20:15

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

21 241

Перейти к ответу Данный вопрос помечен как решенный

Ответы 4

В SQL Server есть функция SOUNDEX ():

SELECT * 
FROM Customers
WHERE SOUNDEX(Lastname) = SOUNDEX('Stonehouse')
AND SOUNDEX(Firstname) = SOUNDEX('Scott')

Правда - забыл об этом. Но не думайте, что это сработает для числовых идентификаторов, скажем, с транспонированными цифрами или что-то в этом роде.

— 29.10.2008 20:53

В прошлом я обнаружил, что soundex очень примитивен, он работает, но его детализация очень грубая. Double Metaphone - более новая версия фонетического сопоставления, но она все еще ограничивает.

— 30.10.2008 01:26

29.10.2008 20:18

Полнотекстовый поиск - отличный нечеткий инструмент. Краткий букварь здесь

29.10.2008 20:28

Ответ принят как подходящий

Нечеткий поиск использует подход q-граммы, разбивая строки на крошечные подстроки и индексируя их. Затем вы можете искать ввод, разбивая его на строки одинакового размера. Вы можете проверить формат их индекса и написать функцию CLR для использования того же стиля индекса, но вы, возможно, говорите о достаточном объеме работы.

На самом деле довольно интересно, как они это сделали, очень просто, но обеспечивает очень надежное сопоставление и легко настраивается.

Из этого я припоминаю индекс, когда я в последний раз смотрел на него, каждая q-грамма или подстрока хранится в строке в таблице (индекс). Эта строка содержит столбец nvarchar (среди других значений), который используется как двоичные данные и содержит ссылки на совпадающие строки.

Есть также открытый отзыв о Microsoft Connect для этой функции.

30.10.2008 01:22

5 марта 2009 г. на сайте www.sqlservercentral.com будет размещена статья с образцом Jaro-Winkler TSQL.

21.02.2009 19:13