Разница между EXISTS и IN в SQL?

В чем разница между предложениями EXISTS и IN в SQL?

Когда мы должны использовать EXISTS, а когда мы должны использовать IN?

sql

24.08.2008 12:42

ReactJs | Supabase | Добавление данных в базу данных

Это и есть ваш редактор таблиц в supabase.👇

Понимание Python и переход к SQL

Перед нами лабораторная работа по BloodOath:

454

574 645

Ответы 21

Я предполагаю, что вы знаете, что они делают и, следовательно, используются по-разному, поэтому я собираюсь понять ваш вопрос так: когда было бы хорошей идеей переписать SQL для использования IN вместо EXISTS или наоборот.

Это справедливое предположение?

Редактировать: Причина, по которой я спрашиваю, заключается в том, что во многих случаях вы можете переписать SQL на основе IN, чтобы вместо этого использовать EXISTS, и наоборот, и для некоторых механизмов баз данных оптимизатор запросов будет обрабатывать эти два по-разному.

Например:

SELECT *
FROM Customers
WHERE EXISTS (
    SELECT *
    FROM Orders
    WHERE Orders.CustomerID = Customers.ID
)

можно переписать на:

SELECT *
FROM Customers
WHERE ID IN (
    SELECT CustomerID
    FROM Orders
)

или с соединением:

SELECT Customers.*
FROM Customers
    INNER JOIN Orders ON Customers.ID = Orders.CustomerID

Итак, мой вопрос все еще в силе: интересно ли оригинальному плакату, что делают IN и EXISTS и, следовательно, как их использовать, или он спрашивает, будет ли хорошей идеей переписать SQL с использованием IN для использования EXISTS или наоборот?

Не знаю насчет ОП, но хотелось бы получить ответ на этот вопрос! Когда следует использовать EXISTS вместо IN с подзапросом, возвращающим идентификаторы?

— 13.07.2010 21:45

в JOIN вам понадобится DISTINCT

— 26.03.2014 22:51

отличная демонстрация, но в значительной степени оставьте вопрос без ответа

— 14.03.2017 20:00

24.08.2008 12:45

EXISTS сообщит вам, вернул ли запрос какие-либо результаты. например.:

SELECT * 
FROM Orders o 
WHERE EXISTS (
    SELECT * 
    FROM Products p 
    WHERE p.ProductNumber = o.ProductNumber)

IN используется для сравнения одного значения с несколькими и может использовать буквальные значения, например:

SELECT * 
FROM Orders 
WHERE ProductNumber IN (1, 10, 100)

Вы также можете использовать результаты запроса с предложением IN, например:

SELECT * 
FROM Orders 
WHERE ProductNumber IN (
    SELECT ProductNumber 
    FROM Products 
    WHERE ProductInventoryQuantity > 0)

Последний запрос опасен, потому что он может завершиться ошибкой, если подзапрос не вернет никаких результатов. Предложение in требует как минимум 1 аргумента ...

— 01.04.2016 12:26

@ user2054927 Последний запрос правильно не вернет ни одной строки, если подзапрос не вернет ни одной строки - в этом нет ничего опасного!

— 04.06.2016 12:36

24.08.2008 12:47

Я думаю,

EXISTS - это когда вам нужно сопоставить результаты запроса с другим подзапросом. Результаты запроса №1 должны быть получены там, где совпадают результаты подзапроса. Вид соединения .. Например. выберите таблицу клиентов №1, которые также разместили заказы в таблице №2
IN - получить, если значение определенного столбца лежит в IN, в списке (1,2,3,4,5) Например. Выберите клиентов, которые находятся в следующих почтовых индексах, т.е. значения zip_code находятся в списке (....).

Когда использовать одно вместо другого ... когда вы чувствуете, что он читается правильно (лучше передает намерение).

24.08.2008 12:50

Ключевое слово exists может использоваться таким образом, но на самом деле оно предназначено как способ избежать подсчета:

--this statement needs to check the entire table
select count(*) from [table] where ...

--this statement is true as soon as one match is found
exists ( select * from [table] where ... )

Это наиболее полезно, когда у вас есть условные операторы if, поскольку exists может быть намного быстрее, чем count.

in лучше всего использовать там, где вам нужно передать статический список:

 select * from [table]
 where [field] in (1, 2, 3)

Когда у вас есть таблица в операторе in, имеет смысл использовать join, но в большинстве случаев это не имеет значения. Оптимизатор запросов в любом случае должен вернуть тот же план. В некоторых реализациях (в основном более старых, таких как Microsoft SQL Server 2000) запросы in всегда будут получать план вложенное соединение, в то время как запросы join будут использовать вложенные, слить или хэш в зависимости от ситуации. Более современные реализации умнее и могут корректировать план даже при использовании in.

Не могли бы вы уточнить: «Когда у вас есть таблица в операторе in, имеет смысл использовать соединение, но на самом деле это не имеет значения. Оптимизатор запросов в любом случае вернет тот же план»? Не в части оптимизатора запросов, а в части, в которой вы можете использовать JOIN в качестве замены IN.

— 27.01.2015 06:52

select * from [table] where [field] in (select [field] from [table2]) возвращает те же результаты (и план запроса), что и select * from [table] join [table2] on [table2].[field] = [table].[field].

— 05.08.2015 21:45

@Sander - нет: первый запрос возвращает все столбцы из table, а второй возвращает все из table и table2. В некоторых (в основном более старых) базах данных SQL запрос in будет реализован как вложенное соединение, в то время как запрос join может быть вложенным, объединенным, хешированным и т. д. - в зависимости от того, что быстрее всего.

— 05.08.2015 22:43

Хорошо, я должен был указать столбцы в предложении select, но вы должны обновить свой ответ, потому что в нем четко указано, что запросы «в любом случае вернут один и тот же план».

— 05.08.2015 23:07

exists может использоваться в операторе case, поэтому они могут быть удобными и в этом случае, например, select case when exists (select 1 from emp where salary > 1000) then 1 else 0 end as sal_over_1000

— 25.08.2016 07:17

Преимущества системы голосования действительно проявляются в тех вопросах, на которые первоначальный запросчик не удосужился отметить ответ, который он нашел наиболее полезным.

— 21.07.2020 19:25

24.08.2008 13:37

На основе оптимизатор правил:

EXISTS намного быстрее, чем IN, когда результаты подзапроса очень большие.
IN быстрее, чем EXISTS, когда результаты подзапроса очень малы.

На основе оптимизатор затрат:

Нет никакой разницы.

Доказательство вашего аргумента? Я не думаю, что IN будет быстрее, чем когда-либо EXISTS!

— 06.05.2014 10:50

@Nawaz Как насчет доказательства, почему IN всегда медленнее, чем EXISTS?

— 10.07.2014 17:55

Плохо реализованный оптимизатор запросов? Мне кажется, что что-то подобное (хотя и не совсем такая ситуация) происходит в определенных RDBM ...

— 19.08.2015 20:31

EXISTS возвращает чисто логические значения, что всегда быстрее, чем сравнение строк или значений, превышающих тип BIT / Boolean. IN может быть логическим сравнением, а может и не быть. Поскольку программирование предпочитает использование EXPLICIT для стабильности (часть ACID), как правило, предпочтительнее EXISTS.

— 28.06.2016 09:48

«Еще одно практическое правило заключалось в том, что если подзапрос дал относительно небольшой набор результатов, вам следует использовать подзапрос IN и подзапрос EXISTS». Источник - В vs СУЩЕСТВОВАТЬ

— 09.12.2016 13:15

Почему за него так много раз проголосовали? Нет абсолютно никаких причин, по которым это основанное на предположении утверждение должно в целом быть верным.

— 01.02.2018 00:37

FWIW, EXISTS был быстрее для меня в MS Access 2016. SELECT pn FROM tableA WHERE exists (select * from tableB where tableB.partnum = pn)

— 05.12.2018 04:56

@LukasEder Людям нравятся прямые ответы, даже если они идут в ущерб правильности. Сравнить "Tea is healthy." с "Researchers have claimed that drinking tea can reduce the chances of developing type 2 diabetes by up to 25 per cent if three or four cups are consumed a day. However, drinking more than four cups of tea a day can increase women’s risk of developing rheumatoid arthritis, research has found."

— 12.01.2020 07:23

19.10.2010 05:35

Насколько мне известно, когда подзапрос возвращает значение NULL, тогда весь оператор становится NULL. В этих случаях мы используем ключевое слово EXITS. Если мы хотим сравнить определенные значения в подзапросах, мы используем ключевое слово IN.

21.03.2012 06:01

Ключевое слово Exists оценивает истину или ложь, а ключевое слово IN сравнивает все значения в соответствующем столбце подзапроса. Еще один Select 1 можно использовать с командой Exists. Пример:

SELECT * FROM Temp1 where exists(select 1 from Temp2 where conditions...)

Но IN менее эффективен, поэтому Exists быстрее.

25.05.2012 09:00

Если вы используете оператор IN, механизм SQL просканирует все записи, полученные из внутреннего запроса. С другой стороны, если мы используем EXISTS, механизм SQL остановит процесс сканирования, как только найдет совпадение.

@ziggy объясни? Это в значительной степени то, о чем также говорится в принятом ответе. В ДОЛЖНЫ проверять каждую отдельную запись, существует может остановиться, как только найдет только одну.

— 15.07.2014 18:54

Нет, не правильно. IN и EXISTS могут быть эквивалентными и преобразовываться друг в друга.

— 01.02.2018 00:42

04.06.2012 05:43

EXISTS намного быстрее, чем IN, когда результаты подзапроса очень большие. IN быстрее, чем EXISTS, когда результаты подзапроса очень малы.

CREATE TABLE t1 (id INT, title VARCHAR(20), someIntCol INT)
GO
CREATE TABLE t2 (id INT, t1Id INT, someData VARCHAR(20))
GO

INSERT INTO t1
SELECT 1, 'title 1', 5 UNION ALL
SELECT 2, 'title 2', 5 UNION ALL
SELECT 3, 'title 3', 5 UNION ALL
SELECT 4, 'title 4', 5 UNION ALL
SELECT null, 'title 5', 5 UNION ALL
SELECT null, 'title 6', 5

INSERT INTO t2
SELECT 1, 1, 'data 1' UNION ALL
SELECT 2, 1, 'data 2' UNION ALL
SELECT 3, 2, 'data 3' UNION ALL
SELECT 4, 3, 'data 4' UNION ALL
SELECT 5, 3, 'data 5' UNION ALL
SELECT 6, 3, 'data 6' UNION ALL
SELECT 7, 4, 'data 7' UNION ALL
SELECT 8, null, 'data 8' UNION ALL
SELECT 9, 6, 'data 9' UNION ALL
SELECT 10, 6, 'data 10' UNION ALL
SELECT 11, 8, 'data 11'

Запрос 1
```
SELECT
FROM    t1 
WHERE   not  EXISTS (SELECT * FROM t2 WHERE t1.id = t2.t1id)
```
Запрос 2
```
SELECT t1.* 
FROM   t1 
WHERE  t1.id not in (SELECT  t2.t1id FROM t2 )
```
Если в t1 ваш идентификатор имеет нулевое значение, тогда запрос 1 найдет их, но запрос 2 не может найти нулевые параметры.
Я имею в виду, что IN не может ничего сравнивать с null, поэтому у него нет результата для null, но EXISTS может сравнивать все с null.

Этот ответ является разумным синопсисом настроений Тома Кайта (asktom.oracle.com/pls/asktom/…)

— 06.09.2013 18:58

Я думаю, что этот ответ основан на интуиции, что вполне справедливо. Но это не может быть универсально правдой. Например, это почти наверняка неверно в отношении Ingres, который анализирует оба эквивалентных запроса SQL как один и тот же запрос QUEL, которому не хватает - кхм, «богатства» SQL, когда дело доходит до написания одного и того же несколькими способами.

— 23.08.2016 10:56

Эти два запроса логически эквивалентны тогда и только тогда, когда t2.id определен как «NOT NULL». Чтобы обеспечить эквивалентность без зависимости в определении таблицы, второй запрос должен быть «ВЫБРАТЬ t1. * FROM t1, ГДЕ t1.id не входит (SELECT t2.id FROM t2 где t2.id не равно нулю)»

— 09.10.2016 12:50

04.07.2012 16:40

Если подзапрос возвращает более одного значения, вам может потребоваться выполнить внешний запрос - если значения в столбце, указанном в условии, соответствуют любому значению в наборе результатов подзапроса. Для выполнения этой задачи необходимо использовать ключевое слово in.

Вы можете использовать подзапрос, чтобы проверить, существует ли набор записей. Для этого вам нужно использовать предложение exists с подзапросом. Ключевое слово exists всегда возвращает истинное или ложное значение.

04.12.2012 15:24

EXISTS работает быстрее, чем IN. Если большинство критериев фильтрации находится в подзапросе, лучше использовать IN, а если большинство критериев фильтрации находится в основном запросе, лучше использовать EXISTS.

Это утверждение действительно не подтверждено никакими доказательствами, не так ли?

— 01.02.2018 00:40

09.04.2013 23:03

Какой из них быстрее, зависит от количества запросов, полученных внутренним запросом:

Когда ваш внутренний запрос извлекает тысячи строк, тогда EXIST будет лучшим выбором.
Когда ваш внутренний запрос извлекает несколько строк, IN будет быстрее

СУЩЕСТВУЕТ оценивает истинность или ложь, но ВНУТР сравнивает несколько значений. Если вы не знаете, существует запись или нет, вам следует выбрать EXIST.

04.07.2013 11:08

Если вы используете оператор IN, механизм SQL просканирует все записи, полученные из внутреннего запроса. С другой стороны, если мы используем EXISTS, механизм SQL остановит процесс сканирования, как только найдет совпадение.

16.07.2013 12:00

В этом разница:

select * 
from abcTable
where exists (select null)

Вышеуказанный запрос вернет все записи, а нижний - пустой.

select *
from abcTable
where abcTable_ID in (select null)

Попробуйте и посмотрите на результат.

Хммм ... Ошибка: [SQL0104] токен) недействителен. В обоих случаях. Вы предполагаете конкретную СУБД?

— 10.08.2017 18:42

19.05.2015 15:42

Причина в том, что оператор EXISTS работает по принципу «хотя бы нашел». Он возвращает истину и останавливает сканирование таблицы после того, как будет найдена хотя бы одна соответствующая строка.

С другой стороны, когда оператор IN комбинируется с подзапросом, MySQL должен сначала обработать подзапрос, а затем использовать результат подзапроса для обработки всего запроса.

The general rule of thumb is that if the subquery contains a large volume of data, the EXISTS operator provides a better performance.
However, the query that uses the IN operator will perform faster if the result set returned from the subquery is very small.

07.04.2016 12:04

Насколько я понимаю, оба должны быть одинаковыми, если мы не имеем дело со значениями NULL.

По той же причине, по которой запрос не возвращает значение для = NULL или равно NULL. http://sqlinthewild.co.za/index.php/2010/02/18/not-exists-vs-not-in/

Что касается логического аргумента против аргумента компаратора, для генерации логического значения необходимо сравнить оба значения, и именно так работает любое условие if, поэтому я не могу понять, как IN и EXISTS ведут себя по-разному .

13.09.2016 01:02

В поддерживает только отношения равенства (или неравенство, если ему предшествует НЕТ) .
Это синоним = любой / = некоторые, например

select    * 
from      t1 
where     x in (select x from t2)
;

СУЩЕСТВУЮТ поддерживает вариантные типы отношений, которые не могут быть выражены с помощью В, например. -

select    * 
from      t1 
where     exists (select    null 
                  from      t2 
                  where     t2.x=t1.x 
                        and t2.y>t1.y 
                        and t2.z like '℅' || t1.z || '℅'
                  )
;

И с другой стороны -

Предположительно производительность и технические различия между СУЩЕСТВУЮТ и В могут быть результатом реализаций / ограничений / ошибок конкретного поставщика, но во многих случаях они являются не чем иным, как мифами, созданными из-за непонимания внутреннего устройства баз данных.

Определение таблиц, точность статистики, конфигурация базы данных и версия оптимизатора - все это влияет на план выполнения и, следовательно, на показатели производительности.

Проголосуйте за ваш комментарий о производительности: не сосредотачиваясь на конкретной СУБД, мы должны предположить, что оптимизатор должен решить, что работает лучше всего.

— 10.11.2017 09:27

07.10.2016 16:46

Я считаю, что у этого есть простой ответ. Почему бы вам не проверить это у людей, которые разработали эту функцию в своих системах?

Если вы разработчик MS SQL, вот ответ непосредственно от Microsoft.

IN:

Determines whether a specified value matches any value in a subquery or a list.

EXISTS:

Specifies a subquery to test for the existence of rows.

24.03.2017 08:01

Я обнаружил, что использование ключевого слова EXISTS часто очень медленное (это очень верно в Microsoft Access). Вместо этого я использую оператор соединения следующим образом: должен-я-использовать-ключевое-слово-существует-в-sql

27.06.2017 17:54

In certain circumstances, it is better to use IN rather than EXISTS. In general, if the selective predicate is in the subquery, then use IN. If the selective predicate is in the parent query, then use EXISTS.

https://docs.oracle.com/cd/B19306_01/server.102/b14211/sql_1016.htm#i28403

17.08.2017 17:10

В:

Работает с набором результатов List
Не работает с подзапросами, в результате получаются виртуальные таблицы с несколькими столбцами.
Сравнивает каждое значение в списке результатов
Производительность сравнительно МЕДЛЕННАЯ для большего набора результатов подзапроса

СУЩЕСТВУЮТ:

Работает на виртуальных столах
Используется со связанными запросами
Выход из сравнения при нахождении совпадения
Производительность сравнительно БЫСТРАЯ для большего набора результатов подзапроса

23.06.2020 17:59

Другие вопросы по теме

Какой хороший способ проверить, совпадают ли две даты в один и тот же календарный день в TSQL?

Как отобразить записи, содержащие определенную информацию, в SQl

Как отправить электронную почту в локальное время пользователя в .NET / Sql Server?

Группировка серий данных

Представление упорядочивания в реляционной базе данных

Я что-то упустил в LINQ?

Лучший способ выполнить динамический подзапрос в MS Reporting Services?

SQL Server - грязное чтение за и против

Используйте предложение LIKE в составе INNER JOIN

Разница между EXISTS и IN в SQL?

Ответы 21

И с другой стороны -

Другие вопросы по теме

Похожие вопросы