В Mongodb 500 миллионов документов, и я хочу выполнить поиск с помощью regEx на основе двух полей в драйвере JavaScript, а не на схеме

В моей MongoDb около 500 миллионов документов, которые выглядят следующим образом:

{
  "_id": objectId,
  "Name": "John Smith",
  "Address": "132, My Street, Kingston, New York 12401"
}

Теперь я хочу запросить данные на основе регулярного выражения имени и регулярного выражения адреса, поскольку иногда имя в моей базе данных чувствительно к регистру, а иногда и адрес. Я попытался создать отдельный индекс (1) для обоих полей, также попытался создать составной индекс с текстом (в текстовом индексе проблема в том, что он ищет только в том случае, если текстовый индекс находился в одном поле, либо адрес, либо имя не работает с индексом обоих полей. с текстом).

Также попробовал индексировать оба поля как: createIndex({Name: 1, Address: 1}); <--- это возвращает данные также, если я ищу только по одному полю. Я хочу выполнить запрос типа:

var name = "john smith";
var address = "new york";

 var userData = await db
      .collection("userData")
      .find({
        $and: [
          { Name: { $regex: new RegExp(name, "i") } },
          { Address: { $regex: new RegExp(address, "i") } },
        ],
      })
      .skip(skip)
      .limit(limitNumber)
      .toArray();

Если я попробую использовать один индекс, я все равно смогу выполнить запрос с одним полем, а не с обоими полями. Я попробовал оба поля со всеми вышеперечисленными методами, загрузка занимает целую вечность, даже если я попытался расширить время запроса, мс все равно ничего не возвращает или даже ошибку.

Спасибо

Wrt-индексы для поиска по регулярным выражениям без учета регистра: «Индексы без учета регистра обычно не повышают производительность запросов $regex. Реализация $regex не учитывает параметры сортировки и не может эффективно использовать индексы без учета регистра».

aneroid 30.04.2024 14:18
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Улучшение производительности загрузки с помощью Google Tag Manager и атрибута Defer
Улучшение производительности загрузки с помощью Google Tag Manager и атрибута Defer
В настоящее время производительность загрузки веб-сайта имеет решающее значение не только для удобства пользователей, но и для ранжирования в...
Безумие обратных вызовов в javascript [JS]
Безумие обратных вызовов в javascript [JS]
Здравствуйте! Юный падаван 🚀. Присоединяйся ко мне, чтобы разобраться в одной из самых запутанных концепций, когда вы начинаете изучать мир...
Система управления парковками с использованием HTML, CSS и JavaScript
Система управления парковками с использованием HTML, CSS и JavaScript
Веб-сайт по управлению парковками был создан с использованием HTML, CSS и JavaScript. Это простой сайт, ничего вычурного. Основная цель -...
JavaScript Вопросы с множественным выбором и ответы
JavaScript Вопросы с множественным выбором и ответы
Если вы ищете платформу, которая предоставляет вам бесплатный тест JavaScript MCQ (Multiple Choice Questions With Answers) для оценки ваших знаний,...
1
1
58
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Попробуй это:

var userData = await db
  .collection("userData")
  .find({
      Name: { $regex: name, $options: "i" },
      Address: { $regex: address, $options: "i" } 
  })

$andоператор не нужен.

Если вам нравится его использовать, то вы должны использовать его с $expr

var userData = await db
  .collection("userData")
  .find({ $expr: {
    $and: [
      { $regexMatch: { input: "$Name", regex: name, options: "i" } },
      { $regexMatch: { input: "$Address", regex: address, options: "i" } }
    ],
  }})

Так какой индекс для этого нужен? {Имя: 1, Адрес: 1}? Спасибо

Jahanzaib Khan 30.04.2024 14:17

@JahanzaibKhan: индексы не помогут в запросах такого рода. (вроде как. Полное сканирование индекса, вероятно, все же лучше, чем полное сканирование коллекции, но оно все равно будет намного медленнее, чем запрос на равенство или диапазон)

Sergio Tulentsev 30.04.2024 14:18

Он не использует индекс. Этот ответ только делает ваш запрос рабочим.

Wernfried Domscheit 30.04.2024 14:22

``` var userData = await db .collection("userData") .find({ Name: { $regex: name, $options: "i" }, Address: { $regex: адрес, $options: "i" } }) ``` Уже пробовал, не помогло. и попробовал второй тоже, но ничего не получил.

Jahanzaib Khan 30.04.2024 14:28

@WernfriedDomscheit ничего не возвращает. он возвращается только тогда, когда я ищу регулярное выражение в одном поле, независимо от того, какой индекс я делаю или нет!.

Jahanzaib Khan 30.04.2024 15:22

я только что попробовал: .find({ $or: [ { Name: { $regex: new RegExp(name, "i") } }, { Address: { $regex: new RegExp(address, "i") } }, ], }) он вернул несколько совпадающих имени и адреса, но также вернул другие, совпадающие с именем или адресом.

Jahanzaib Khan 30.04.2024 15:40

Итак, я тестировал все больше и больше и выяснил, что если у меня нет составного индекса для поля имени и адреса вместе, запрос занимает 500 секунд, в противном случае это займет 85 секунд, если я запрашиваю регулярное выражение в обоих полях. Всем спасибо.

Jahanzaib Khan 01.05.2024 00:14

составной индекс с порядком возрастания, текст не требуется.

Jahanzaib Khan 01.05.2024 00:14

Другие вопросы по теме