Я пытаюсь массово удалить документы на основе шаблона, но, поскольку коллекция содержит более 500 тысяч документов, цикл for зависает. Ниже мой код:
for (const uri of cts.uris("", null, cts.jsonPropertyValueQuery("source", "survey"))) {
xdmp.documentDelete(uri);
}
Может ли кто-нибудь помочь мне с лучшим способом удаления документов в MarkLogic при большом объеме?
Попытка запроса типа «кипятить океан» для изменения действительно большого набора документов в одной транзакции, вероятно, приведет к ограничениям либо по времени выполнения, размеру транзакции, расширенному кэшу дерева и т. д.
Работу лучше разбивать на более мелкие блоки.
Один из простых способов — разбить работу на несколько транзакций, которые выполняются на сервере задач. Вы можете сделать это довольно легко в XQuery с помощью xdmp:spawn-function()
(к сожалению, эквивалентная функция недоступна в SJS):
xquery version "1.0-ml";
for $URI in cts:uris("", (), cts:json-property-value-query("source", "survey"))
return xdmp:spawn-function(function(){ xdmp:document-delete($URI) })
Вы можете изменить приведенный выше код, чтобы удалить подмножества URI, а не по одному. Однако эти транзакции удаления должны выполняться очень быстро (и параллельно для такого количества потоков, которое вы настроили для сервера задач), поэтому, возможно, не стоит возиться с более сложным кодом.
Другой вариант — использовать пакетный инструмент, например CoRB.