Я изучил GraphDB и попал в ситуацию, когда во вновь созданный репозиторий не загружались никакие данные. Используя чистую систему с открытым исходным кодом RDF4J, я могу загружать все файлы без каких-либо проблем, но в GraphDB он сообщает мне, что проанализировано 0 операторов, а при выполнении запроса SPARQL он возвращает 0.
Я попробовал как рабочую среду, так и инструмент loadrdf, поскольку сейчас меня особенно интересует производительность загрузки:
./loadrdf -f -i rdf-experiment -m serial -verbose -s /home/zangetsu/devel/proj/rdfprocessor/src/main/resources/rdf_batch/*_EQ_*
// Logs
https://pastebin.com/dihVsS4z
// Example RDFXML file
https://pastebin.com/2xqCWjs6
Я не вижу никакой справочной информации в файле журнала.
Вот пример файла:
Спасибо за любую помощь.
Из ваших журналов я вижу, что расширение файла было '.xml', поэтому очень вероятно, что инструмент 'loadrdf' выбрал неправильный парсер на его основе (например, автоматически определил его как в формате TriX вместо RDFXML). Вы можете попробовать переименовать свои файлы rdf в '.rdf' и проверить еще раз.
Можно как-то настроить парсер вручную или он определяется только автоматически?
В настоящее время обнаруживается только автоматически. Внутри loadrdf использует список зарегистрированных анализаторов RDF4J и их соответствующие описания FileFormat для выбора парсера на основе расширения файла. Как парсеры TriX, так и RDFXML регистрируют расширение файла .xml, но парсер TriX использует его по умолчанию, поэтому он выбирается при обработке файла. Перечисление других доступных альтернатив при сбоях синтаксического анализа еще не реализовано.
Спасибо. Что ж, эталон инструмента loadrdf в параллельном режиме по сравнению с написанным вручную многопоточным процессором RDF4J с собственным (дисковым) репозиторием привел к тому, что RDF4J оказался быстрее, чем инструмент массовой загрузки GraphDB, здесь мы обсуждаем высокопроизводительную обработку RDF (синтаксический анализ, загрузка, запрос) : groups.google.com/forum/#!topic/rdf4j-users/mvYKSlodgDA для интересующихся
Разобрано 1799342 оператора за 28908 мс! Приятно, большое спасибо.