Хранение массивов в базах данных

Каков наиболее эффективный способ хранения больших массивов (10000x100) в базе данных, скажем, hsqldb? Мне нужно сделать это для определенной математической программы, которую я пишу на java. Пожалуйста помоги. Будет часто извлекаться и сохраняться весь массив (не столько отдельные элементы). Кроме того, некоторые метаданные о массиве должны храниться о массиве.

Вам нужен произвольный доступ к элементам массива или только к массивам?

— 18.10.2008 00:34

Вы знаете решение для PostgreSQL?

— 04.07.2013 17:23

java database hsqldb

18.10.2008 00:31

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

Как вычислять биты и понимать побитовые операторы в Java - объяснение с примерами

В компьютерном программировании биты играют важнейшую роль в представлении и манипулировании данными на двоичном уровне. Побитовые операции...

Поднятие тревоги для долго выполняющихся методов в Spring Boot

Приходилось ли вам сталкиваться с требованиями, в которых вас могли попросить поднять тревогу или выдать ошибку, когда метод Java занимает больше...

Принятие принципов SOLID в Spring Boot: Создание обслуживаемых и масштабируемых приложений

Коллекции (ArrayList , HashSet , HashMap)

Полный курс Java для разработчиков веб-сайтов и приложений

Получите сертификат Java Web и Application Developer, используя наш курс.

8 652

Перейти к ответу Данный вопрос помечен как решенный

Ответы 11

Определите таблицу с данными, хранящимися в вашем массиве, и вставьте значения массива в таблицу.

Это очень простой доступ / хранение данных. Всегда ли размеры вашего массива будут одинаковыми?

Нет, размеры не останутся прежними.

— 18.10.2008 00:37

Если размеры не совпадают, вам придется использовать что-то вроде сериализации, как указано ниже.

— 18.10.2008 00:43

Я бы сделал то же самое, если бы размеры не остались прежними. Нет смысла постоянно создавать и удалять таблицы.

— 18.10.2008 00:44

18.10.2008 00:35

Сделайте это одной большой явной транзакцией. Не заставляйте систему баз данных создавать новую неявную транзакцию для каждой вставки.
Используйте подготовленное заявление.

18.10.2008 00:36

Ответ принят как подходящий

Отличный вопрос.

Если вы не хотите переводить свои массивы в набор нормализованных таблиц, что, похоже, у вас нет, вы можете подумать о сериализации.

Сериализация - это модное слово для преобразования объектов в некоторый формат, который вы можете сохранить на диск или в базу данных. Два основных формата сериализации - это двоичный и XML, и я уверен, что Java имеет некоторую поддержку для этого.

В зависимости от того, какие типы данных вы используете, вы сможете преобразовать свой массив в XML или двоичный, а затем сохранить его в одном поле в базе данных. Вы можете начать работу с этой техникой на Java, проверив http://java.sun.com/developer/technicalArticles/Programming/serialization/. Я знаю, что он встроен в .NET.

Надеюсь, это поможет. Дайте мне знать, если я могу дать вам еще направление.

18.10.2008 00:38

Как насчет сохранения данных как BLOB и использования Java для декодирования BLOB в реальный массив Java? Было бы намного эффективнее хранить и извлекать весь массив одним залпом, но было бы ужасно при перемещении отдельных элементов.

18.10.2008 00:47

PostgreSQL имеет встроенную поддержку массивов.

http://www.postgresql.org/docs/8.0/interactive/arrays.html

Это очень хороший момент (хотя OP указал какой-то другой db, который может не обладать удивительной гибкостью PostgreSQL в этом отношении). Вы знаете, насколько эффективно это реализовано? У меня сложилось впечатление, что он не предназначен для больших массивов, но я могу ошибаться.

— 18.10.2008 00:51

Есть ли эквивалент типа ARRAY PSQ в MySQL и MicrosoftSQL?

— 04.07.2013 13:28

18.10.2008 00:48

Придумайте внутреннее представление - будь то XML, JSON, какой-нибудь двоичный файл, который вы придумали сами, или любая другая форма сериализации.

Сохраните его в таблице, используя тип данных «blob». Храните любые метаданные, связанные с матрицей, в дополнительных столбцах.

Я категорически не согласен с тем, что способ сделать это - создать таблицу с тем же количеством строк и столбцов, что и ваша матрица - это очень высокая цена за функциональность, которую вы не используете.

Заранее подготовьте операторы вставки / выбора и используйте переменные связывания, чтобы изменить матрицу, с которой вы работаете - не заставляйте базу данных повторно анализировать каждый запрос.

18.10.2008 00:50

Если это всего лишь 1 массив, почему бы не использовать двоичный файл?

18.10.2008 02:05

Как уже было предложено: не используйте СУБД, если вам не нужны функции. Однако вместо сериализации вам может потребоваться низкоуровневый API, такой как JDBM, который предоставляет некоторые функции, подобные базе данных, такие как управление индексом на диске.

18.10.2008 02:51

Если ваши данные плотно упакованы (гистограмма значений близка к плоской линии), ваш лучший выбор - это blob и сериализация с использованием Object [Output / Input] Stream.

В противном случае вы можете найти более эффективным использование разреженных массивов и вариаций схемы Entity-Attribute-Value. Вот пример:

 Name | IndexKey  | Value
------+-----------+-------
 foo  | 'default' | 39        
 foo  | 0:0:0     | 23
 foo  | 0:0:1     | 34
 foo  | 1:5:0     | 12
 ...
 bar  | 1:3:8     | 20
 bar  | 1:3:8     | 23
 bar  | 1:1:1     | 24
 bar  | 3:0:6     | 54
 ...

Это также позволяет вам быстро обновлять части таблицы и выбирать срезы с помощью оператора SQL Like.

Если количество ваших измерений фиксировано, чтобы разбить ключевой столбец на отдельные столбцы int для каждого измерения, чтобы повысить эффективность индекса и иметь более гибкие критерии выбора (вы можете использовать первый индекс 'null' для метаданных, таких как значение по умолчанию) .

В любом случае рекомендуется создать кластерный индекс для столбцов Name, IndexKey.

18.10.2008 08:02

Сериализация Java в массив байтов, хранящийся как BLOB, будет вашим лучшим выбором. Java довольно эффективно сериализует большой массив. Используйте остальные столбцы строк для всего, что вы хотите запросить или легко отобразить. Также может быть хорошей идеей хранить большие двоичные объекты в их собственной таблице и иметь «обычные» строки, указывающие на строки «больших двоичных объектов», если вы запрашиваете и сообщаете данные, не относящиеся к большим двоичным объектам (хотя это может варьироваться в зависимости от реализации базы данных. ).

18.10.2008 10:35

HSQLDB 2.0 поддерживает одномерные массивы, хранящиеся в виде столбца таблицы. Таким образом, каждая строка таблицы будет соответствовать одной строке 2D-массива.

Но если вы хотите получить 2D-массив в целом, BLOB - лучшее решение.

03.07.2010 16:45