Хранение изображений в БД - да или нет?

Итак, я использую приложение, которое сильно хранит изображения в БД. Что вы думаете об этом? Я больше предпочитаю хранить местоположение в файловой системе, чем хранить его непосредственно в БД.

Как вы думаете, какие плюсы / минусы?

Что ж, вы можете сделать и с транзакционным дисковым кешем.

— 16.08.2011 01:16

database image theory storage blob

06.08.2008 21:38

ReactJs | Supabase | Добавление данных в базу данных

Это и есть ваш редактор таблиц в supabase.👇

415

1

672 115

56

Я отвечаю за некоторые приложения, которые управляют большим количеством ТБ изображений. Мы обнаружили, что лучше всего хранить пути к файлам в базе данных.

Есть пара проблем:

хранение базы данных обычно дороже, чем хранение файловой системы
вы можете супер-ускорять доступ к файловой системе с помощью стандартных готовых продуктов
- например, многие веб-серверы используют системный вызов операционной системы послать файл() для асинхронной отправки файла непосредственно из файловой системы в сетевой интерфейс. Изображения, хранящиеся в базе данных, не получают выгоды от этой оптимизации.
такие вещи, как веб-серверы и т. д., не требуют специального кодирования или обработки для доступа к изображениям в файловой системе.
базы данных выигрывают там, где важна целостность транзакций между изображением и метаданными.
- сложнее управлять целостностью между метаданными БД и данными файловой системы
- трудно (в контексте веб-приложения) гарантировать, что данные были сброшены на диск в файловой системе

какие готовые продукты доступны для "супер-ускорения" файловой системы?

— 04.10.2008 14:53

легко - вы просто делаете mke2fs --go-быстрее-полосы

— 28.11.2008 09:20

Хотя у меня работает только 3 ТБ файлов, я определенно согласен. Базы данных предназначены для структурированных данных, а не для больших двоичных объектов.

— 22.03.2009 22:31

@derobert: именно так, если вы никогда не будете использовать элемент данных в запросе, в качестве условия или для соединения, он, вероятно, не принадлежит базе данных. Опять же, если у вас есть хорошая функция базы данных для запроса изображений на сходство ...

— 18.05.2009 18:34

также наиболее полезно хранить изображения в файловой системе. просто подумайте, если клиент звонит и спрашивает, что он не может просмотреть изображение, но у него есть идентификатор изображения. намного быстрее найти и просмотреть изображение в файловой системе, а не в базе данных (могут быть проблемы с кодом).

— 28.07.2009 12:16

какие готовые продукты доступны для "супер-ускорения" файловой системы?

— 31.07.2009 19:16

Re: «супер-ускоряющие» продукты: большинство веб-серверов теперь могут использовать преимущества системного вызова sendfile () для асинхронной доставки статических файлов клиенту. Он перекладывает на операционную систему задачу перемещения файла с диска в сетевой интерфейс. ОС может делать это намного эффективнее, работая в пространстве ядра. Мне это кажется большим выигрышем для файловой системы по сравнению с db для хранения / обслуживания изображений.

— 20.11.2010 20:07

re "супер-ускорение": я думаю о таких продуктах, как isilon, emc, netapp и т. д., которые можно сконфигурировать для кластеризации, кеширования и т. д. данных, хранящихся в файловых системах (в нашем случае NFS). Вот презентация, которую я сделал, в которой обсуждаются некоторые вопросы. Это было на специальной конференции, поэтому в нем не подробно рассказывается о стороне базы данных, но он охватывает суть того, что мы делаем: maillist.perforce.com/perforce/conferences/us/2009/…

— 23.11.2010 00:17

Я работаю с клиентами (из библиотека ImageResizing.Net), которые хранят изображения в обоих направлениях, а файловая система намного более масштабируема и производительна. Но облачное хранилище - гораздо лучший вариант масштабируемости. Кроме того, в Windows NTFS начинает сканирование после 100 000 файлов, а ASP.NET не любит SAN. Я помог клиентам получить более 5 миллионов изображений, работающих в Windows, но это может быть болезненно.

— 16.08.2011 01:09

@Computer Linguist: когда NTFS замедляется, дефрагментируйте файл 0, $MFT (главная таблица файлов).

— 14.09.2011 02:55

@Mark Harrison, Производительность поиска изображений в двух случаях также зависит от размера изображений? Например, Если его аватарки пользователей, то можно ли его рекомендовать хранить в БД?

— 11.11.2011 21:53

@Marcos, да, ты прав. В этом случае удобство хранения небольшого изображения в том же месте, что и другие данные о пользователе, перевешивает другие факторы. Тем более, что к изображению, вероятно, обращаются одновременно с другими данными о пользователе.

— 11.11.2011 22:20

Большое спасибо, Марк! Также улучшена производительность для изображений небольшого размера (75 * 75 пикселей), хранящихся в БД, относительно файловой системы. Некоторое время назад я слышал, что если размер документов меньше 1 МБ, то, возможно, лучше хранить в БД, чем в FileSystem. Это правда ?

— 11.11.2011 22:36

Я думаю, что если изображения достаточно малы, время обслуживания данных становится незначительным, а другие факторы (например, удобство хранения данных изображения как части строки) становятся более важными. Конечно, как и во всех вопросах, связанных с производительностью, часто приходится экспериментировать с конкретным приложением / средой, чтобы увидеть, что работает лучше всего, но я считаю, что вы думаете в правильном направлении. Удачи!!

— 12.11.2011 03:36

06.08.2008 21:40

Ваш веб-сервер (я предполагаю, что вы его используете) предназначен для обработки изображений, а база данных - нет. Таким образом, я бы сильно проголосовал за "против".

Сохраните только путь (и, возможно, информацию о файле) в базе данных.

06.08.2008 21:40

Я лично храню большие данные вне базы данных.

Плюсы: Хранит все в одном месте, легкий доступ к файлам данных, легкая корзина Минусы: снижает производительность базы данных, много разделений страниц, возможное повреждение базы данных.

ты имеешь в виду внутри базы данных?

— 28.11.2008 08:46

06.08.2008 21:41

Обычно я категорически против того, чтобы взять самую дорогую и сложную для масштабирования часть вашей инфраструктуры (базу данных) и вложить в нее всю нагрузку. С другой стороны: это значительно упрощает стратегию резервного копирования, особенно когда у вас несколько веб-серверов и вам нужно как-то синхронизировать данные.

Как и многое другое, это зависит от ожидаемого размера и бюджета.

06.08.2008 21:42

Во-вторых, рекомендации по путям к файлам. Я работал над парой проектов, которые требовали управления огромными коллекциями активов, и любые попытки хранить вещи непосредственно в БД приводили к долгим страданиям и разочарованию.

Единственный настоящий «профи», о котором я могу думать относительно их хранения в базе данных, - это возможность упрощения работы с отдельными изображениями. Если нет путей к файлам для использования и все изображения передаются прямо из БД, нет опасности, что пользователь найдет файлы, к которым у него не должно быть доступа.

Однако похоже, что это было бы лучше решить с помощью промежуточного скрипта, извлекающего данные из недоступного в Интернете хранилища файлов. Так что хранилище БД ДЕЙСТВИТЕЛЬНО не нужно.

06.08.2008 21:51

Если это веб-приложение, тогда может быть преимущество хранения изображений в сторонней сети доставки хранилища, такой как Amazon S3 или платформа Nirvanix.

06.08.2008 21:52

По моему опыту, иногда самым простым решением является назовите изображения в соответствии с первичным ключом. Таким образом, легко найти изображение, принадлежащее определенной записи, и наоборот. Но в то же время вы не сохраняете что-либо об изображении в базе данных.

Действительно, очень мило. Теперь ваши пользователи могут легко увеличивать ваше имя файла для доступа к другим файлам ...

— 24.10.2010 21:53

@Marijn: Это только если вы покажете изображения миру.

— 26.11.2010 17:15

Мы сделали нечто очень похожее с нашими изображениями документов (наш первичный ключ - это составной ключ из трех элементов), но мы добавили дату и время сканирования документа, чтобы у нас было несколько версий в одном каталоге.

— 04.08.2011 17:55

@Osewa, как это? Да, для прямого доступа к файлу конечному пользователю потребуется доступ к папке. У вас может быть процесс для обслуживания файла через FTP на основе запроса, и безопасность будет на уровне SQL-сервера.

— 04.08.2011 17:56

06.08.2008 21:59

Пути к файлам в БД - это определенно путь - я слышал историю за историей от клиентов с ТБ изображений, что стало кошмаром пытаться сохранить любое значительное количество изображений в БД - одно только снижение производительности слишком велико.

06.08.2008 22:07

В компании, где я работал, мы хранили 155 миллионов изображений в базе данных Oracle 8i (затем 9i). Стоит 7,5 ТБ.

Абсолютно. Судя по всему, база данных теперь намного больше. Наличие данных в базе данных означает, что репликация базы данных на разных сайтах также намного проще.

— 12.03.2009 15:06

Я видел демонстрацию Oracle, где фактически можно было смонтировать файловую систему в базу данных или что-то в этом роде. Вы знаете, что вы сделали? (Извините, я не понимаю Oracle, так что, возможно, я говорю о чуши.)

— 28.07.2009 12:33

Я так не думаю - он хранил изображения в базе данных как базу данных. База данных была настроена агрессивно - я помню, как неоднократно обсуждался размер изображений, изменяющихся при добавлении и удалении полей. Все было выровнено по границам.

— 28.07.2009 13:52

06.08.2008 22:37

Небольшие статические изображения (не более пары мегабайт), которые редко редактируются, следует хранить в базе данных. Этот метод имеет несколько преимуществ, включая более простую переносимость (изображения передаются вместе с базой данных), более легкое резервное копирование / восстановление (изображения копируются вместе с базой данных) и лучшую масштабируемость (папка файловой системы с тысячами маленьких файлов эскизов звучит как кошмар масштабируемости для мне).

Обслуживать изображения из базы данных просто, просто реализуйте обработчик http, который обслуживает массив байтов, возвращаемый сервером БД, в виде двоичного потока.

Я бы сказал, что база данных лучше подходит для файлов, которые часто редактируются, поскольку в этом случае согласованность может быть проблемой.

— 05.11.2010 04:40

06.08.2008 22:46

Это может показаться маловероятным, но если вы используете (или планируете использовать) SQL Server 2008, я бы рекомендовал взглянуть на новый тип данных FileStream.

FileStream решает большинство проблем, связанных с хранением файлов в БД:

На самом деле BLOB-объекты хранятся в виде файлов в папке.
Доступ к BLOB-объектам можно получить, используя либо соединение с базой данных или же через файловую систему.
Бэкапы интегрированы.
Миграция «просто работает».

Однако «прозрачное шифрование данных» SQL не шифрует объекты FileStream, поэтому, если это необходимо, вам может быть лучше просто сохранить их как varbinary.

Из статьи MSDN:

Transact-SQL statements can insert, update, query, search, and back up FILESTREAM data. Win32 file system interfaces provide streaming access to the data.
FILESTREAM uses the NT system cache for caching file data. This helps reduce any effect that FILESTREAM data might have on Database Engine performance. The SQL Server buffer pool is not used; therefore, this memory is available for query processing.

+1 для FileStream. Фактически он хранит капли в виде файлов на диске, но управляет ими транзакционно.

— 27.07.2011 01:30

Кроме того, SQL-сервер позволяет получить доступ к двоичным объектам FileStream непосредственно с диска, чтобы вы могли избежать связывания соединения с БД.

— 27.07.2011 01:30

Тем не менее, добавленная задержка между БД и веб-сервером ... И веб-сервер должен будет загрузить его в память, чтобы передать его клиенту, вместо того, чтобы иметь возможность передавать его с диска, если вы не используете кеширование диска.

— 16.08.2011 01:14

07.08.2008 00:15

Ходят слухи, что, если вы не поставщик баз данных, пытающийся доказать, что ваша база данных может это сделать (например, Microsoft хвастается тем, что Terraserver хранит баджиллион изображений в SQL Server), это не очень хорошая идея. Когда альтернатива - хранение изображений на файловых серверах и пути в базе данных намного проще, зачем беспокоиться? Поля с каплями похожи на внедорожные возможности внедорожников - большинство людей ими не пользуются, те, у кого действительно возникают проблемы, а есть те, кто их используют, но только для удовольствия.

07.08.2008 01:19

Я бы предпочел файловую систему. Как отметили некоторые другие, большинство веб-серверов созданы для отправки изображений по пути к файлу. У вас будет гораздо более высокая производительность, если вам не нужно записывать или передавать поля BLOB из базы данных. Хранение изображений в файловой системе упрощает настройку статических страниц, когда содержимое не меняется или вы хотите ограничить нагрузку на базу данных.

07.08.2008 01:45

Попытка имитировать файловую систему с помощью SQL - это, как правило, плохой план. В конечном итоге вы напишете меньше кода с равными или лучшими результатами, если будете использовать файловую систему для внешнего хранилища.

20.08.2008 22:15

Одна вещь, о которой я еще не видел, чтобы кто-то упоминал, но определенно стоит отметить, что есть проблемы, связанные с хранением больших объемов изображений в большинстве файловых систем. Например, если вы воспользуетесь упомянутым выше подходом и назовете каждый файл изображения после первичного ключа, в большинстве файловых систем вы столкнетесь с проблемами, если попытаетесь поместить все изображения в один большой каталог, как только вы достигнете очень большого количества изображений ( например, в сотнях тысяч или миллионах).

Когда-то обычным решением этой проблемы является хеширование их в сбалансированное дерево подкаталогов.

Вы так думаете, но на самом деле проблемы незначительны; У меня есть приложение с миллионами файлов в одном каталоге, к которому без проблем обращаются сотни пользователей. Не шустро, но работает. Самая большая проблема заключается в том, что если вы используете проводник для просмотра каталога, вы всегда смотрите фонарик.

— 05.10.2008 17:07

Если бы вы беспокоились об этом, было бы легко использовать систему, подобную DNS, где корневой каталог имеет отдельный каталог для первого символа ключа. Чтобы сбалансировать дисковое пространство (или даже балансировку нагрузки), можно использовать точки монтирования или ссылки для их распределения.

— 27.10.2008 01:44

Лучше использовать файловую систему, у которой нет проблем с большими каталогами.

— 29.10.2008 06:46

У меня было приложение с миллионами файлов в одном каталоге (сервер, на котором запущен RHEL 4) - чтобы даже перечислить содержимое каталога (конвейер к файлу), потребовалось несколько дней, и я создал выходной файл размером 100 МБ. Теперь они находятся в базе данных. У меня есть единственный файл, который я могу легко переместить или создать резервную копию.

— 17.06.2009 19:24

@ Сеун Осева: каждая файловая система имеет ограничения ... и если вы знаете такую, в которой нет проблем с хранением миллионов записей в одном каталоге, сообщите мне!

— 04.11.2010 15:51

ext3 с флагом dir_index прекрасно справляется с большими каталогами. У меня есть каталог с 288 000 больших изображений. ls> / dev / null занимает менее 2 секунд. Ext3 с dir_index хранит информацию о каталоге в btree.

— 05.11.2010 04:38

@Richard: Размер вашей единственной резервной копии db-with-images меньше "сотен мегабайт"? На резервное копирование уходит меньше времени, чем на каталог изображений?

— 05.11.2010 04:39

@Seun Osewa: сейчас база данных имеет размер до 28 ГБ, в ней 5,4 млн записей. В итоге мне пришлось разделить таблицу базы данных, поэтому у меня есть несколько файлов для резервного копирования размером около 5 ГБ. Теперь переместите отдельные изображения на Amazon S3, поэтому мне нужно только сохранить имя файла в БД (и Amazon может делать резервные копии )

— 12.11.2010 10:41

@Richard: Мой каталог изображений занимает 19 ГБ на одном диске, и у меня нет никаких проблем. Думаю, ваш опыт доказывает, что файловый подход был лучше. С файлами вы можете делать дифференциальные резервные копии с помощью rsync, который копирует только новые файлы или файлы, которые изменились с момента последнего резервного копирования. Работает на меня; 19гб и без проблем. Нет необходимости в разделах и Amazon S3. Вы должны вернуться к нему.

— 13.11.2010 01:49

@Seun Osewa - Хотя я согласен с вами в использовании файловой системы, могут возникнуть проблемы с rsync, если данные будут повреждены. Ma.gnolia (сайт / инструмент онлайн-закладок) нанес сокрушительный удар с помощью rsync vimeo.com/3205188, в их случае он убил их живые и резервные БД. Вероятно, не столько проблема с изображениями, которые не сильно меняются (кроме добавления / удаления), сколько не очень тонкое напоминание о том, что нужно иметь несколько резервных копий ;-)

— 17.12.2010 21:58

В нашей системе более 10 миллионов документов с изображениями. Он разложен так, что в каждой подпапке не более 60 тыс. Изображений (или около того). У нас есть около половины терабайта изображений, и у нас нет проблем.

— 04.08.2011 18:02

20.08.2008 22:25

Файловое хранилище. Инженеры Facebook здорово поговорили об этом. Один вывод заключался в том, чтобы знать практический предел количества файлов в каталоге.

Игла в стоге сена: эффективное хранение миллиардов фотографий

Очень помогает ext3 dir_index.

— 05.05.2011 12:41

20.08.2008 22:35

Я не уверен, насколько это «реальный» пример, но в настоящее время у меня есть приложение, которое хранит детали для карточной игры, включая изображения для карточек. Предполагается, что количество записей в базе данных на сегодняшний день составляет всего 2851 запись, но с учетом того факта, что некоторые карты выпускаются несколько раз и имеют альтернативные изображения, на самом деле было более эффективно сканировать "первичный квадрат" изображения, а затем динамически генерировать границы и прочие эффекты для карты по запросу.

Первоначальный создатель этой библиотеки изображений создал класс доступа к данным, который отображает изображение на основе запроса, и делает это довольно быстро для просмотра и отдельной карточки.

Это также упрощает развертывание / обновления при выпуске новых карточек, вместо того, чтобы заархивировать всю папку с изображениями и отправить их по конвейеру и обеспечить создание надлежащей структуры папок, я просто обновляю базу данных и прошу пользователя снова загрузить ее. В настоящее время он имеет размер до 56 МБ, что не очень хорошо, но я работаю над функцией инкрементного обновления для будущих выпусков. Кроме того, существует версия приложения «без изображений», которая позволяет пользователям, подключенным к телефонной линии, получить приложение без задержки загрузки.

На сегодняшний день это решение отлично зарекомендовало себя, поскольку само приложение предназначено как единый экземпляр на рабочем столе. Есть веб-сайт, на котором все эти данные заархивированы для онлайн-доступа, но я бы ни в коем случае не использовал для этого одно и то же решение. Я согласен, что доступ к файлам был бы предпочтительнее, потому что он лучше масштабировался бы в соответствии с частотой и объемом запросов, сделанных для изображений.

Надеюсь, это не слишком много болтовни, но я понял эту тему и хотел поделиться некоторыми своими мыслями об относительно успешном небольшом / среднем приложении.

Когда речь идет о репликации, хранение изображений в базе данных намного превосходит IMO.

— 04.05.2009 00:26

20.08.2008 22:42

Только причина, по которой мы храним изображения в наших таблицах, заключается в том, что каждая таблица (или набор таблиц для каждого диапазона работы) является временной и удаляется в конце рабочего процесса. Если бы было какое-то долгосрочное хранилище, мы бы определенно выбрали хранение путей к файлам.

Также следует отметить, что мы работаем с клиент-серверным приложением внутри компании, поэтому нам не о чем беспокоиться.

20.08.2008 22:49

Однажды я работал над приложением для обработки изображений. Мы сохранили загруженные изображения в каталоге, который был что-то вроде / images / [сегодняшняя дата] / [идентификационный номер]. Но мы также извлекли метаданные (данные exif) из изображений и сохранили их в базе данных вместе с отметкой времени и т. д.

20.08.2008 22:51

Если вам нужно хранить много изображений в файловой системе, подумайте о нескольких вещах, включая:

Резервное копирование и восстановление. Как синхронизировать изображения.
Производительность файловой системы. Зависит от того, что вы делаете, и от файловой системы, но вы можете реализовать механизм хеширования, чтобы у вас не было единого каталога с миллиардами файлов.
Репликация. Вам нужно синхронизировать файлы между несколькими серверами?

22.08.2008 19:49

Извлечение множества двоичных данных из вашей БД по сети вызовет огромные проблемы с задержкой и не будет хорошо масштабироваться.

Сохраняйте пути в БД и позвольте вашему веб-серверу взять на себя нагрузку - это то, для чего он был разработан!

22.08.2008 20:08

Как и в большинстве случаев, это не так просто, как кажется. Бывают случаи, когда имеет смысл хранить изображения в базе данных.

Вы храните изображения, которые меняются динамически, скажем, счета-фактуры, а вы хотели получить счет на 1 января 2007?
Правительство хочет, чтобы вы сохранили 6-летнюю историю
Изображения, хранящиеся в базе данных, не требуют другой стратегии резервного копирования. Изображения, хранящиеся в файловой системе, делают
Доступ к изображениям легче контролировать, если они находятся в базе данных. Простаивающие администраторы могут получить доступ к любой папке на диске. Требуется действительно целеустремленный администратор, чтобы шпионить за базой данных для извлечения изображений.

С другой стороны, есть проблемы, связанные с

Требовать дополнительный код для извлечения и транслируйте изображения
Задержка может быть медленнее, чем прямой доступ к файлам
Более высокая нагрузка на сервер базы данных

Отсутствие отдельной стратегии резервного копирования может иметь большое значение, когда вы пишете приложения, которые устанавливаются локально (например, SharePoint). Когда вы создаете резервную копию SharePoint, все находится в базе данных, что очень упрощает работу.

— 03.10.2008 03:40

Безопасность посредством неизвестности - это не совсем стратегия контроля доступа!

— 09.10.2008 14:46

Я не думаю, что он защищает безопасность посредством неизвестности - он говорит, что размещение изображений в БД добавляет еще один уровень безопасности. (Я думаю ... @ Конрад, не хочу вкладывать слова в рот)

— 07.10.2010 13:06

Я выбрал хранение изображений в базе данных из-за преимущества единственного резервного копирования (или, в более общем смысле, наличия всех данных в одном месте), но проблемы, о которых вы говорите, также верны, поэтому я кэширую изображения в файловой системе. Это лучшее из обоих миров, и я удивлен, что ни один из лучших ответов здесь не упоминает об этом.

— 02.05.2011 01:04

Вы случайно используете библиотеку ImageResizing.Net для обработки кэширования образа диска SQL->? Это самый продвинутый, масштабируемый и надежный дисковый кеш, который вы можете получить ...

— 16.08.2011 01:13

@ Конрад: А как насчет изображений небольшого размера? Я считаю, что производительность поиска изображений в двух случаях также зависит от размера изображений, верно? Например, Если его аватарки пользователей, то будет ли рекомендовано хранить в БД?

— 11.11.2011 22:16

22.08.2008 20:33

Нет, из-за разбиения страницы. По сути, вы определяете строки размером от 1 КБ до n МБ, поэтому на страницах вашей базы данных будет много пустых пространств, что плохо для производительности.

22.08.2008 20:48

Файловая система, конечно. Затем вы можете использовать все функции ОС для работы с этими изображениями - резервные копии, веб-сервер, даже просто сценарии пакетных изменений с использованием таких инструментов, как imagemagic. Если вы храните их в БД, вам нужно будет написать свой собственный код для решения этих проблем.

29.08.2008 00:12

SQL Server 2008 предлагает решение, сочетающее в себе лучшее из обоих миров: Тип данных файлового потока.

Управляйте им как обычной таблицей и получите производительность файловой системы.

29.08.2008 01:37

Одна вещь, которую вам нужно иметь в виду, - это размер вашего набора данных. Я считаю, что Дилли-О была единственной, кто хотя бы отдаленно попал в точку.

Если у вас есть небольшое, однопользовательское, потребительское приложение, я бы сказал DB. У меня есть приложение для управления DVD, которое использует файловую систему (в том числе Program Files), и это PIA для резервного копирования. Я хочу КАЖДЫЙ раз, чтобы они хранили их в базе данных, и позволяю мне выбирать, где сохранить этот файл.

Для более крупного коммерческого приложения я бы начал менять свое мышление. Раньше я работал в компании, которая разработала приложение для управления информацией окружных клерков. Мы будем хранить изображения на диске в закодированном формате [для решения проблем FS с большим количеством файлов] на основе присвоенного округом номера инструмента. Это было полезно с другой стороны, поскольку изображение могло существовать до записи БД (из-за их рабочего процесса).

Как и в большинстве случаев: «Это зависит от того, что вы делаете»

30.08.2008 03:04

Еще одно преимущество хранения изображений в файловой системе заключается в том, что вам не нужно делать ничего особенного, чтобы клиент их кэшировал ...

... если, конечно, изображение не доступно через корень документа (например, барьер аутентификации), и в этом случае вам нужно будет проверить заголовки управления кешем, которые отправляет ваш код.

30.08.2008 08:27

Как уже говорили другие, SQL 2008 поставляется с типом Filestream, который позволяет вам хранить имя файла или идентификатор в качестве указателя в базе данных и автоматически сохраняет изображение в вашей файловой системе, что является отличным сценарием.

Если вы используете более старую базу данных, я бы сказал, что если вы храните ее как данные blob, то вы действительно не получите ничего из базы данных путем поиска функций, так что это, вероятно, лучше для хранения адреса в файловой системе и сохранения изображения таким образом.

Таким образом, вы также экономите место в своей файловой системе, поскольку вы собираетесь сэкономить только точное количество места или даже сжатое пространство в файловой системе.

Кроме того, вы можете решить сохранить с некоторой структурой или элементами, которые позволят вам просматривать необработанные изображения в вашей файловой системе без каких-либо обращений к базе данных, или передавать файлы массово в другую систему, жесткий диск, S3 или другой сценарий - обновление местоположения в ваша программа, но сохраните структуру, опять же без особого удара, пытаясь вывести изображения из вашей базы данных при попытке увеличить хранилище.

Вероятно, это также позволит вам добавить какой-то элемент кеширования на основе часто встречающихся URL-адресов изображений в ваш веб-движок / программу, так что вы также сохраняете себя там.

30.08.2008 13:50

Я ведущий разработчик корпоративной системы управления документами, в которой некоторые клиенты хранят сотни гигабайт документов. Терабайты в недалеком будущем. Мы используем подход файловая система по многим причинам, упомянутым на этой странице, плюс еще одна: архивирование.

Многие из наших клиентов должны соблюдать отраслевые правила архивирования, такие как хранение на оптических дисках или хранение в непатентованном формате. Кроме того, у вас есть возможность просто добавить дополнительные диски к устройству NAS. Если у вас есть файлы, хранящиеся в вашей базе данных, даже с типом данных потока файлов SQL Server 2008, ваши возможности архивирования стали намного уже.

30.08.2008 14:15

Уловка здесь в том, чтобы не стать фанатиком.

Здесь следует отметить, что никто из профессионалов в области файловых систем не указал конкретную файловую систему. Означает ли это, что все, от FAT16 до ZFS, легко превосходит любую базу данных?

Нет.

На самом деле многие базы данных превосходят многие файловые системы, даже если мы говорим только о чистой скорости.

Правильный курс действий - принять правильное решение для вашего конкретного сценария, и для этого вам потребуются некоторые числа и некоторые оценки вариантов использования.

Я не вижу, чтобы кто-то утверждал, что файловая система быстрее, чем БД, в 100% случаев (прочтите ответ Марка Харрисона). Это что-то вроде соломы. Вероятно, существуют ситуации, в которых предпочтительнее не пристегивать ремень безопасности, но вообще говоря, пристегивание ремня безопасности - хорошая идея.

— 08.04.2009 20:56

31.08.2008 21:54

По моему опыту, мне приходилось управлять обеими ситуациями: изображения, хранящиеся в базе данных, и изображения в файловой системе с путем, хранящимся в db.

Первое решение, изображения в базе данных, несколько «чище», так как ваш уровень доступа к данным будет иметь дело только с объектами базы данных; но это хорошо только тогда, когда приходится иметь дело с небольшими числами.

Очевидно, что производительность доступа к базе данных, когда вы имеете дело с большими двоичными объектами, ухудшается, и размеры базы данных сильно вырастут, снова вызывая потерю производительности ... и обычно пространство базы данных намного дороже, чем пространство файловой системы.

С другой стороны, хранение больших двоичных объектов в файловой системе приведет к тому, что у вас будут планы резервного копирования, которые должны учитывать как базу данных, так и файловую систему, и это может быть проблемой для некоторых систем.

Еще одна причина использовать файловую систему - это когда вам нужно предоставить доступ к своим изображениям (или звукам, видео и т. д.) Со сторонним доступом: в наши дни я разрабатываю веб-приложение, которое использует изображения, к которым нужно получить доступ извне. "моя веб-ферма таким образом, что доступ к базе данных для получения двоичных данных просто невозможен. Так что иногда есть также соображения дизайна, которые подтолкнут вас к выбору.

Учтите также, делая этот выбор, если вам приходится иметь дело с разрешениями и аутентификацией при доступе к двоичным объектам: эти реквизиты обычно могут быть решены более простым способом, когда данные хранятся в db.

02.09.2008 11:20

Если вы не используете SQL Server 2008 и у вас есть веские причины для помещения определенных файлов изображений в базу данных, тогда вы можете использовать подход «оба» и использовать файловую систему в качестве временного кеша и использовать базу данных в качестве главного репозитория .

Например, ваша бизнес-логика может проверять, существует ли файл изображения на диске перед его обслуживанием, извлекая при необходимости из базы данных. Это дает вам возможность использовать несколько веб-серверов и меньше проблем с синхронизацией.

+1 Это также позволяет вам сохранять исходное изображение, предоставляя кешированную / оптимизированную версию, позволяя позже изменить размер / сжатие

— 29.09.2011 17:51

02.09.2008 18:01

Я предпочитаю хранить пути к изображениям в БД, а изображения - в файловой системе (с помощью rsync между серверами, чтобы все было достаточно актуальным).

Тем не менее, некоторые из моих вещей, связанных с системой управления контентом, нуждаются в изображениях в CMS по нескольким причинам: контроль видимости (так что ресурс удерживается до выхода пресс-релиза), управление версиями, переформатирование (некоторые CMS будут динамически изменять размер для эскизы) и простота использования для связывания изображений на страницах WYSIWYG.

Так что для меня эмпирическое правило - всегда хранить приложения в файловой системе, если только они не управляются CMS.

02.09.2008 20:15

Я бы предпочел файловую систему. Нет необходимости создавать или поддерживать БД с изображениями, это избавит вас от некоторых серьезных проблем в долгосрочной перспективе.

02.09.2008 23:33

Это зависит от количества изображений, которые вы собираетесь хранить, а также от их размеров. Я использовал базы данных для хранения изображений в прошлом, и мой опыт был довольно хорошим.

ИМО, Плюсы использования базы данных для хранения изображений:

A. Вам не нужна структура FS для хранения ваших изображений Б. Индексы базы данных работают лучше, чем деревья ФС, когда нужно хранить большее количество элементов C. Грамотно настроенная база данных хорошо справляется с кэшированием результатов запроса D. Резервные копии просты. Это также хорошо работает, если у вас настроена репликация и контент доставляется с сервера, расположенного рядом с пользователем. В таких случаях явная синхронизация не требуется.

Если ваши изображения будут маленькими (скажем,

Хранение изображений может быть плохой идеей, когда вы имеете дело с небольшим количеством изображений большого размера. Другая проблема с хранением изображений в базе данных заключается в том, что метаданные, такие как создание, даты изменения, должны обрабатываться вашим приложением.

05.09.2008 14:54

В моем текущем приложении я делаю и то, и другое. Когда пользователь определяет изображение, которое нужно прикрепить к записи, я использую ImageMagick, чтобы изменить его размер до подходящего размера для отображения на экране (около 300x300 для моего приложения) и сохранить его в базе данных для облегчения доступа, но затем также скопирую пользовательский исходный файл в общий сетевой ресурс, чтобы он был доступен для приложений, требующих более высокого разрешения (например, для печати).

(Есть еще пара других факторов: Navision будет отображать только BMP, поэтому, когда я изменяю его размер, я также конвертирую в BMP для хранения, а база данных реплицируется на удаленные сайты, где полезно иметь возможность отображать изображение. Печать выполняется только в головном офисе, поэтому мне не нужно копировать исходный файл.)

08.09.2008 23:51

В моем маленьком приложении у меня есть как минимум миллион файлов, по последним подсчетам, весом около 200 ГБ. Все файлы находятся в файловой системе XFS, смонтированной на сервере Linux через iscsi. Пути хранятся в базе данных. используйте какое-то разумное соглашение об именах для ваших путей к файлам и имен файлов.

ИМХО, используйте файловую систему для того, для чего она предназначена - для хранения файлов. Базы данных обычно не дают никаких преимуществ перед стандартной файловой системой при хранении двоичных данных.

15.09.2008 23:27

Вот интересный технический документ по этой теме.

В BLOB или нет: хранилище больших объектов в базе данных или файловой системе

Ответ: «Это зависит от обстоятельств». Конечно, это будет зависеть от сервера базы данных и его подхода к хранилищу BLOB-объектов. Это также зависит от типа данных, хранящихся в больших двоичных объектах, а также от способа доступа к этим данным.

Файлы меньшего размера можно эффективно хранить и доставлять, используя базу данных в качестве механизма хранения. Файлы большего размера, вероятно, лучше всего хранить в файловой системе, особенно если они будут часто изменяться / обновляться. (фрагментация больших двоичных объектов становится проблемой с точки зрения производительности.)

Вот еще один момент, о котором следует помнить. Одной из причин, поддерживающих использование базы данных для хранения больших двоичных объектов, является соответствие ACID. Однако подход, который тестировщики использовали в техническом документе (опция SQL Server с массовым протоколированием), который удвоил пропускную способность SQL Server, фактически изменил букву D в ACID на d, поскольку данные большого двоичного объекта не регистрировались с помощью начальные записи для транзакции. Поэтому, если полное соответствие ACID является важным требованием для вашей системы, уменьшите вдвое показатели пропускной способности SQL Server для записи в базу данных при сравнении файлового ввода-вывода с вводом-выводом больших двоичных объектов базы данных.

17.09.2008 00:28

Лучше всего использовать изображения в хранилище файлов, которые дополняют хранением метаданных в базе данных. С точки зрения веб-сервера, самый быстрый способ обслуживать данные - это указывать на них напрямую. Если он находится в базе данных - ala Sharepoint - у вас есть накладные расходы ADO.Net на его извлечение, потоковую передачу и т. д.

Documentum - хотя и раздутый и сложный - имеет право в том, что файлы находятся в общей папке и доступны для вас, чтобы вы могли определить, как их хранить - диск на сервере, SAN, NAS и т. д. Стратегия Documentum заключается в хранении файлов в виде древовидной структуры путем кодирования папок и имен файлов в соответствии с их первичным ключом в БД. БД становится источником информации о том, какие файлы есть, и обеспечения безопасности. Для систем большого объема этот подход является хорошим решением.

Также учитывайте это при работе с метаданными: если вам когда-нибудь понадобится обновить атрибуты вашего корпуса метаданных, БД - ваш друг, поскольку вы можете быстро выполнять обновления с помощью SQL. С другими системами тегов у вас под рукой нет простых инструментов для работы с данными.

03.10.2008 03:33

Мы реализовали систему визуализации документов, в которой все изображения хранятся в полях BLOB-объектов SQL2005. На данный момент их несколько сотен ГБ, и мы наблюдаем отличное время отклика и незначительное снижение производительности или его отсутствие. Кроме того, в соответствии с нормативными требованиями, у нас есть промежуточный уровень, который архивирует недавно отправленные документы в оптическую систему музыкального автомата, которая представляет их как стандартную файловую систему NTFS.

Мы очень довольны результатами, особенно в отношении:

Легкость репликации и резервного копирования
Возможность легко реализовать систему управления версиями документов

26.10.2008 20:55

Если вы планируете общедоступный веб-сайт, вам не следует выбирать ни один из вариантов. Вам следует использовать сеть доставки контента (CDN). У CDN есть преимущества в цене, масштабируемости и скорости при доставке большого количества статического контента через Интернет.

04.11.2008 23:30

Никто не упомянул, что БД гарантирует атомарные действия, целостность транзакций и имеет дело с параллелизмом. Даже ссылочная целостность выходит за рамки возможностей файловой системы - так как же узнать, что имена ваших файлов действительно верны?

Если у вас есть изображения в файловой системе и кто-то читает файл, когда вы пишете новую версию или даже удаляет файл - что произойдет?

Мы используем большие двоичные объекты, потому что ими проще управлять (резервное копирование, репликация, передача). Они хорошо работают для нас.

Какова вероятность одновременного обновления одного изображения двумя способами?

— 09.04.2009 05:43

вам не нужны одновременные обновления, чтобы возникли проблемы - это может быть чтение и запись. В нашем случае это почти гарантировано.

— 13.04.2009 02:12

28.11.2008 09:33

Недавно я создал приложение PHP / MySQL, которое хранит файлы PDF / Word в таблице MySQL (до сих пор размером 40 МБ на файл).

Плюсы:

Загруженные файлы реплицируются на сервер резервного копирования вместе со всем остальным, отдельная стратегия резервного копирования не требуется (спокойствие).
Настроить веб-сервер немного проще, потому что мне не нужно иметь папку uploads / и сообщать всем моим приложениям, где она находится.
Я могу использовать транзакции для редактирования, чтобы улучшить целостность данных - мне не нужно беспокоиться о потерянных и потерянных файлах

Минусы:

mysqldump теперь занимает очень много времени, потому что в одной из таблиц содержится 500 МБ файловых данных.
В целом не очень эффективна память / процессор по сравнению с файловой системой

Я бы назвал свою реализацию успешной, она заботится о требованиях к резервному копированию и упрощает структуру проекта. Производительность устраивает 20-30 человек, использующих приложение.

08.12.2008 07:31

Я бы выбрал файловую систему, в первую очередь из-за ее большей гибкости. Учтите, что если количество изображений становится огромным, одна база данных может не справиться с этим. С файловой системой вы можете просто добавить больше файловых серверов, предполагая, что вы используете NFS или тип.

Еще одно преимущество подхода с файловой системой - это возможность выполнять некоторые необычные вещи, например, вы можете использовать Amazon S3 в качестве основного хранилища (сохранять URL-адрес в базе данных вместо пути к файлу). В случае сбоя в работе S3 вы возвращаетесь к файловому серверу (это может быть другая запись в базе данных, содержащая путь к файлу). Немного вуду для Apache или любого другого веб-сервера, который вы используете.

09.12.2008 22:51

В местах, где вы ДОЛЖНЫ гарантировать ссылочную целостность и соответствие ACID, требуется хранение изображений в базе данных.

Вы не можете транзакционно гарантировать, что изображение и метаданные об этом изображении, хранящиеся в базе данных, относятся к одному и тому же файлу. Другими словами, невозможно гарантировать, что файл в файловой системе будет изменен только одновременно и в той же транзакции, что и метаданные.

На самом деле нет, можно. Поскольку файлы изображений никогда не удаляются, не изменяются или не перезаписываются после создания, все файлы изображений синхронизируются перед попыткой совершить транзакции, файловая система не повреждена, вы можете быть уверены, что файлы изображений и метаданные синхронизированы. Думаю, для некоторых приложений это слишком много «если».

— 05.11.2010 04:36

Я бы пошел еще дальше и сказал, что с помощью файловой системы ведения журнала и некоторой дополнительной программной логики можно достичь соответствия ACID. Шаги будут записывать запись db, записывать файл. Если файл фиксируется, зафиксируйте транзакцию db.

— 04.08.2011 18:00

20.02.2009 00:28

База данных для данных

Файловая система для файлов

Вы можете сказать это так: не помещайте данные в столбец базы данных, если вы не можете использовать их для условия where или соединения. Это маловероятно для двоичных данных.

— 16.12.2009 17:38

02.03.2009 10:14

Проблема с сохранением только путей к изображениям в базе данных заключается в том, что целостность базы данных больше не может быть нарушена.

Если фактическое изображение, на которое указывает путь к файлу, становится недоступным, в базе данных невольно возникает ошибка целостности.

Учитывая, что изображения являются фактическими данными, которые ищут, и что ими можно легче управлять (изображения не исчезнут внезапно) в одной интегрированной базе данных, вместо того, чтобы взаимодействовать с какой-либо файловой системой (если к файловой системе осуществляется независимый доступ, изображения МОГУТ внезапно «исчезнуть»), я бы сохранил их напрямую как BLOB или что-то в этом роде.

08.04.2009 20:35

Сохранение изображения в базе данных по-прежнему означает, что данные изображения попадают где-то в файловой системе, но скрыты, поэтому вы не можете получить к ним прямой доступ.

+ вес:

целостность базы данных
им легко управлять, так как вам не нужно беспокоиться о синхронизации файловой системы при добавлении или удалении изображения

-ves:

снижение производительности - поиск в базе данных обычно медленнее, чем поиск в файловой системе
вы не можете редактировать изображение напрямую (обрезать, изменять размер)

Оба метода широко распространены и практикуются. Взгляните на преимущества и недостатки. В любом случае вам придется подумать о том, как преодолеть недостатки. Хранение в базе данных обычно означает настройку параметров базы данных и реализацию какого-либо кеширования. Использование файловой системы требует, чтобы вы нашли способ поддерживать синхронизацию файловой системы и базы данных.

18.05.2009 10:36

Предположение: приложение подключено к сети / веб-интерфейс

Я удивлен, что никто не упомянул об этом ... делегируйте это другим специалистам -> использовать стороннего провайдера хостинга изображений / файлов.

Храните файлы в платном онлайн-сервисе, например

Другой поток StackOverflow говорит об этом здесь.

Эта ветка объясняет, почему вам следует использовать стороннего хостинг-провайдера.

Это того стоит. Они хранят это эффективно. Нет загрузки полосы пропускания с ваших серверов на запросы клиентов и т. д.

18.05.2009 17:18

Я почти никогда не храню их в БД. Лучшим подходом обычно является хранение ваших изображений по пути, управляемому центральной переменной конфигурации, и именование изображений в соответствии с таблицей БД и первичным ключом (если возможно). Это дает вам следующие преимущества:

Переместите свои образы на другой раздел или сервер, просто обновив глобальную конфигурацию.
Найдите запись, соответствующую изображению, выполнив поиск по ее первичному ключу.
Ваши изображения доступны для инструментов обработки, таких как imagemagick.
В веб-приложениях ваши изображения могут обрабатываться вашим веб-сервером напрямую (с сохранением обработки).
Инструменты CMS и веб-языки, такие как Coldfusion, могут обрабатывать загрузку изначально.

18.05.2009 17:36

Я работал со многими системами цифрового хранения, и все они хранят цифровые объекты в файловой системе. Они, как правило, используют подход ветвления, поэтому в файловой системе будет дерево архивов, часто начинающееся с года записи, например 2009, подкаталог будет месяц, например 8 августа, следующим каталогом будет день, например 11, а иногда они также будут использовать час, тогда файл будет назван с постоянным идентификатором записи. Использование BLOBS имеет свои преимущества, и я слышал о его частом использовании в ИТ-подразделениях химической промышленности для хранения тысяч или миллионов фотографий и диаграмм. Он может обеспечить более детальную безопасность, единый метод резервного копирования, потенциально лучшую целостность данных и улучшенный поиск между носителями. Oracle имеет для этого множество функций в пакете, который они использовали для вызова Intermedia (я думаю, что сейчас это называется как-то иначе). Файловая система также может иметь детализированную защиту, обеспечиваемую с помощью такой системы, как XACML или другой объект защиты типа XML. См. Примеры в пространстве D в хранилище объектов Fedora.

11.08.2009 15:27

В предыдущем проекте я хранил изображения в файловой системе, и это вызвало много проблем с резервным копированием, репликацией и рассинхронизацией файловой системы с базой данных.

В моем последнем проекте я храню изображения в базе данных и кэширую их в файловой системе, и это работает очень хорошо. Пока у меня проблем не было.

16.12.2009 17:29

Как уже было сказано, «это зависит от обстоятельств». Если предполагается, что хранилище в базе данных будет заменой файловой системы один на один, это может быть не совсем лучший вариант.

Однако, если серверная часть базы данных будет предоставлять дополнительные значения, а не только сериализацию и хранение большого двоичного объекта, тогда это может иметь реальный смысл.

Вы можете взглянуть на WKT Raster, проект, направленный на разработку поддержки растров в PostGIS, который, в свою очередь, служит геопространственным расширением для системы баз данных PostgreSQL. Идея, лежащая в основе WKT Raster, заключается не только в том, чтобы определить формат для сериализации и хранения растров (с использованием системы PostgreSQL), но, что гораздо важнее, чем хранение, - это указать эффективную обработку изображений на стороне базы данных, доступную из SQL. Короче говоря, идея состоит в том, чтобы перенести рабочий вес с клиента на серверную часть базы данных, чтобы он занимал места как можно ближе к самому хранилищу. WKT Raster, как PostGIS, предназначен для приложений определенного домена, ГИС.

Для более полного обзора проверьте интернет сайт и презентация (PDF) системы.

03.02.2010 23:39

Для большое количество маленьких изображений база данных может быть лучше.

У меня было приложение с множеством маленьких эскизов (по 2Кб каждая). Когда я помещал их в файловую систему, каждый из них потреблял 8 КБ из-за размера блока файловой системы. Увеличение площади на 400%!

См. Этот пост для получения дополнительной информации о размере блока: Каков размер блока файловой системы iphone?

17.05.2011 13:15

Если вы используете Teradata, то в Teradata Developer Exchange есть подробная статья о загрузке и получении больших и больших двоичных объектов ..

http://developer.teradata.com/applications/articles/large-objects-part-1-loading

27.09.2011 15:34

Я буду использовать оба решения, я имею в виду ... Я разработаю небольшой компонент (EJB), который будет хранить изображения в БД, а также путь этого изображения на сервер. Эта БД будет обновлена только в том случае, если у нас есть новое изображение или исходное изображение, которое оно обновлено. Затем я также сохраню путь в бизнес-БД.

С точки зрения приложения, я всегда буду использовать файловую систему (получая путь из бизнес-базы данных), и таким образом мы исправим проблему с резервным копированием, а также избежим возможных проблем с производительностью.

Единственная слабость в том, что мы будем хранить одно и то же изображение 2 раза ... Хорошо, что память дешевая, давай!

26.01.2012 20:05

Хранение изображений в БД - да или нет?

Ответы 56

Другие вопросы по теме

Похожие вопросы