Как хеш-функции кодируют бесконечное количество данных в конечное количество?

Хеш-функции всегда создают выходные данные фиксированной длины, даже если входные данные могут быть бесконечно большими.

Так как же возможно, что здесь не теряется никакая информация? Тогда разве некоторые входные данные не должны давать одинаковый результат?

hash information-theory

08.04.2018 00:35

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

179

Перейти к ответу Данный вопрос помечен как решенный

Ответы 2

Ответ принят как подходящий

Да. Два входа могут привести к одному и тому же выходу, что приведет к конфликту хешей.

Хеши спроектированы таким образом, что хеширование текста очень легко, но изменить процесс вспять сложно. Смысл хеширования не в хранении информации. Вместо этого в системе безопасности обычно используются хеши (а также структуры данных).

Например, веб-сайты будут хешировать пароли пользователей и хранить хеши вместо физических паролей. Таким образом, если безопасность веб-сайта нарушена, злоумышленник может получить только хэши, которые по-прежнему не позволяют злоумышленнику войти в систему, поскольку очень сложно реконструировать пароль.

Хеш-набор - еще одно применение хеширования. Хешируя объект и сохраняя только хеши, вы можете проверить, присутствует ли объект в наборе или нет в постоянное время. Вам нужно только выполнить поиск по всем объектам в наборе хешей, которые имеют тот же хэш, что и проверяемый объект. По мере роста размера хеш-набора увеличивается и вероятность хеш-коллизии.

То есть вы действительно могли бы использовать два или более паролей для входа в систему, если проверка пароля выполняется с помощью хеш-ключей?

— 08.04.2018 00:38

Да, но вероятность того, что два хеша точно совпадают для хорошего алгоритма хеширования, почти равна нулю.

— 08.04.2018 00:39

08.04.2018 00:37

So how is it possible, that no information is lost here?

Это невозможно, и много информации теряется.

В случае идеального хэша коллизии нет, и мы можем даже утверждать, что информация на самом деле не потеряна (она просто не содержится только в системе), потому что мы знаем все возможные входные данные и знаем, что в созданных хэшах нет коллизий, но их можно использовать в качестве индекса, что невозможно или не так хорошо с входными данными, поэтому они полезны.

В случае коллекции на основе хешей мы используем хэш-код, чтобы (надеюсь) иметь несколько коллизий, поэтому мы приближаемся к поиску O (1), но у нас есть некоторые средства для его обработки, если коллизия все же произойдет.

В случае криптографического хеша у нас могут быть коллизии, но это крайне сложно сделать сознательно по тем же (грубо говоря) причинам, почему сложно взломать современную криптографию, поэтому, хотя у вас может быть два пароля с одним и тем же хешем, вы не могли найти его нелегко (особенно если вы, например, не собираетесь иметь пароль на несколько тысяч страниц текста).

В случае хэша контрольной суммы у нас могут быть коллизии, но их маловероятность означает, что если у нас есть коррупция, у нас, вероятно, не будет совпадающего хэша.

08.04.2018 00:43

Другие вопросы по теме

Кодирование Фибоначчи

Оптимальный алгоритм кодирования данных в уже существующих данных

Как рассчитывается sklearn jaccard_score?

Поиск условной взаимной информации из 3 дискретных переменных

Измерение вклада новой выборки в разнообразие набора данных

Условная взаимная информация

Любая теория информации поможет мне сгруппировать наборы данных без визуальной проверки?

Как подогнать регрессию информации (отрицательную энтропию) к размеру в R?

Всегда ли кросс-энтропия больше энтропии?

Почему учебник по mdentropy выдает ошибку в scikit-learn / sklearn / cluster / k_means_.py?

Как хеш-функции кодируют бесконечное количество данных в конечное количество?

Ответы 2

Другие вопросы по теме

Похожие вопросы