Выполняет ли метод Java hashCode как преобразование, так и сжатие?

Другими словами, является ли целое число, возвращаемое hashCode(), уже индексом записи в хеш-таблице, или ему нужно сделать еще один шаг, сжав себя до индекса (возможно, изменяя длину таблицы)?

Нет. Хеш-таблицы почти всегда имеют гораздо меньше сегментов, чем 2 ^ 32. Исходный код JDK поставляется вместе с JDK. Почему вы не читаете исходный код (или даже просто документацию)?

— 25.06.2018 23:16

Учитывая, что вы можете поместить один и тот же объект в две (или более) хеш-таблицы разного размера (или нулевые хеш-таблицы), индекс какой таблицы, по вашему мнению, вернет метод hashCode?

— 25.06.2018 23:19

java hash hashmap hashcode hash-function

25.06.2018 23:13

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

Как вычислять биты и понимать побитовые операторы в Java - объяснение с примерами

В компьютерном программировании биты играют важнейшую роль в представлении и манипулировании данными на двоичном уровне. Побитовые операции...

Поднятие тревоги для долго выполняющихся методов в Spring Boot

Приходилось ли вам сталкиваться с требованиями, в которых вас могли попросить поднять тревогу или выдать ошибку, когда метод Java занимает больше...

Принятие принципов SOLID в Spring Boot: Создание обслуживаемых и масштабируемых приложений

Коллекции (ArrayList , HashSet , HashMap)

Полный курс Java для разработчиков веб-сайтов и приложений

Получите сертификат Java Web и Application Developer, используя наш курс.

Ответы 1

Нет, хэш-коды вычисляются независимо от целевой хеш-таблицы. Хэш-код целого числа, например, является самим целым числом, поэтому хеш-таблице, как правило, потребуется снова выполнить хеш-код мода, чтобы поместить его в таблицу.

Тогда кажется, что метод hashCode не может гарантировать отсутствие коллизий, потому что два хэш-кода из двух разных объектов могут быть сжаты в один и тот же индекс таблицы (например, hashcode1 = 7, hashcode2 = 14, tableLength = 7, поэтому idx1 = idx2 = 0). Если да, то в чем смысл хэш-кодов?

— 25.06.2018 23:26

Чтобы сделать коллизии невероятно, или хотя бы как можно более маловероятными. Каждая реализация хеш-таблицы должна иметь дело с коллизиями, вы просто пытаетесь их уменьшить.

— 25.06.2018 23:28

@OneFlowerOneWorld более того, вы, кажется, думаете, что хэш-коды уникальны. Это не так. Многие объекты имеют одинаковый хэш-код.

— 25.06.2018 23:33

@OneFlowerOneWorld существует 2 ^ 64 различных значения Long, но только 2 ^ 32 возможных хэш-кода. Просто должно быть столкновение.

— 25.06.2018 23:42

@JBNizet Думаю, я запутался больше. Тогда для чего нужен hashCode() и как сделать так, чтобы объекты моего собственного класса можно было использовать в качестве ключей HashMap?

— 25.06.2018 23:43

Вы реализуете hashCode () и equals (), как описано в документации, и делаете свой класс неизменяемым. Опять же, hashCode используется для уменьшения количества элементов для сравнения при поиске. Представьте, что у вас есть 500 ключей, хранящихся в 100 разных корзинах (что является довольно плохим распределением хешей). Получается 5 ключей на ведро. Итак, чтобы узнать, существует ли ключ K в хэш-таблице, вам нужно только сравнить его с 5 другими ключами (5 ключей в корзине, выбранной хэш-кодом K). Это в 100 раз эффективнее, чем сравнение с 500 другими ключами.

— 25.06.2018 23:50

При приличном распределении хешей у вас обычно есть 0 или 1 ключ на ведро, что делает поиск очень быстрым. Возвращаясь к уникальности хэш-кодов: это простая логическая проблема: существует только 2 ^ 32 возможных хэш-кода. Взять хотя бы лонги: их 2 ^ 64. Очевидно, что многие из них имеют один и тот же хэш-код. Но вы обычно храните только несколько экземпляров Long на карте, и поэтому вероятность столкновения намного меньше.

— 25.06.2018 23:51

@JBNizet Таким образом, разные хэш-коды не обязательно приводят к разным корзинам, но одни и те же хэш-коды связаны с доступом к одной и той же корзине, и поэтому мы должны сделать хэш-коды для разных объектов (отличающихся методом equals) разными, чтобы уменьшить вероятность коллизий (хотя нет -коллизия не гарантируется)? А экземпляр Integer со значением 65536 не обязательно находится в 65536-м ведре (это зависит от длины таблицы)?

— 26.06.2018 00:23

25.06.2018 23:17