Альтернативные источники энтропии

Хорошо, я думаю, это полностью субъективно и еще много чего, но я думал об источниках энтропии для генераторов случайных чисел. Считается, что в большинстве генераторов установлено текущее время, верно? Что ж, мне было любопытно, какие другие источники можно использовать для генерации совершенно правильных, случайных (неопределенное определение) чисел.

Будет ли использование нескольких источников (таких как время + текущее время поиска на жестком диске [мы здесь фантастические]) вместе создать «более случайное» число, чем один источник? Каковы логические пределы количества источников? Сколько на самом деле достаточно? Время выбрано просто потому, что оно удобно?

Извините, если подобное запрещено, но мне любопытна теория, лежащая в основе источников.

RFC 1149.5 определил 4 как стандартное случайное число, проверенное IEEE.

— 19.11.2008 07:20

Девять. Девять. Девять. Девять. .... В этом проблема случайности, никогда нельзя быть уверенным.

— 19.11.2008 06:14

theory random entropy

19.11.2008 05:35

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

4 909

Перейти к ответу Данный вопрос помечен как решенный

Ответы 15

Не беспокойтесь о «хорошем» начальном значении для генератора случайных чисел. Статистические свойства последовательности не зависят от того, как засевается генератор. Но есть и другие вещи. беспокоиться о. См. Подводные камни при генерации случайных чисел.

Что касается аппаратных генераторов случайных чисел, эти физические источники должны быть измерены, и процесс измерения имеет систематические ошибки. Вы можете обнаружить, что «псевдослучайные» числа имеют более высокое качество, чем «реальные» случайные числа.

19.11.2008 05:43

Некоторые используют ввод с клавиатуры (таймауты между нажатиями клавиш), я слышал о том, что я думаю в романе, что можно использовать статический радиоприем, но, конечно, для этого требуется другое оборудование и программное обеспечение ...

19.11.2008 05:44

Ответ принят как подходящий

Статья в Википедии о Аппаратный генератор случайных чисел перечисляет несколько интересных источников случайных чисел с использованием физических свойств.

Мои любимые:

Источник излучения ядерного распада, обнаруженный счетчиком Гейгера, подключенным к компьютеру.
Фотоны проходят через полупрозрачное зеркало. Взаимоисключающие события (отражение - передача) обнаруживаются и связываются со значениями бита «0» или «1» соответственно.
Тепловой шум от резистора, усиленный для создания случайного источника напряжения.
Лавинный шум, создаваемый лавинным диодом. (Как это круто?)
Атмосферный шум, обнаруживаемый радиоприемником, подключенным к ПК

раздел проблем в статье Википедии также описывает хрупкость многих из этих источников / датчиков. Датчики почти всегда производят все меньше случайных чисел по мере их старения / деградации. Эти физические источники должны постоянно проверяться статистическими тестами, которые могут анализировать сгенерированные данные, гарантируя, что инструменты не сломаются бесшумно.

Идея проекта: USB-колесо для хомяка

— 07.02.2009 18:47

технически парочка из них не случайна, они просто на несколько сотен порядков слишком сложны для того, чтобы что-либо смоделировать в следующем, ну скажем, через 100 лет ...

— 26.11.2009 12:02

лавинный шум - это не так круто, как вы думаете. Это относится к свободным электронам, накапливающимся в непроводящих материалах: en.wikipedia.org/wiki/Avalanche_breakdown

— 16.08.2017 20:02

19.11.2008 05:46

SGI однажды использовала фотографии лавовой лампы в различных «фазах шара» в качестве источника энтропии, которая в конечном итоге превратилась в генератор случайных чисел с открытым исходным кодом под названием LavaRnd.

19.11.2008 05:53

Я использую Random.ORG, они предоставляют бесплатные случайные данные из атмосферного шума, которые я использую для периодического повторного заполнения ГСЧ Мерсена-Твистера. Он настолько случайный, насколько это возможно, без каких-либо аппаратных зависимостей.

19.11.2008 05:55

Ядро Linux использует время прерывания устройства (мышь, клавиатура, жесткие диски) для генерации энтропии. В Википедии есть хороший статья по энтропии.

19.11.2008 06:06

Я использовал программу шифрования, которая использовала движения мыши пользователя для генерации случайных чисел. Единственная проблема заключалась в том, что программе приходилось делать паузу и просить пользователя случайным образом перемещать мышь в течение нескольких секунд для правильной работы, что не всегда было практичным.

19.11.2008 06:14

Я нашел HotBits несколько лет назад - числа получены в результате радиоактивного распада, на самом деле числа случайный.

Существуют ограничения на количество номеров, которые вы можете загрузить в день, но меня всегда забавляло использовать их как действительно, действительно случайные начальные числа для ГСЧ.

19.11.2008 06:20

Современные ГСЧ проверяются на корреляции в соседних семенах и запускаются через несколько сотен итераций после посева. Итак, к сожалению, скучный, но верный ответ заключается в том, что на самом деле это не имеет большого значения.

Вообще говоря, использование случайных физических процессов должно быть проверено, чтобы они соответствовали однородному распределению, и в противном случае они не имеют тенденций.

На мой взгляд, часто лучше использовать хорошо изученный генератор псевдослучайных чисел.

19.11.2008 06:29

Некоторые «микросхемы» TPM (Trusted Platform Module) имеют аппаратный ГСЧ. К сожалению, TPM (Broadcom) в моем ноутбуке Dell лишен этой функции, но многие компьютеры, продаваемые сегодня, поставляются с аппаратным ГСЧ, который использует действительно непредсказуемые квантово-механические процессы. Intel реализовала разновидность теплового шума.

Кроме того, не используйте только текущее время для заполнения ГСЧ в криптографических целях или в любом приложении, где важна непредсказуемость. Использование нескольких младших битов того времени в сочетании с несколькими другими источниками, вероятно, нормально.

аналогичный вопрос может быть вам полезен.

19.11.2008 22:22

Шум в верхней части спектра космического микроволнового фона. Конечно, вы должны сначала удалить некоторую анизотропию, объекты переднего плана, коррелированный шум детектора, галактические и локальные групповые скорости, поляризации и т. д. Многие ловушки остаются.

19.11.2008 22:40

Don't worry about a "good" seed for a random number generator. The statistical properties of the sequence do not depend on how the generator is seeded.

Я не согласен с Совет Джона Д. Кука. Если вы запустите Mersenne Twister со всеми битами, установленными в ноль, кроме единицы, он изначально будет генерировать числа, которые не являются случайными. Генератору требуется много времени, чтобы преобразовать это состояние во что-либо, что могло бы пройти статистические тесты. Простая установка первых 32 бита генератора в начальное число будет иметь аналогичный эффект. Кроме того, если все состояние установлено на ноль, генератор будет производить бесконечные нули.

Правильно написанный код ГСЧ будет иметь правильно написанный алгоритм заполнения, который принимает, скажем, 64-битное значение и заполняет генератор, чтобы он выдавал приличные случайные числа для каждого возможного ввода. Так что, если вы используете надежную библиотеку, подойдет любое семя. Но если вы собираете свою собственную реализацию, вам нужно быть осторожным.

07.02.2009 17:59

Источник семян не так уж и важен. Более важным является алгоритм генератора псевдо-чисел. Однако некоторое время назад я слышал о генерации семян для некоторых банковских операций. Они объединили множество факторов:

время
температура процессора
скорость вентилятора
напряжение процессора
Больше не помню :)

Даже если некоторые из этих параметров не сильно меняются со временем, вы можете поместить их в какую-нибудь хорошую функцию хеширования.

Как сгенерировать хорошее случайное число?

Может быть, учесть бесконечное количество вселенных? Если это правда, что все время создаются новые параллельные вселенные, мы можем сделать что-то вроде этого:

int Random() {
    return Universe.object_id % MAX_INT;
}

В любой момент мы должны быть на другой ветви параллельных вселенных, поэтому у нас должны быть разные id. Проблема только в том, как получить объект Universe :)

07.02.2009 18:40

Как насчет того, чтобы отделить поток, который будет манипулировать некоторой переменной в жестком цикле в течение фиксированного промежутка времени, прежде чем он будет уничтожен. То, что вы получите, будет зависеть от скорости процессора, загрузки системы и т.д ... Очень странно, но лучше, чем просто srand (time (NULL)) ...

10.12.2009 02:35

Извините, что опаздываю на это обсуждение (сколько сейчас 3,5 года?), Но у меня возродился интерес к генерации PRN и альтернативным источникам энтропии. Разработчик ядра Linux Расти Рассел недавно обсудил свой блог об альтернативных источниках энтропии (кроме /dev/urandom).

Но я не очень впечатлен его выбором; MAC-адрес сетевого адаптера никогда не меняется (хотя он уникален от всех остальных), а PID кажется слишком маленьким для возможного размера выборки.

Я пробовал Мерсенн Твистер (на моем Linux-боксе), который засевается следующим алгоритмом. Прошу комментариев / отзывов, если кто-то желает и заинтересован:

Создайте буфер массива из 64 бит + 256 бит * количество файлов /proc ниже.
Поместите значение счетчика меток времени (TSC) в первые 64 бита этого буфера.
Для каждого из следующих файлов /proc вычислите сумму SHA256:
- /proc/meminfo
- /proc/self/maps
- /proc/self/smaps
- /proc/interrupts
- /proc/diskstats
- /proc/self/stat
  Поместите каждое 256-битное хеш-значение в отдельную область массива, созданного в (1).
Создайте хеш SHA256 всего этого буфера. ПРИМЕЧАНИЕ: Я мог бы (и, вероятно, должен) использовать другую хеш-функцию, полностью независимую от SHA-функций - этот метод был предложен в качестве «защиты» от слабых хэш-функций.

Теперь у меня есть 256 бит случайных (достаточных) данных энтропии С НАДЕЖДОЙ для засева моего Mersenne Twister. Я использую приведенное выше, чтобы заполнить начало массива MT (624 32-битных целых числа), а затем инициализировать оставшуюся часть этого массива кодом автора MT. Кроме того, я мог использую другую хеш-функцию (например, SHA384, SHA512), но мне понадобится буфер массива другого размера (очевидно).

Исходный код Mersenne Twister требовал одного 32-битного начального числа, но я считаю, что этого недостаточно. Запуск «всего лишь» 2 ^ 32-1 различных МТ в поисках взлома криптовалюты не выходит за рамки практической возможности в наши дни.

Я хотел бы прочитать чьи-либо отзывы по этому поводу. Критика более чем приветствуется. Я буду защищать свое использование файлов /proc, как указано выше, потому что они постоянно меняются (особенно файлы /proc/self/*, и TSC всегда дает другое значение (наносекундное [или лучшее] разрешение, IIRC). Я запускал Несгибаемые испытания для этого ( на мелодию из нескольких сотен бит миллиард), и, похоже, он проходит успешно.Но это, вероятно, больше свидетельствует о надежности Mersenne Twister как ГПСЧ, чем о том, как я его засеваю.

Конечно, они не защищены от взлома полностью, но я просто не вижу, чтобы все они (и SHA *) были взломаны на и за всю мою жизнь.

Я знаю, что опаздываю на ваш ответ на 6 лет, но я думаю, что ваш подход слишком сложен. Если вы не хотите использовать / dev / urandom для заполнения вашего PRNG (что вам ВСЕГДА следует), вы можете просто прочитать / proc / sys / kernel / random / uuid три раза, хешировать три результата с помощью SHA-256, и используйте это как свое семя. Каждый из них представляет собой UUID типа 4, который обеспечивает 122-битную энтропию. Таким образом, два UUID предоставляют только 244 бита, поэтому вы должны собрать три и хэшировать с помощью SHA-256. Это лучший подход, потому что / proc / sys / kernel / random / uuid генерируется с помощью / dev / urandom, что является криптографически безопасным.

— 09.08.2018 19:27

18.04.2012 05:33