Сравните два логических массива с учетом допуска

У меня есть два логических массива first и second, которые должны быть практически равны (вплоть до tolerance). Я хотел бы сравнить их так, чтобы не было различий в некоторых элементах.

Что-то вроде np.array_equal(first, second, equal_nan=True) слишком строго, поскольку все значения должны быть одинаковыми, а np.allclose(first, second, atol=tolerance, equal_nan=True) не подходит для сравнения логических значений.

Следующий случай должен быть успешным:

tolerance = 1e-5
seed = np.random.rand(100, 100, 100)
first = seed > 0.5
second = (seed > 0.5) & (seed < 1. - 1e-6) # 99.9999% overlap in true elements

Следующий случай должен завершиться неудачей:

first = seed > 0.5
second = (seed > 0.5) & (seed < 1. - 1e-4) # 99.99% overlap in true elements

Следующий случай также должен завершиться неудачей:

first = seed > 0.5
second = first[::-1] # first.sum() == second.sum(), but they are not similar

Как я могу справиться с этим случаем элегантным образом?

np.mean(first != second) < 1e-6)?
Quang Hoang 28.08.2024 17:17
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
3
1
105
2
Перейти к ответу Данный вопрос помечен как решенный

Ответы 2

Вы можете определить собственное соответствующее сравнение близости:

def close(a, b, tol):
    diff = a != b
    return np.sum(diff) <= tol * np.size(diff)

Это оценит соотношение неравных элементов к размеру массивов и, таким образом, даст желаемую относительную меру близости. В частности, он вернет True для первого примера и False для остальных.

Некоторые примечания:

  • Текущее решение неявно допускает вещание; т. е. если формы a и b не совпадают, но совместимы в смысле трансляции, то результатом будет результат транслируемого поэлементного сравнения. Если вы хотите явно запретить трансляцию (т. е. разрешить только массивы совпадающих фигур), вам следует включить явную проверку соответствия фигур (которую я изначально включил, но позже удалил из ответа).

  • Текущее решение неявно требует, чтобы a и b были массивами NumPy, поскольку предполагается, что a != b будет производить поэлементное сравнение. Если вы хотите сделать его совместимым с другими типами данных Python, например со списками, вы можете заменить a != b на np.equal(a, b).

  • Текущее решение дает результат np.bool. Если вместо этого вы хотите иметь собственное логическое значение, вы можете заключить возвращаемое значение в bool(…) или (…).item().

Ответ принят как подходящий

Ответ Саймона был довольно близок к тому, что мне нужно. Однако я предпочел использовать метрику перекрытия объёмов (например, dice и IoU) вместо нормализации по размеру воксела. Диапазон Dice и IoU [0, 1], что в данном случае довольно удобно: 0 означает отсутствие перекрытия, а 1 — идеальное перекрытие.

Реализация кубика:

tolerance = 1e-5
dice = 2 * (first & second).sum() / (first.sum() + second.sum())
if 1 - dice > tolerance:
    raise

Реализация IoU:

iou = (first & second).sum() / (first | second).sum()
if 1 - iou > tolerance:
    raise 

Я рад, что вы нашли подходящий ответ, а также поделились им. Оглядываясь назад, я, вероятно, должен был сделать вывод из вашего упоминания «вокселей» в исходном вопросе (который с тех пор был отредактирован @mkrieger1), что вы на самом деле искали перекрывающуюся метрику :)

simon 29.08.2024 14:50

Небольшая оптимизация для корректной обработки случая нулевого знаменателя (таким образом, отсутствие истинных вокселей в перекрытии, что в настоящее время вызывает предупреждение во время выполнения из-за деления на ноль): вы можете эквивалентно переформулировать 1 - numerator / denominator > tolerance как (1 - tolerance) * denominator > numerator. Например. в случае IoU это будет (1 - tolerance) * (first | second).sum() > (first & second).sum().

simon 29.08.2024 15:02

Другие вопросы по теме