Для некоторых профилирований приложений CUDA я вижу, что значение локальной частоты попаданий (метрика local_hit_rate) равно 0%.
Я хочу выделить следующие понятия с этим значением.
Приложение не имеет доступа к локальному кешу.
Все обращения к локальному кешу были пропущены.
Как я могу найти ответ? Поскольку значения inst_compute_ld_st, ldst_issued и ldst_executed не равны нулю, можно ли отбросить первый вопрос? Или есть что-то еще?
Устройство M2000, которое является CC5.3 CC5.2.





nvprof поддерживает как события (необработанные счетчики), так и метрики. Их можно запросить с помощью следующих команд: nvprof --запрос-события nvprof --query-метрики
CC5./6. Метрики локальной памяти
local__request — это количество инструкций, выполняемых в локальной памяти через универсальное адресное пространство или локальное адресное пространство. На СС5./6.* Я не помню, включает ли это полностью предикативные инструкции.
local_*_transactions — это количество обращений к кешу, произошедших из-за размера (32-разрядного, 64-разрядного, ...) запроса и расхождения адресов запроса. Если это не ноль, то доступ к локальной памяти был осуществлен.
l2_local_*_bytes — это количество байтов данных, загружаемых/хранимых в кэш L2.
M2000 не cc5.3