На устройстве с вычислительными возможностями <= 7.2 я всегда использую
nvprof --events shared_st_bank_conflict
но когда я запускаю его на RTX2080ti с CUDA10, он возвращается
Warning: Skipping profiling on device 0 since profiling is not supported on devices with compute capability greater than 7.2
Итак, как я могу определить, есть ли конфликт общих банков памяти на этих устройствах?
Я установил Nvidia Nsight Systems и Nsight Compute, но такого отчета о профилировании не нашел...
спасибо





Похоже, это проблема, и она описана в сообщении это на форумах NVIDIA. По-видимому, это должно поддерживаться с помощью одного из инструментов Nsight (либо CLI, либо UI).
Вы можете использовать --metrics:
Либо
nv-nsight-cu-cli --metrics l1tex__data_bank_conflicts_pipe_lsu_mem_shared_op_ld.sum
для конфликтов при чтении (загрузке) из разделяемой памяти или
nv-nsight-cu-cli --metrics l1tex__data_bank_conflicts_pipe_lsu_mem_shared_op_st.sum
за конфликты при записи (сохранении) в разделяемую память.
вы должны использовать вычисление nsight