RedDeveloper
Блог
Вопросы
Теги
Топ 30 вопросов про Simd
Коллекция из 30 самых популярных вопросов про
simd
с ответами и комментариями.
Топ 30
Топ 15
Топ 20
Топ 25
Топ 50
Топ 100
Все вопросы
Вопросы на собеседовании
1
Сбой с icc: может ли компилятор изобрести записи там, где их не было в абстрактной машине?
2
Почему GCC генерирует код, который условно выполняет реализацию SIMD?
3
Как векторизовать с помощью gcc?
4
Получить индекс первого элемента, который не равен нулю, в переменной __m256
5
Считайте каждую битовую позицию отдельно по многим 64-битным битовым маскам с AVX, но не с AVX2
6
Constexpr и встроенные функции SSE
7
Почему gcc не разрешает _mm256_loadu_pd как одиночный vmovupd?
8
Почему сохранение и загрузка из 256-битного вектора AVX2 дает разные результаты в режимах отладки и выпуска?
9
Выбор между выровненными или невыровненными инструкциями x86 SIMD
10
Как заставить GCC использовать более двух регистров SIMD при использовании встроенных функций?
11
Почему оба? vperm2f128 (avx) против vperm2i128 (avx2)
12
Объяснение различных типов в Metal и SIMD
13
Почему умножение матриц 4x4 в Eigen происходит более чем в два раза быстрее, чем 3x3?
14
Как преобразовать двоичное целое число в шестнадцатеричную строку?
15
Все ли процессоры, поддерживающие AVX2, также поддерживают SSE4.2 и AVX?
16
Использует ли компилятор инструкции SSE для обычного кода C?
17
Насколько ускорилось преобразование трехмерных математических вычислений в SSE или другие SIMD?
18
Самый быстрый и точный способ преобразования вектора целых чисел в числа с плавающей запятой от 0 до 1
19
Почему GCC не может векторизовать эту функцию и цикл?
20
Код SIMD работает в Debug, но не в Release
21
Для чего используются регистры от 128 до 512 бит?
22
В чем разница между командами сжатия и расширения в AVX-512?
23
Как реализовать эффективный _mm256_madd_epi8?
24
Что вы делаете без быстрого сбора и разброса в инструкциях AVX2?
25
Самый быстрый способ выполнения операций внутреннего продукта AVX со смешанными (плавающими, двойными) входными векторами
26
Битовая строка ascii в 7-битный двоичный объект с использованием SIMD
27
Понимание векторной медленности и производительности Java 17 с оператором pow
28
Быстрое чередование 2 двойных массивов в массив структур с 2 членами с плавающей запятой и 1 членом int (инвариант цикла) с преобразованием SIMD double-> float?
29
Сравните два значения __m128i для общего порядка
30
Можно ли с помощью AVX2 реализовать более быструю обработку LZCNT в массиве слов?