RedDeveloper
Блог
Вопросы
Теги
Топ 50 вопросов про Simd
Коллекция из 50 самых популярных вопросов про
simd
с ответами и комментариями.
Топ 50
Топ 15
Топ 20
Топ 25
Топ 30
Топ 100
Все вопросы
Вопросы на собеседовании
1
Сбой с icc: может ли компилятор изобрести записи там, где их не было в абстрактной машине?
2
Почему GCC генерирует код, который условно выполняет реализацию SIMD?
3
Как векторизовать с помощью gcc?
4
Получить индекс первого элемента, который не равен нулю, в переменной __m256
5
Считайте каждую битовую позицию отдельно по многим 64-битным битовым маскам с AVX, но не с AVX2
6
Constexpr и встроенные функции SSE
7
Почему gcc не разрешает _mm256_loadu_pd как одиночный vmovupd?
8
Почему сохранение и загрузка из 256-битного вектора AVX2 дает разные результаты в режимах отладки и выпуска?
9
Выбор между выровненными или невыровненными инструкциями x86 SIMD
10
Как заставить GCC использовать более двух регистров SIMD при использовании встроенных функций?
11
Почему оба? vperm2f128 (avx) против vperm2i128 (avx2)
12
Объяснение различных типов в Metal и SIMD
13
Почему умножение матриц 4x4 в Eigen происходит более чем в два раза быстрее, чем 3x3?
14
Как преобразовать двоичное целое число в шестнадцатеричную строку?
15
Все ли процессоры, поддерживающие AVX2, также поддерживают SSE4.2 и AVX?
16
Использует ли компилятор инструкции SSE для обычного кода C?
17
Насколько ускорилось преобразование трехмерных математических вычислений в SSE или другие SIMD?
18
Самый быстрый и точный способ преобразования вектора целых чисел в числа с плавающей запятой от 0 до 1
19
Почему GCC не может векторизовать эту функцию и цикл?
20
Код SIMD работает в Debug, но не в Release
21
Для чего используются регистры от 128 до 512 бит?
22
В чем разница между командами сжатия и расширения в AVX-512?
23
Как реализовать эффективный _mm256_madd_epi8?
24
Что вы делаете без быстрого сбора и разброса в инструкциях AVX2?
25
Самый быстрый способ выполнения операций внутреннего продукта AVX со смешанными (плавающими, двойными) входными векторами
26
Битовая строка ascii в 7-битный двоичный объект с использованием SIMD
27
Понимание векторной медленности и производительности Java 17 с оператором pow
28
Быстрое чередование 2 двойных массивов в массив структур с 2 членами с плавающей запятой и 1 членом int (инвариант цикла) с преобразованием SIMD double-> float?
29
Сравните два значения __m128i для общего порядка
30
Можно ли с помощью AVX2 реализовать более быструю обработку LZCNT в массиве слов?
31
Ошибка Clang не исправлялась более 5 лет. Что делать?
32
Перемешивание по маске с Intel AVX
33
Дайте компилятору CLANG утверждение длины цикла
34
Анализатор Intel IACA изменяет сборку?
35
Задержка и пропускная способность инструкций AVX2
36
Программа Simd matmul дает разные числовые результаты
37
ИМТ для создания масок с помощью AVX512
38
Как проверить переполнение при умножении 16-битных целых чисел в SSE?
39
Как преобразовать 32-битное число с плавающей запятой в 8-битный знаковый символ?
40
256-битная векторизация через OpenMP SIMD предотвращает оптимизацию компилятора (скажем, встраивание функции)?
41
Экспоненциальная функция быстрой SSE с низкой точностью с использованием операций двойной точности
42
Подсчитать ведущие нули в слове __m256i
43
SSE: перемешивание (перестановка) целых чисел 4x32
44
Как подсчитать количество вхождений символов с помощью SIMD
45
Сбой операций Metal SIMD Min и Max для поплавков
46
Микроархитектура x86 / доля рынка SIMD
47
Самый последний процессор без поддержки инструкций SSSE3?
48
Можно ли комбинировать Rayon и Faster?
49
Reinterpret_cast <> безопасен или не определен для типов sse / avx?
50
Почему Java SIMD (Панама) медленнее, чем скалярная?