Я пытаюсь написать эффективный код времени выполнения, используя класс Eigen::Matrix. Я знаю, что для улучшения времени выполнения рекомендуется изменить размер Eigen::Matrix таким образом, чтобы было выделено достаточно памяти и, таким образом, удалось избежать перераспределения. Однако я не знаю ни количества строк ни во время компиляции, ни при инициализации матрицы. Что я хочу сделать, так это использовать матрицу динамического размера, выделить память с известным верхним пределом, затем заполнить некоторые данные в матрице и, наконец, «отрезать/изменить» нижние строки, которые мне не нужны.
Итак, моя проблема выглядит так, за исключением того, что память, которую я выделяю, намного больше, чем (5,3)
Eigen::MatrixXi M;
M.resize(5,3);
std::cout << "M size: (" << M.rows() << "x" << M.cols()<< " ) with Entries:\n"<< M << std::endl;
M.row(0) = Eigen::RowVector3i(1, 1, 1);
M.row(1) = Eigen::RowVector3i(2, 2, 2);
M.row(2) = Eigen::RowVector3i(3, 3, 3);
//M.reshape(3, 3); ??
std::cout << "M size: (" << M.rows() << "x" << M.cols() << " ) with Entries:\n" << M << std::endl;
Я знаю, что следующий код будет работать, но этот фрагмент включает перераспределение новой памяти, а не просто «освобождение» нижних строк M или переназначение памяти M;
// works but inefficient
Eigen::MatrixXi M2;
M2.resize(3, 3);
M2 = M.topRows(3);
Есть ли у вас какие-либо идеи о том, как я могу реализовать эту идею более эффективно?
Прежде всего, если вы добавляете записи построчно, может быть более эффективно использовать матрицу по строкам. Кроме того, если во время компиляции известно, что количество столбцов равно 3, вы можете выразить это в виде:
typedef Eigen::Matrix<int, Eigen::Dynamic, 3, Eigen::RowMajor> MatrixRX3i;
MatrixRX3i M;
M.resize(5,3);
Если вы не возражаете, что вся память M
сохраняется все время, вы можете определить M2
как объект Eigen::Ref
:
Eigen::Ref<MatrixRX3i> M2(M.topRows(3));
Если вы хотите освободить ненужную память, вы должны использовать conservativeResize()
:
M.conservativeResize(3,3);
В идеале это должно просто вызвать std::realloc
(в случае, если внутреннее измерение не изменится), хотя могут быть некоторые угловые случаи, связанные с выравниванием.
Что касается размеров времени компиляции: с одной стороны, это «хороший стиль», но он позволяет Eigen разворачивать небольшие циклы. Действительно ли это имеет значение в вашем случае, зависит от множества факторов, так что просто попробуйте и решите сами...
Хорошо, я не знал о развертывании цикла, но это звучит разумно. Я попробую и отследю время выполнения.
Спасибо за подробную информацию. Я думаю, что это отвечает на мой вопрос, и теперь я буду работать с этим! Есть ли фактическое увеличение производительности, когда я определяю известное измерение во время компиляции, даже если другое является динамическим или это просто какой-то «хороший стиль»?