Есть ли встроенная функция NumPy или какой-либо подход векторизованный для создания следующих 2D-матриц NumPy для значения n
> 1? Позвольте мне привести несколько примеров для желаемые матрицы для n
, равного 2, 3 и 4.
Один из подходов — построить матрицу из единиц в нижней треугольной части, а затем просто умножить на вектор np.arange(1, n+1)
. Любые другие альтернативы?
import numpy as np
Для n = 2
n = 2
arr = np.array([[1, 0], [2, 2]])
# array([[1, 0],
# [2, 2]])
Для n = 3
n = 3
arr = np.array([[1, 0, 0], [2, 2, 0], [3, 3, 3]])
# array([[1, 0, 0],
# [2, 2, 0],
# [3, 3, 3]])
Для n = 4
n = 4
arr = np.array([[1, 0, 0, 0], [2, 2, 0, 0], [3, 3, 3, 0], [4, 4, 4, 4]])
# array([[1, 0, 0, 0],
# [2, 2, 0, 0],
# [3, 3, 3, 0],
# [4, 4, 4, 4]])
Моя попытка (пример для n = 4
) с использованием вложенных for
циклов. Это работает для любого значения n
> 1:
import numpy as np
n = 4
arr = np.zeros((n, n))
for i in range(n):
for j in range(0, i+1):
arr[i][j] = i+1
# array([[1., 0., 0., 0.],
# [2., 2., 0., 0.],
# [3., 3., 3., 0.],
# [4., 4., 4., 4.]])
Вы можете использовать np.tril
и np.broadcast_to
, чтобы создать начальный вариант arange
.
import numpy as np
n = 4
np.tril(np.broadcast_to(np.arange(1, n+1)[:, None], (n, n)))
array([[1, 0, 0, 0],
[2, 2, 0, 0],
[3, 3, 3, 0],
[4, 4, 4, 4]])
Вот решение с использованием np.where
и трансляции:
x = np.arange(1,n+1)
np.where(x[:,None]>=x,x[:,None],0)
# array([[1, 0, 0, 0],
# [2, 2, 0, 0],
# [3, 3, 3, 0],
# [4, 4, 4, 4]])
Мы могли бы использовать ранжированный массив, умноженный на маску нижнего треугольника —
In [44]: n = 5
In [45]: np.arange(1,n+1)[:,None]*np.tri(n,dtype=bool)
Out[45]:
array([[1, 0, 0, 0, 0],
[2, 2, 0, 0, 0],
[3, 3, 3, 0, 0],
[4, 4, 4, 4, 0],
[5, 5, 5, 5, 5]])
Его легко перенести на numexpr
использование многоядерных процессоров для обработки больших данных, учитывая арифметически-ориентированный характер —
import numexpr as ne
ne.evaluate('A*B',{'A':np.arange(1,n+1)[:,None],'B':np.tri(n,dtype=bool)})
Включая все опубликованные решения здесь.
Сценарий бенчмаркинга -
import numpy as np
import perfplot
import numexpr as ne
def numexpr_range_broadcast(n):
return ne.evaluate('A*B',{'A':np.arange(1,n+1)[:,None],'B':np.tri(n,dtype=bool)})
def where_method(n):
x = np.arange(1,n+1)
return np.where(x[:,None]>=x,x[:,None],0)
perfplot.show(
setup=lambda n: n,
kernels=[
lambda n: where_method(n),
lambda n: np.tril(np.broadcast_to(np.arange(1, n+1)[:, None], (n, n))),
lambda n: np.arange(1,n+1)[:,None]*np.tri(n,dtype=bool),
lambda n: numexpr_range_broadcast(n),
],
labels=['where','tril_broadacast','range_broadcast','numexpr_range_broadcast'],
n_range=[10, 20, 50, 80, 100, 200, 500, 800, 1000, 2000, 5000],
xlabel='n',
logx=True,
logy=True,
)
Выход -
Следовательно, на меньшем n's
чуть раньше 100
, np.where
выигрывает, а на большем n's
светит numexpr
.