Как получить первый символ всех значений из массива numpy (в форме (n, m)), заполненного строками

Итак, у меня есть большой массив в форме (n, m), заполненный строками. Небольшой пример:

string_array = np.array([
    ['hello', 'world'],
    ['greetings', 'all'],
    ['merry', 'christmas']
])

Мне нужны все первые символы каждой строки, но по какой-то причине у меня возникают проблемы. Моим первым предположением было бы использовать:

>>> string_array[:, :][0]

Что не сработало, потому что я просто беру первую строку из своей матрицы. Я хочу, чтобы результат, который вы получите, когда вы используете

>>> string_array[0, 0][0]
>>> 'h'

Но теперь для каждого элемента в моем массиве? Конечно, мне бы хотелось решение без циклов. Просто для ясности, я хочу следующее:

array([
    ['h', 'w'],
    ['g', 'a'],
    ['m', 'c']
])

Отвечает ли это на ваш вопрос? Извлеките первую букву из каждой строки в массиве numpy

Shahroozevsky 14.12.2020 12:08
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
1
1
1 024
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Вы можете использовать np.vectorize

>>> np.vectorize(lambda s: s[0])(string_array)
array([['h', 'w'],
       ['g', 'a'],
       ['m', 'c']], dtype='<U1')

Хотя обратите внимание, что np.vectorize на самом деле не «векторизует», а применяет функцию к массиву в цикле.

Редактировать: Похоже, этот вопрос уже задавали и есть хороший анализ производительности других подходов.

Спасибо за быстрый ответ. Так что в основном это скрытый цикл for? Редактировать: из документации vectorize: «Векторизованная функция оценивает pyfunc по последовательным кортежам входных массивов, как функция карты python, за исключением того, что она использует правила вещания numpy». Так что на самом деле это не скрытый цикл for, поскольку он использует широковещательную передачу numpy (если я правильно понимаю).

GroenteLepel 14.12.2020 11:56

Да в значительной степени. Однако похоже, что есть и другие хорошие способы сделать это: ссылка Я добавлю это к своему ответу.

ssp 14.12.2020 11:58

О, спасибо, что нашли это! Это не всплывало в моем поиске Google заранее.

GroenteLepel 14.12.2020 12:00
np.vectorize может на самом деле не использовать уровень Python для циклов, но скорость обычно хуже. Обычно используется np.frompyfunc, но с некоторой дополнительной общностью. Суть в том, что он не компилирует функцию lambda; это вызов один раз для каждого элемента ввода.
hpaulj 14.12.2020 18:19

Другие вопросы по теме