Преобразование в части ASCII numpy/pandas, а затем обратное преобразование

У меня есть фрейм данных numpy или pandas, который содержит в большинстве ячеек числовые значения, с другой стороны, есть запасные значения символов (они не основаны на столбцах, поэтому я не могу использовать кодировщик меток). Я ищу метод для преобразования этих разреженных значений символов, которые могут быть где угодно, в их код ASCII, чтобы передать массив в модели глубокого обучения. После этого мне нужно знать, какие из них были преобразованы, чтобы я мог преобразовать их обратно в символы. Любая идея будет высоко оценена!

Примерными значениями могут быть (1,2,f,5,3) в строке 1 и (7,k,1,j,9) в некоторой строке k. Это в массиве numpy или в фрейме данных pandas. Вопрос в том, как мне закодировать буквы в ascii, чтобы были цифры, а потом как их обратно декодировать?

Пожалуйста, уточните вашу конкретную проблему или предоставьте дополнительную информацию, чтобы выделить именно то, что вам нужно. Как сейчас написано, трудно точно сказать, о чем вы спрашиваете.

Community 18.03.2022 14:25

Это просто: примерные значения могут быть (1,2,f,5,3) в строке 1 и (7,k,1,j,9) в некоторой строке k. Это в массиве numpy или в фрейме данных pandas. Вопрос в том, как я могу кодировать буквы в ascii, чтобы иметь числа, а затем как их декодировать обратно?

Daia Alexandru 18.03.2022 14:50
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
0
2
43
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Возможным решением может быть использование ord() и chr() для кодирования и декодирования ваших символов с использованием «целого числа, представляющего кодовую точку Unicode этого символа».

>>> df
  characters
0          f
1          k
>>> df["encoded"] = df["characters"].apply(ord)
>>> df["encoded"]
0    102
1    107
>>> df["decoded"] = df["encoded"].apply(chr)
>>> df["decoded"]
0    f
1    k

Нет определенного столбца, в котором хранятся только символы. В столбце могут быть как целые числа, так и символы.

Daia Alexandru 18.03.2022 17:40

Другие вопросы по теме