Матрица из Excel в Python

Я пишу программу Python, которая импортирует квадратную матрицу из листа Excel и выполняет с ней некоторую работу NumPy. Пока что похоже, что OpenPyXl - лучший способ передать данные из файла XLSX в среду Python, но неясно, как лучше всего превратить эти данные из кортежа кортежей * ссылок на ячейки в массив фактических значений. которые находятся в таблице Excel. * создается путем вызова sheet_ranges = wb['Sheet1'], а затем mat = sheet_ranges['A1:IQ251']

Конечно, я мог бы проверить размер кортежа, написать вложенный цикл for, проверить каждый элемент каждого кортежа в кортеже и заполнить массив.

Но разве нет лучшего способа?

Я бы порекомендовал заглянуть в библиотеку панд. Вот ссылка на документацию pandas, которая содержит 10-минутное руководство по использованию пакета. pandas.pydata.org/pandas-docs/stable/10min.html

rs311 16.11.2018 18:28

Вы можете использовать свойство values, поэтому вам не нужно извлекать их вручную.

Charlie Clark 16.11.2018 20:34

@CharlieClark, я пробовал использовать values, но, насколько я мог судить, он говорил мне, что я могу взять с собой только один скаляр за раз, а не матрицу.

Post169 19.11.2018 16:35

См. openpyxl.readthedocs.io/en/latest/…

Charlie Clark 19.11.2018 17:45
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
0
4
2 279
1

Ответы 1

Как отмечалось выше, идеальным решением является использование фрейма данных pandas. Например:

import pandas as pd

dataframe = pd.read_excel("name_of_my_excel_file.xlsx")

print(dataframe)

Просто pip install pandas, а затем запустите приведенный выше код, заменив только name_of_my_excel_file полным путем к вашему файлу Excel. Затем вы можете перейти к функциям Pandas, например, для глубокого анализа ваших данных. См. Документы на здесь!

Спасибо! Это очень похоже на то, что я хочу, за исключением одного момента. Он пропускает некоторые строки и столбцы, я почти уверен, что это потому, что они содержат только нули. Есть ли способ сказать ему различать нули и пустые ячейки?

Post169 16.11.2018 19:08

Не могли бы вы прислать мне пример ваших таблиц?

Pedro Martins de Souza 16.11.2018 19:48

Я хочу скопировать это в Python в виде массива без пропущенных строк или столбцов. Если вы посмотрите на связанный файл Excel, две верхние строки и крайний левый столбец - все нули и отсутствуют во фрейме данных, созданном dataframe = pd.read_excel('SPM_FITS.xlsx').

Post169 19.11.2018 16:33

Исправление: недостающие строки и столбцы не обязательно должны быть нулями. Остались все нулевые строки и столбцы, но все еще отсутствуют некоторые строки и столбцы. Сейчас все сложнее, чем я думал.

Post169 19.11.2018 17:02

Другие вопросы по теме