import pandas as pd
data_xls=pd.read_excel('/users/adam/abc.xlsx',index=False)
data_xls.to_csv('def.csv,encoding='utf-8')
Также пробовал:
data_xls=pd.read_excel('/users/adam/abc.xlsx',index_col=False)
data_xls=pd.read_excel('/users/adam/abc.xlsx',index=None)
data_xls=pd.read_excel('/users/adam/abc.xlsx',index_col=None)
Фактический выход:
Name Age
0 Adam 24
1 Steve 25
2 Jhon 23
Ожидаемый результат:
Name Age
Adam 24
Steve 25
Jhon 23
Есть ли способ, если я могу отбросить столбец индекса перед вставкой данных в таблицу куста?
Используйте метод Dataframe.drop()
, чтобы отбросить любую строку или столбец. Проверьте еще здесь.
@pault Я делаю это в pyspark, и этот файл будет использоваться для загрузки данных в таблицу Hive.
@ saketk21, я проигнорировал индекс при преобразовании моего файла из xlsx в csv. data_xls.to_csv ('def.csv, encoding =' utf-8 ', index = False)
Это тоже работает.
при записи файла вы можете использовать следующий код, если вы не хотите, чтобы pandas записывал столбец индекса в файл csv
pd.to_csv('your.csv', index=False)
Кроме того, если вы хотите удалить индекс при чтении файла, вы можете сделать это с помощью:
df = pd.read_csv('some.csv').drop(['Unnamed 0'],axis=1)
Большое спасибо, я избавился от индекса при преобразовании файла в csv.
Используйте сегменты кода для кода. Обычному глазу действительно сложно читать немоноширинный код.