Использование pandas read_table без разделителей

прямо сейчас я пытаюсь преобразовать набор данных juliet в фрейм данных pandas. Я преобразовал все файлы .cpp, .c и .h в файлы .txt и теперь пытаюсь перенести эти текстовые файлы в фрейм данных pandas. Для этого я использую функцию read_table в pandas, но хочу, чтобы у каждого файла была своя ячейка. Есть ли способ избавиться от разделителей для этой функции, чтобы каждый текстовый файл получал одну ячейку без разделения.

Вы говорите о это? Пожалуйста, предоставьте явную ссылку в вашем вопросе.

mozway 23.04.2022 07:16
2
1
29
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

IIUC, вы можете использовать что-то вроде:

import glob

data = {}
for filename in glob.glob('*.txt'):
    with open(filename) as fp:
        data[filename] = fp.read()

df = pd.DataFrame.from_dict(data, columns=['content'], orient='index')

Если у вас есть файлы с таким же именем, используйте:

import glob

data = []
for filename in glob.glob('*.txt'):
    with open(filename) as fp:
        data.append(fp.read())

df = pd.DataFrame(data, columns=['content'])

Другие вопросы по теме