прямо сейчас я пытаюсь преобразовать набор данных juliet в фрейм данных pandas. Я преобразовал все файлы .cpp, .c и .h в файлы .txt и теперь пытаюсь перенести эти текстовые файлы в фрейм данных pandas. Для этого я использую функцию read_table в pandas, но хочу, чтобы у каждого файла была своя ячейка. Есть ли способ избавиться от разделителей для этой функции, чтобы каждый текстовый файл получал одну ячейку без разделения.
IIUC, вы можете использовать что-то вроде:
import glob
data = {}
for filename in glob.glob('*.txt'):
with open(filename) as fp:
data[filename] = fp.read()
df = pd.DataFrame.from_dict(data, columns=['content'], orient='index')
Если у вас есть файлы с таким же именем, используйте:
import glob
data = []
for filename in glob.glob('*.txt'):
with open(filename) as fp:
data.append(fp.read())
df = pd.DataFrame(data, columns=['content'])
Вы говорите о это? Пожалуйста, предоставьте явную ссылку в вашем вопросе.