Использование pandas read_table без разделителей

прямо сейчас я пытаюсь преобразовать набор данных juliet в фрейм данных pandas. Я преобразовал все файлы .cpp, .c и .h в файлы .txt и теперь пытаюсь перенести эти текстовые файлы в фрейм данных pandas. Для этого я использую функцию read_table в pandas, но хочу, чтобы у каждого файла была своя ячейка. Есть ли способ избавиться от разделителей для этой функции, чтобы каждый текстовый файл получал одну ячейку без разделения.

Вы говорите о это? Пожалуйста, предоставьте явную ссылку в вашем вопросе.

mozway 23.04.2022 07:16
3 метода стилизации элементов HTML
3 метода стилизации элементов HTML
Когда дело доходит до применения какого-либо стиля к нашему HTML, существует три подхода: встроенный, внутренний и внешний. Предпочтительным обычно...
Формы c голосовым вводом в React с помощью Speechly
Формы c голосовым вводом в React с помощью Speechly
Пытались ли вы когда-нибудь заполнить веб-форму в области электронной коммерции, которая требует много кликов и выбора? Вас попросят заполнить дату,...
Стилизация и валидация html-формы без использования JavaScript (только HTML/CSS)
Стилизация и валидация html-формы без использования JavaScript (только HTML/CSS)
Будучи разработчиком веб-приложений, легко впасть в заблуждение, считая, что приложение без JavaScript не имеет права на жизнь. Нам становится удобно...
Flatpickr: простой модуль календаря для вашего приложения на React
Flatpickr: простой модуль календаря для вашего приложения на React
Если вы ищете пакет для быстрой интеграции календаря с выбором даты в ваше приложения, то библиотека Flatpickr отлично справится с этой задачей....
В чем разница между Promise и Observable?
В чем разница между Promise и Observable?
Разберитесь в этом вопросе, и вы значительно повысите уровень своей компетенции.
Что такое cURL в PHP? Встроенные функции и пример GET запроса
Что такое cURL в PHP? Встроенные функции и пример GET запроса
Клиент для URL-адресов, cURL, позволяет взаимодействовать с множеством различных серверов по множеству различных протоколов с синтаксисом URL.
2
1
29
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

IIUC, вы можете использовать что-то вроде:

import glob

data = {}
for filename in glob.glob('*.txt'):
    with open(filename) as fp:
        data[filename] = fp.read()

df = pd.DataFrame.from_dict(data, columns=['content'], orient='index')

Если у вас есть файлы с таким же именем, используйте:

import glob

data = []
for filename in glob.glob('*.txt'):
    with open(filename) as fp:
        data.append(fp.read())

df = pd.DataFrame(data, columns=['content'])

Другие вопросы по теме