Как прочитать такой файл txt dat?

Я получил текстовый файл от клиента и хотел бы импортировать его в любую базу данных.

У меня есть Google о типе файла txt dat, но я не нашел ничего связанного

Вот часть файла, который у меня есть, и имя файла похоже на name_TxtDat.txt.

<JUDGES>
01 Paul Bask
02 Lisa Belin
03 Janet Bally
04 Rand Johnsons
05 Maze Hazam
</JUDGES>
<PLACEMENTS>
<702|701
., Kaka with Hac, Sam
Place|Time|Number|Heat|Competition|CompetitionCode|ScoresheetCode
-|10:32PM Sunday;6@11:11PM Sunday|338|Heat 764|AC-A Open|600|NONE
>
<891|685
., Ksusha with Kudashev, Ivan
Place|Time|Number|Heat|Competition|CompetitionCode|ScoresheetCode
-|10:44PM Sunday;6@11:41PM Sunday|186|Pro heat 9|Pro Open|837|NONE
>
</PLACEMENTS>
<COMPETITION>
DANCERCODES:16777293,1215
SHEETCODE:33554438
COMPCODE:1377
ENTRANTTYPE:Couple
AGE:A2
ROUND:Final
<RESULTS>
Heat 3: Final
|No.|10|12|13|14|17||1|Result|
|177 Vorvis/Timar|1|1|1|1|1||5|1|
</RESULTS>
</COMPETITION>

Я думаю, что этот текст внутри <> является именем таблицы, и он использовал '|' чтобы различать столбцы. Но я могу понять, почему для некоторых таблиц есть имя столбца, а для некоторых нет. Кроме того, почему есть вложенная таблица, такая как текст, который я предоставил, внутри . Кто-нибудь знаком с таким файлом? Любая помощь будет оценена.

В чем конкретно проблема? Это псевдо-XML; вы можете попытаться разобрать его таким образом, а затем вручную обработать содержимое или создать простой конечный автомат для захвата содержимого (и по-прежнему выполнять ручную обработку содержимого). Это не кажется таким уж плохим, хотя разделы в стиле <891|685... просто причудливы — вам понадобятся некоторые пояснения по этому поводу.

— 23.06.2019 16:04

Да, это не так уж плохо, но это примерно 1% файла, поэтому разбор вручную займет много времени. Вот почему я спрашиваю, знает ли кто-нибудь, как разобрать его с помощью какой-либо библиотеки.

— 24.06.2019 16:14

database

23.06.2019 15:21

ReactJs | Supabase | Добавление данных в базу данных

Это и есть ваш редактор таблиц в supabase.👇

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Мне кажется, что это плохо сделанный xml-файл. Я добавил узел верхнего уровня и удалил несколько лишних тегов в разделе мест размещения и смог открыть его как файл xml.

<?xml version = "1.0" encoding = "UTF-8"?>
<test>
   <JUDGES>
        01 Paul Bask
        02 Lisa Belin
        03 Janet Bally
        04 Rand Johnsons
        05 Maze Hazam
    </JUDGES>
    <PLACEMENTS>
        702|701
        ., Kaka with Hac, Sam
        Place|Time|Number|Heat|Competition|CompetitionCode|ScoresheetCode
        -|10:32PM Sunday;6@11:11PM Sunday|338|Heat 764|AC-A Open|600|NONE

        891|685
        ., Ksusha with Kudashev, Ivan
        Place|Time|Number|Heat|Competition|CompetitionCode|ScoresheetCode
        -|10:44PM Sunday;6@11:41PM Sunday|186|Pro heat 9|Pro Open|837|NONE
    </PLACEMENTS>
    <COMPETITION>
        DANCERCODES:16777293,1215
        SHEETCODE:33554438
        COMPCODE:1377
        ENTRANTTYPE:Couple
        AGE:A2
        ROUND:Final
        <RESULTS>
            Heat 3: Final
            |No.|10|12|13|14|17||1|Result|
            |177 Vorvis/Timar|1|1|1|1|1||5|1|
        </RESULTS>
    </COMPETITION>
</test>

Я бы вернулся к клиенту и посмотрел, смогут ли они очистить его на своей стороне, иначе вам, возможно, придется выполнить некоторую пользовательскую логику для правильной обработки содержимого.

Оказывается, это кастомное ПО, которое экспортирует этот файл... И владелец не хотел бы ничего в этом менять... Наверное, придется самому разбирать. Спасибо!

— 24.06.2019 16:16

23.06.2019 15:50