Я получил текстовый файл от клиента и хотел бы импортировать его в любую базу данных.
У меня есть Google о типе файла txt dat, но я не нашел ничего связанного
Вот часть файла, который у меня есть, и имя файла похоже на name_TxtDat.txt.
<JUDGES>
01 Paul Bask
02 Lisa Belin
03 Janet Bally
04 Rand Johnsons
05 Maze Hazam
</JUDGES>
<PLACEMENTS>
<702|701
., Kaka with Hac, Sam
Place|Time|Number|Heat|Competition|CompetitionCode|ScoresheetCode
-|10:32PM Sunday;6@11:11PM Sunday|338|Heat 764|AC-A Open|600|NONE
>
<891|685
., Ksusha with Kudashev, Ivan
Place|Time|Number|Heat|Competition|CompetitionCode|ScoresheetCode
-|10:44PM Sunday;6@11:41PM Sunday|186|Pro heat 9|Pro Open|837|NONE
>
</PLACEMENTS>
<COMPETITION>
DANCERCODES:16777293,1215
SHEETCODE:33554438
COMPCODE:1377
ENTRANTTYPE:Couple
AGE:A2
ROUND:Final
<RESULTS>
Heat 3: Final
|No.|10|12|13|14|17||1|Result|
|177 Vorvis/Timar|1|1|1|1|1||5|1|
</RESULTS>
</COMPETITION>
Я думаю, что этот текст внутри <> является именем таблицы, и он использовал '|' чтобы различать столбцы. Но я могу понять, почему для некоторых таблиц есть имя столбца, а для некоторых нет. Кроме того, почему есть вложенная таблица, такая как текст, который я предоставил, внутри . Кто-нибудь знаком с таким файлом? Любая помощь будет оценена.
Да, это не так уж плохо, но это примерно 1% файла, поэтому разбор вручную займет много времени. Вот почему я спрашиваю, знает ли кто-нибудь, как разобрать его с помощью какой-либо библиотеки.

Мне кажется, что это плохо сделанный xml-файл. Я добавил узел верхнего уровня и удалил несколько лишних тегов в разделе мест размещения и смог открыть его как файл xml.
<?xml version = "1.0" encoding = "UTF-8"?>
<test>
<JUDGES>
01 Paul Bask
02 Lisa Belin
03 Janet Bally
04 Rand Johnsons
05 Maze Hazam
</JUDGES>
<PLACEMENTS>
702|701
., Kaka with Hac, Sam
Place|Time|Number|Heat|Competition|CompetitionCode|ScoresheetCode
-|10:32PM Sunday;6@11:11PM Sunday|338|Heat 764|AC-A Open|600|NONE
891|685
., Ksusha with Kudashev, Ivan
Place|Time|Number|Heat|Competition|CompetitionCode|ScoresheetCode
-|10:44PM Sunday;6@11:41PM Sunday|186|Pro heat 9|Pro Open|837|NONE
</PLACEMENTS>
<COMPETITION>
DANCERCODES:16777293,1215
SHEETCODE:33554438
COMPCODE:1377
ENTRANTTYPE:Couple
AGE:A2
ROUND:Final
<RESULTS>
Heat 3: Final
|No.|10|12|13|14|17||1|Result|
|177 Vorvis/Timar|1|1|1|1|1||5|1|
</RESULTS>
</COMPETITION>
</test>
Я бы вернулся к клиенту и посмотрел, смогут ли они очистить его на своей стороне, иначе вам, возможно, придется выполнить некоторую пользовательскую логику для правильной обработки содержимого.
Оказывается, это кастомное ПО, которое экспортирует этот файл... И владелец не хотел бы ничего в этом менять... Наверное, придется самому разбирать. Спасибо!
В чем конкретно проблема? Это псевдо-XML; вы можете попытаться разобрать его таким образом, а затем вручную обработать содержимое или создать простой конечный автомат для захвата содержимого (и по-прежнему выполнять ручную обработку содержимого). Это не кажется таким уж плохим, хотя разделы в стиле
<891|685...просто причудливы — вам понадобятся некоторые пояснения по этому поводу.