Как получить общий тег элемента?

У меня определена строка списка с некоторыми тегами, я хочу подсчитать, сколько всего элементов в каждом теге.

<L1 //2 element
 <L1 //1 element
  <H1 content> 
 > 
 <L1 //3 element
  <H2 content> 
  <P content>
  <L1 //1 element
   <H3 content>
  >
 >
>

Это мой обрезанный код С#

var str = "<L1\r\n <L1\r\n  <H1 content> \r\n > \r\n <L1\r\n  <H2 content> \r\n  <P content>\r\n  <L1\r\n   <H3 content>\r\n  >\r\n >\r\n>";
var list = str.Split(new string[] { "\r\n" }, StringSplitOptions.None);
var array_num = new List<string>();
int startpos = 0, endpos = 0, total = 0, newstartpos = 0;
bool newtag = false;
for (int i = 0; i < list.Length; i++)
{
    if (list[i].Trim() == "<L1")
    {
        startpos = i;
        for (int Lindex = i + 1; Lindex < list.Length ; Lindex++)
        {
            var item = list[Lindex].Trim().ToString();
            if (list[Lindex].Trim().StartsWith("<L1") && list[Lindex].Trim().EndsWith(">"))
            {
                total += 1;
            }
            if (list[Lindex].Trim() == "<L1")
            {
                total += 2;
                newstartpos = Lindex;
                newtag = true;
            }
            if (list[Lindex].Trim() == ">" && newstartpos != 0)
            {
                total -= 1;
                endpos = Lindex;
                newtag = false;
            }
            if (list[Lindex].Trim().StartsWith("<") && list[Lindex].Trim().EndsWith(">") && !newtag)
            {
                total += 1;
            }
            if (list[Lindex].Trim() == ">" && newstartpos == 0)
            {
                endpos = Lindex;
                break;
            }
        }
        array_num.Add("start: " + startpos + " end: " + endpos + " count: " + total);
        startpos = 0;
        endpos = 0;
        total = 0;
        newstartpos = 0;
        newtag = false;
    }
}

Но когда я запускаю его и получаю не ожидаемый результат, результат array_num получается контентным. Результат правильный должен быть

start:0 end: 11 count: 2 //correct
start:1 end: 3 count: 1 //correct
start:4 end: 11 count: 1 //incorrect should be 4 10 3
start:7 end: 9 count: 1 //correct

Но я не уверен, что мой код работает стабильно с другим примером. Если у вас есть идеи для этого или что-то изменить, пожалуйста, дайте мне знать, если что-то изменилось.

Было бы лучше, если бы вы могли разобрать его на XElement или XmlNode, но строка в вашем примере не будет принята как допустимый XML.

— 06.07.2023 10:27

@Peter, я пытаюсь найти больше в коде выше.

— 06.07.2023 11:58

я обновил свой код, но, похоже, он не работает

— 07.07.2023 09:14

c# .net c#-4.0 tags element

06.07.2023 09:28

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Лучше всего использовать структуру стека, поскольку она отражает структуру анализируемого контента.

Вот одно из решений. Используйте стек и класс TagCounter. Класс TagCounter отслеживает количество дочерних элементов тега, независимо от того, является ли он тегом L1, и его индекс в строке, чтобы их можно было расположить в правильном порядке в конце:

internal class TagCounter
{
    public TagCounter(bool isL1Tag, int index) 
    {
        ChildCount = 0;
        IsL1Tag = isL1Tag;
        Index = index;
    }

    public int ChildCount { get; set; }
    public bool IsL1Tag { get; private set; }
    public int Index { get; set; }
}

фрагмент для его вычисления:

var str = "<L1\r\n <L1\r\n  <H1 content> \r\n > \r\n <L1\r\n  <H2 content> \r\n  <P content>\r\n  <L1\r\n   <H3 content>\r\n  >\r\n >\r\n>";

var openTags = new Stack<TagCounter>();   
var parsedLTags = new List<TagCounter>();

var shortenedString = str.Replace("\r\n", "");
TagCounter? currentTag = null;

var stringLength = shortenedString.Length;

for (var i = 0;i < stringLength; i++)
{
    var nextChar = shortenedString[i];
    if (nextChar == '<')
    {
        if (currentTag != null)
        {
            currentTag.ChildCount++;
        }
       
        var isL1Tag = shortenedString.Substring(i + 1, 2).Equals("L1");
        
        if (currentTag != null)
        {
            openTags.Push(currentTag);
        }
        currentTag = new TagCounter(isL1Tag, i);
    }
    else if (nextChar == '>')
    {
       
        if (currentTag.IsL1Tag)
        {
            parsedLTags.Add(currentTag);
        }

        if (openTags.Any())
        {
            currentTag = openTags.Pop();
        }
        else
        {
            currentTag = null;
        }

    }
}

var result = parsedLTags.OrderBy(x=>x.Index).Select(x=>x.ChildCount).ToList();

07.07.2023 14:58

Другие вопросы по теме

Как получить массив/список из appsettings

При попытке выполнить итерацию по целочисленному массиву с помощью foreach можно определить тип элемента как char

Как проверить, содержат ли элементы массива определенную цифру?

Предотвращение перехвата DLL основных библиотек .NET Framework

С# Linq - Как объединить два списка

Шифрование потока с помощью ChaCha20Poly1305

Библиотека классов Blazor, компоненты только для внутреннего использования

JsonSerializer.Deserialize возвращает пустой объект с нулевыми свойствами

C#. Могут ли обработчики событий выполняться параллельно? И по таймеру?

Ошибка компиляции .NET?

Как получить общий тег элемента?

Ответы 1

Другие вопросы по теме

Похожие вопросы