Невозможно понять поведение Regex в CSharp

Во время работы со строкой я наткнулся на 2 строки, каждая из которых содержит 2 (в номерах) запятых ,.

using System;
using System.Text.RegularExpressions;

public class Program
{
    public static void Main()
    {
        Regex rexCsvSplitter = new Regex(@",(?=(?:[^""]*""[^""]*"")*(?![^""]*""))");
        string str1 = "\"\"|\"FAN100\"|\"\"|\"XXXXX XXXXX,XXX.\"|\"9999 XXXXXX,XXX XXXXX\"|\"\"|\"XXXXXXXXXXX\"|\"ON\"|\"X9X 9X9\"|\"XXX\"|\"99\"|\"XXX\"|\"999 999-9999\"|\"999 999-9999\"|\"XXXX XXXX\"|\"[email protected]\"|\"N\"|\"\"|\"0099\"|\"XXX\"|\"X\"|\"\"|\"\"";
        string str2 = "\"\"|\"FAN100\"|\"\"|\"XXXXX XXXXX,XXX.\"|\"XX XXXX 9999,XXXXXX XXXXXX \"\"X\"\"|\"\"|\"XXXXXX\"|\"ON\"|\"XXX XXX\"|\"XXX\"|\"99\"|\"XXX\"|\"999 999-9999\"|\"999 999-9999\"|\"XXXX XXXX\"|\"[email protected]\"|\"N\"|\"\"|\"0099\"|\"XXX\"|\"X\"|\"\"|\"\"";
        Console.WriteLine("Hello World: {0}, {1}",rexCsvSplitter.Split(str1).Length,rexCsvSplitter.Split(str2).Length);
    }
}

В приведенном выше примере обе строки str1 и str2 состоят из 2 запятых, но с разными индексами. ,(?=(?:[^""]*""[^""]*"")*(?![^""]*"")) разделяет 'str1' с длиной 1 и str2 с длиной 3.

Почему это происходит, кто-нибудь может объяснить?

Скрипка здесь

Заранее спасибо.

Вот почему люди должны использовать настоящие синтаксические анализаторы CSV вместо использования регулярных выражений для того же самого; это становится запутанным и трудным для отладки.

— 30.01.2019 12:40

@ Джерри, я понимаю, просто управляю устаревшим кодом :)

— 30.01.2019 12:44

Используйте парсер CSV, как сказал @Jerry

— 30.01.2019 12:44

regex101.com предоставляет удобный способ визуализации и отладки регулярных выражений.

— 30.01.2019 12:47

str2 имеет столбец с несбалансированными котировками "XX XXXX 9999,XXXXXX XXXXXX ""X"" В конце должна быть еще одна цитата. Регулярное выражение разбивается на запятые с четным количеством кавычек впереди. Из-за этого дисбаланса котировок в str2 разделение будет другим.

— 30.01.2019 12:49

Я также нахожу странным, что этот код разбивается на запятые, хотя похоже, что он должен разбиваться на конвейеры (|)...

— 30.01.2019 12:51

Похоже, вам нужно удалить двойные кавычки, а затем разделить символ пипса: string[] array = str1.Replace("\"","").Split(new char[] { '|' });

— 30.01.2019 13:09

@ Джерри Ваше решение сработало. Спасибо !!

— 31.01.2019 08:20

c# regex

30.01.2019 12:38

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...