Разбор HTML-фрагментов

Как лучше всего анализировать фрагменты HTML на C#?

Что касается контекста, я унаследовал приложение, которое использует большое количество составных элементов управления, и это нормально, но большая часть элементов управления отображается с использованием длинной последовательности буквальных элементов управления, что довольно устрашающе. Я пытаюсь ввести приложение в модульные тесты, и я хочу, чтобы эти элементы управления прошли тесты, которые выяснят, генерируют ли они правильно сформированный HTML, и в решении мечты проверить этот HTML.

Если принятый ответ на самом деле является лучшим ответом, я думаю, что заголовок вопроса следует отредактировать, чтобы отразить, что вы анализируете не HTML, а XML.

— 07.11.2008 21:02

c# asp.net unit-testing web-standards

30.10.2008 17:12

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

1 610

Перейти к ответу Данный вопрос помечен как решенный

Ответы 4

Взгляните на пакет HTMLAgility. Он очень совместим с классом .NET XmlDocument, но гораздо более снисходительно относится к HTML, который не является чистым / действительным XHTML.

Эта библиотека кажется слишком хорошей - я тестирую код, так что хорошо, если теги, оставленные открытыми, взорвут синтаксический анализатор.

— 30.10.2008 18:16

Вы можете исправить код и вывести XHTML, а затем сравнить ввод и вывод.

— 30.10.2008 18:57

30.10.2008 17:14

Я использовал SGMLReader для создания действительного документа Xml из HTML, а затем проанализировал то, что требуется, с помощью XPath или другого формата с помощью XSLT. .

30.10.2008 17:29

Ответ принят как подходящий

Если HTML совместим с XHTML, вы можете использовать встроенное пространство имен System.Xml.

30.10.2008 17:32

Вы также можете изучить HTML Tidy для разбора / очистки HTML. Я не думаю, что у них есть определенные библиотеки .NET, но вы можете запустить двоичный файл через командную строку или IKVM библиотеки java.

30.10.2008 18:06

Другие вопросы по теме

CrmImpersonator и IFD

ASP.NET: предупреждение об изменении окон закрытия данных

Сортировка GridView: SortDirection всегда по возрастанию

Передача Eval из ASPX в функцию Javascript как параметр

Как получить XML ответа веб-службы для проверки в Liquid XML Studio?

Какие аспекты дизайна приложения следует учитывать при разработке многоуровневого веб-приложения с высокой доступностью?

Методы страницы ASP.NET AJAX из UserControl

Реализация редактируемого DropDownList в ASP.NET

System.Security.SecurityException, создаваемый приложением ASP.NET

Как избежать исключения HttpRequestValidationException в ASP.NET MVC, отображающего то же представление, которое вызвало исключение

Разбор HTML-фрагментов

Ответы 4

Другие вопросы по теме

Похожие вопросы